Ferramenta de memória digital sofre revés. Pelo menos 23 grandes sites jornalísticos passaram a impedir o rastreamento do ia_archiverbot, robô responsável por arquivar páginas na Wayback Machine, do Internet Archive. O bloqueio vem ganhando corpo desde o início do ano e, na prática, dificulta o acesso a versões antigas de reportagens, documentos e declarações públicas.
Quem já bloqueia
A Originality AI identificou, entre os novos restritores, o conglomerado USA Today Co. (que controla mais de 200 publicações), além de nomes como The New York Times, Bloomberg, Reuters e portais regionais norte-americanos. O Guardian adotou solução intermediária: libera o rastreamento automático, mas barra o acesso público às páginas guardadas.
Por que agora?
O avanço da inteligência artificial acendeu o alerta nas salas de redação. Editores temem que o acervo histórico, protegido por direitos autorais, esteja sendo usado para treinar modelos de linguagem que competem diretamente com o próprio jornalismo. O NYT defende acordos comerciais antes que qualquer empresa de tecnologia utilize o material.
Impacto no Brasil
Gigantes nacionais como Grupo Globo, Folha de S.Paulo, Estado de S. Paulo e veículos regionais mantêm o acesso liberado ao Internet Archive — apesar de já bloquearem “robôs” de IA em seus respectivos robots.txt. Até o momento, não há sinal de adesão formal ao boicote.
Transparência sob pressão
Pesquisadores, jornalistas e checadores de fatos lembram que o acesso a versões anteriores de páginas é essencial para:
- verificar alterações não sinalizadas em matérias já publicadas;
- investigar declarações removidas de políticos e empresas;
- preservar a história digital de sites que saem do ar.
Em 2016, por exemplo, a Wayback Machine revelou que o New York Times editou silenciosamente um artigo sobre Bernie Sanders — fato que só veio à tona graças ao arquivo.
“Danos históricos à vista”
Mark Graham, diretor da Wayback Machine, afirmou que impedir o espelhamento de páginas compromete a memória coletiva da internet. Mais de 100 jornalistas assinaram carta aberta pedindo que os veículos revejam a decisão.
O que esperar a seguir
No curto prazo, o conflito deve se intensificar. Veículos querem remuneração; plataformas e pesquisadores defendem o uso legítimo para fins de preservação. A solução tende a passar por acordos de licenciamento, legislações de direitos autorais e, possivelmente, novas ferramentas de proteção seletiva de conteúdo.
Conclusão
Sem consenso, a internet corre o risco de perder parte da sua memória. Para leitores, acadêmicos e investidores, vale acompanhar o desenrolar das negociações, pois o resultado pode redefinir o ecossistema de distribuição de notícias — e, de quebra, mexer com o valor de mercado de grandes grupos de mídia.
Imagem: Jas Scott
Perguntas frequentes (FAQ)
1. A Wayback Machine é ilegal?
Não. O Internet Archive opera dentro do conceito de “uso justo” (fair use) nos EUA, mas a disputa sobre treinamento de IA está reabrindo o debate.
2. Posso continuar acessando versões antigas de sites brasileiros?
Sim. Até o momento, os principais portais nacionais não bloquearam o robô do Internet Archive.
3. Existem alternativas?
Projetos como Archive.today e capturas locais de página podem funcionar como complemento, mas nenhum tem o mesmo alcance da Wayback Machine.
4. Como saber se um site bloqueia o arquivamento?
Verifique o arquivo robots.txt do domínio e procure por regras que impeçam o acesso do ia_archiver.
Tabela: desempenho recente de ações ligadas ao debate
| Empresa / Ticker | Último preço* (US$) | Variação em 2024 | Observação |
|---|---|---|---|
| New York Times (NYT) | ≈ 48,00 | +18% | Receita digital em alta |
| Gannett / USA Today (GCI) | ≈ 3,30 | +35% | Reestruturação e cortes de custos |
| News Corp (NWSA) | ≈ 25,50 | +5% | Posição neutra sobre bloqueio |
| Reddit (RDDT) | ≈ 55,00 | — | IPO recente; bloqueio já implementado |
*Cotações aproximadas, coletadas em 10/06/2024. Não constituem recomendação de investimento.
Quer continuar por dentro das discussões que moldam o futuro da web? Acesse o nosso Portal de Tecnologia D&Blog e receba análises exclusivas direto no seu e-mail.


