Arquivamento da web em risco após bloqueios de grandes veículos de imprensa

4 Min Leitura

O Internet Archive, mantenedor da Wayback Machine há 30 anos, enfrenta uma crise provocada pelo bloqueio de acesso por parte de vários veículos de imprensa. A plataforma, que afirma armazenar mais de um bilhão de sites e é usada por jornalistas, pesquisadores, historiadores e juristas para recuperar páginas alteradas ou removidas, vê sua função de preservação da memória da internet ameaçada.

Pesquisa da Nieman Foundation for Journalism, da Universidade de Harvard, aponta que pelo menos 241 portais de notícias em nove países já impediram o arquivamento de seus conteúdos pela Wayback Machine. Entre os veículos citados estão The Guardian (Reino Unido), The New York Times (EUA), Le Monde (França) e USA Today (EUA).

O bloqueio ocorre em um contexto em que redações temem o uso de conteúdos arquivados por empresas de inteligência artificial para treinar modelos de linguagem sem autorização e sem pagamento. Um porta-voz do New York Times, Graham James, declarou que “os conteúdos do New York Times no Internet Archive são utilizados pelas empresas de IA, que infringem direitos autorais para concorrer diretamente conosco”.

Dados do próprio archive.org indicam que robôs têm consultado em grande volume matérias jornalísticas armazenadas na plataforma. Mark Graham afirmou à revista Wired que algumas empresas chegaram a realizar dezenas de milhares de solicitações por segundo, sobrecarregando servidores e gerando demandas que a organização não havia previsto.

A organização sem fins lucrativos define seu papel como semelhante ao de uma biblioteca clássica, oferecendo acesso público e gratuito a pesquisadores, historiadores e ao público em geral. A ação de bloquear rastreadores em resposta ao uso por IA levou à decisão de editores e empresas de mídia de impedir o arquivamento de suas páginas.

A Electronic Frontier Foundation (EFF) comparou a atitude das empresas de imprensa ao ato de proibir que bibliotecas mantenham cópias de seus periódicos. Em defesa do Internet Archive, mais de 100 jornalistas assinaram uma petição afirmando que a Wayback Machine é essencial para recuperar artigos desaparecidos por perda de links, fusões ou cortes de custo, e que sem esse trabalho uma parte significativa da história jornalística recente estaria em risco de sumir.

Especialistas apontam consequências práticas caso o Archive deixe de cumprir seu papel. Martin Fehrensen, repórter especializado em mídia, disse à DW que milhões de referências na Wikipedia, pesquisas sobre políticas de plataformas e evidências digitais com valor probatório seriam afetadas. Fehrensen defende diálogo entre editores e uma separação técnica entre arquivamento e uso para treinamento de IA, além da criação de um status jurídico específico e, a longo prazo, do reconhecimento do arquivamento da web como infraestrutura pública.

O Internet Archive já enfrentou outros problemas recentes: em setembro de 2024, um ataque hacker resultou no roubo de 31 milhões de contas de usuário; no mesmo ano, perdeu um processo de direitos autorais em tribunal de apelação dos EUA contra as editoras Hachette, Penguin Random House, HarperCollins e Wiley, que levou à retirada de mais de 500 mil livros da plataforma. A organização ainda responde a pedidos de indenização que somam milhões.

Fontes citadas no relato afirmam que as decisões corporativas de bloquear o acesso ao arquivo podem comprometer estruturalmente a função do Wayback Machine de documentar a internet pública.

Compartilhe essa Notícia