Due grandi testate internazionali hanno deciso di impedire alla Wayback Machine di salvare le proprie pagine, aprendo un nuovo fronte nel rapporto tra editori e archivi online. Il New York Times e il Guardian hanno infatti bloccato l’accesso ai loro siti da parte di Internet Archive. Parliamo dell’organizzazione no-profit che da anni raccoglie e conserva copie di contenuti digitali per costruire una gigantesca biblioteca della rete. La conseguenza è immediata. Le loro pagine non potranno più essere archiviate né consultate nel tempo attraverso lo storico strumento che consente di rivedere versioni passate dei siti.
Tale decisione nasce da un timore sempre più diffuso nel settore editoriale. I contenuti salvati negli archivi pubblici, infatti, possono diventare materia prima per l’addestramento dei modelli di intelligenza artificiale. Proprio questo utilizzo non autorizzato dei materiali è alla base della scelta dei due quotidiani. Essi intendono così evitare che articoli e reportage finiscano nei dataset usati per costruire sistemi automatici di scrittura o analisi. La stessa logica ha spinto altre piattaforme, come Reddit, a limitare l’accesso ai propri archivi, preferendo accordi diretti e remunerati con le aziende tecnologiche.
Internet, il rischio di una memoria collettiva sempre più frammentata
La posizione di Internet Archive è diametralmente opposta. Il fondatore Brewster Kahle ha sottolineato come la chiusura degli editori possa ridurre l’accesso ai documenti storici e compromettere la funzione pubblica degli archivi digitali. L’organizzazione è nata con l’obiettivo di preservare la cultura della rete. Non a caso ha salvato negli anni oltre mille miliardi di pagine, diventando un riferimento per ricercatori, giornalisti e semplici utenti.
La tensione tra tutela dei contenuti e accesso pubblico non è nuova, ma l’arrivo dell’intelligenza artificiale l’ha resa più evidente. Già nel 2023 l’archivio aveva subito un blocco temporaneo dei servizi a causa del traffico generato da un’azienda di AI impegnata nell’estrazione massiccia di testi. Episodi simili dimostrano quanto gli archivi digitali siano diventati una risorsa strategica non solo per la memoria collettiva, ma anche per l’industria tecnologica.
Il rischio, secondo molti osservatori, è quello di un Internet sempre più frammentato. Un luogo virtuale dove l’accesso al passato digitale dipenderà da accordi commerciali o decisioni editoriali. Un cambiamento che potrebbe trasformare la rete da archivio aperto a territorio controllato, dove la storia online diventa un bene negoziabile.
