Uno degli strumenti più preziosi per conservare la memoria storica del web sta attraversando un momento particolarmente complicato. La Wayback Machine, il celebre servizio di Internet Archive che da anni si occupa di archiviare e rendere accessibili le pagine pubblicate online, si ritrova ancora una volta al centro di uno scontro con il mondo dell’editoria. E questa volta la questione sembra essere piuttosto seria.
Il meccanismo è semplice da capire: Wayback Machine funziona grazie a dei web crawler, cioè dei sistemi automatizzati che scansionano la rete, catturano istantanee delle pagine web e le conservano nel tempo. Un archivio digitale enorme, consultabile da chiunque, che permette di risalire a contenuti anche molto vecchi. Il problema nasce quando i siti decidono di impedire a questi crawler di fare il loro lavoro, bloccandone l’accesso.
Ed è esattamente quello che sta succedendo. Secondo quanto denunciato dalla stessa organizzazione, diverse testate editoriali hanno iniziato a sbarrare la strada ai crawler di Internet Archive, rendendo impossibile per Wayback Machine raccogliere le istantanee dei loro siti. Un comportamento che, stando a quanto emerge, coinvolge almeno 23 portali appartenenti a grosse realtà editoriali.
Il paradosso di chi blocca ma poi usa lo strumento
La parte più curiosa di tutta questa vicenda riguarda un dettaglio che non passa inosservato. Molte delle testate che hanno deciso di bloccare i web crawler di Wayback Machine sono le stesse che in passato hanno utilizzato proprio questo strumento per realizzare i propri contenuti giornalistici. Una contraddizione che Internet Archive non ha mancato di far notare.
Il caso più emblematico è quello di USA Today. La testata americana aveva fatto ricorso proprio a Wayback Machine per ricostruire alcuni approfondimenti giornalistici legati all’azione dell’ICE. Eppure, nonostante quel precedente, USA Today ha poi deciso di bloccare l’accesso ai web crawler sul proprio portale, impedendo di fatto al sistema di archiviazione di funzionare correttamente sul suo sito.
È un cortocircuito abbastanza evidente: da una parte si sfrutta l’archivio quando fa comodo, dall’altra si chiude la porta quando si tratta di contribuire a quello stesso archivio. Internet Archive, che opera come organizzazione senza scopo di lucro, si trova così in una posizione sempre più difficile, stretta tra la volontà di preservare la rete e le resistenze di chi su quella rete pubblica contenuti.
Una questione che riguarda tutti
Il punto centrale resta sempre lo stesso: Wayback Machine analizza e salva gran parte dei contenuti presenti online, e questo modo di operare finisce inevitabilmente per scontrarsi con gli interessi di chi quei contenuti li produce. Le contestazioni non sono una novità, ma il numero crescente di testate che decidono di bloccare i crawler di Internet Archive rappresenta un segnale preoccupante per il futuro dello strumento.
Il rischio concreto è che ampie porzioni del web restino prive di qualsiasi forma di archiviazione storica, con la conseguenza che articoli, inchieste e contenuti giornalistici potrebbero semplicemente sparire una volta rimossi dai siti originali. E senza Wayback Machine a conservarne una copia, non resterebbe più nessuna traccia consultabile di quei materiali. A oggi sono 23 i siti di grosse testate coinvolti nel blocco, un numero che potrebbe anche crescere nei prossimi mesi.