Internet Archive sta attraversando un momento davvero critico. Archivisti digitali, accademici e tutti quelli che da anni si occupano di preservare la memoria del web si ritrovano a fare i conti con un problema che, neanche a dirlo, ha a che fare con l’intelligenza artificiale. L’impennata dei costi di dischi rigidi, SSD e dispositivi di archiviazione, unita alla difficoltà crescente nel reperirli sul mercato, sta trasformando la conservazione di dati e pagine web in un’impresa sempre più costosa e complicata.
Secondo i dati raccolti da un sito che monitora e compara i prezzi dei componenti tech, da ottobre 2025 i costi delle unità di archiviazione sono raddoppiati, con aumenti che in alcuni casi hanno toccato il 150%. Molti dei dischi rigidi più ricercati dalle organizzazioni di alto profilo, come appunto Internet Archive, non si trovano proprio più. Una carenza che ha alimentato un mercato secondario su eBay e piattaforme simili, dove appassionati di tecnologia stanno rivendendo dispositivi di archiviazione a prezzi tutto sommato più accessibili rispetto ai canali ufficiali.
Addio scorte: la situazione tra Internet Archive, Wikimedia e i grandi produttori
Brewster Kahle, fondatore di Internet Archive e della celebre Wayback Machine, ha spiegato che i dischi da 28 e 30 TB, quelli che preferiscono utilizzare, non sono disponibili oppure hanno raggiunto prezzi altissimi. I numeri danno la misura della sfida: ogni giorno vengono raccolti oltre 100 terabyte di nuovi materiali, e l’archivio complessivo supera già i 210 petabyte, ospitati su macchine che richiedono aggiornamenti e manutenzione costanti. Serve un flusso continuo di nuovi dischi rigidi, e in questo momento quel flusso si è praticamente interrotto.
La stessa situazione riguarda la Wikimedia Foundation, che gestisce tra le altre cose Wikimedia Commons, il noto archivio di contenuti multimediali liberi da diritti d’autore. Un portavoce della fondazione ha sottolineato come l’aumento dei prezzi delle unità di archiviazione stia creando problemi concreti nella gestione del budget. Essendo un’organizzazione senza scopo di lucro, ogni spesa viene valutata con estrema attenzione. La strategia adottata per ora consiste nel gestire in modo più intelligente le priorità di investimento nell’hardware, prolungando dove possibile la vita dei dispositivi già in uso e cercando soluzioni alternative.
A confermare la gravità del quadro ci pensano i produttori stessi. Western Digital, tra i più importanti al mondo nel settore dei dischi rigidi, ha comunicato di aver già esaurito nei primi mesi del 2026 tutte le scorte destinate ai clienti aziendali per l’intero anno. Anche Micron, nota per la produzione di RAM e SSD con il marchio Crucial, alla fine del 2025 ha annunciato l’uscita dal mercato consumer, motivando la decisione con la crescita esplosiva della domanda proveniente dai data center legata proprio all’intelligenza artificiale.
L’AI e il rischio di perdere la memoria storica del web
L’ascesa dell’intelligenza artificiale sta avendo un impatto pesante sulle pratiche di archiviazione delle pagine internet, e non soltanto per la ridotta disponibilità di SSD e dischi rigidi. Chi lavora alla conservazione dei contenuti online si trova sempre più spesso costretto a scegliere cosa salvare e cosa abbandonare. Ma c’è un altro aspetto della questione, ed è legato direttamente all’addestramento dei modelli di AI. Le attività di data scraping condotte dalle aziende del settore per alimentare i grandi modelli linguistici hanno spinto molti proprietari di siti web a bloccare i bot che raccolgono dati. Il problema è che tra i bot bloccati finiscono anche quelli di Internet Archive e di progetti analoghi, pensati per tutt’altro scopo.
L’Electronic Frontier Foundation, organizzazione no profit che si occupa di tutela dei diritti digitali, ha avvertito che questa dinamica rischia di cancellare la memoria storica del web, anziché limitare effettivamente lo scraping di dati da parte delle società di intelligenza artificiale.