Circa un terzo dei siti web oggi presenti in rete sarebbe stato generato con l’aiuto dell’intelligenza artificiale. A rivelarlo è uno studio condotto analizzando milioni di pagine indicizzate nell’Internet Archive, il più grande archivio digitale del web. E il dato più impressionante è forse la velocità con cui tutto questo è successo: sono bastati appena tre anni perché il panorama dei contenuti online cambiasse in modo radicale.
Come l’IA ha trasformato il web in tempi record
La ricerca ha preso in esame una mole enorme di pagine web, confrontando i contenuti pubblicati prima e dopo l’esplosione degli strumenti di generazione testuale basati sull’intelligenza artificiale. Il risultato è abbastanza netto: la quantità di testi prodotti da sistemi automatici è cresciuta in modo esponenziale, fino a rappresentare una fetta che si avvicina al 33% dell’intero ecosistema web analizzato. Non parliamo di nicchie oscure o siti marginali. Il fenomeno riguarda trasversalmente blog, portali informativi, pagine aziendali e piattaforme di contenuti.
Quello che emerge dallo studio non è solo un dato quantitativo. I ricercatori hanno osservato cambiamenti significativi anche nel linguaggio utilizzato online. I testi generati dall’IA tendono ad adottare strutture più uniformi, con una varietà lessicale ridotta rispetto ai contenuti scritti interamente da esseri umani. Questo significa che, scorrendo decine di siti diversi, capita sempre più spesso di imbattersi in frasi che suonano familiari, quasi intercambiabili. Una sorta di appiattimento stilistico che, pagina dopo pagina, rende il web un posto un po’ meno vario di quanto fosse anche solo qualche anno fa.
Meno varietà, più contenuti: il paradosso della rete
Ed ecco il paradosso. Da un lato, la produzione di contenuti è aumentata a ritmi mai visti prima. Pubblicare è diventato più semplice, più rapido e molto più economico grazie agli strumenti di IA generativa. Dall’altro, questa abbondanza non si traduce necessariamente in ricchezza informativa. Anzi. Lo studio evidenzia come la struttura stessa delle pagine web stia convergendo verso modelli ripetitivi, con schemi narrativi e formule ricorrenti che tradiscono l’origine automatizzata dei testi.
I dati raccolti attraverso l’Internet Archive offrono una fotografia attendibile proprio perché si basano su istantanee storiche del web, permettendo confronti temporali precisi. Non si tratta di stime approssimative ma di un’analisi su milioni di pagine reali, tracciate nel tempo. Il cambiamento nel linguaggio, nella struttura e nella diversità dei contenuti online è documentato nero su bianco, ed è già ampiamente in corso.
