L’intelligenza artificiale ha appena vinto un premio letterario, e la cosa ha lasciato il segno. Lo scorso 18 maggio diversi utenti di X hanno cominciato a sollevare dubbi sull’ultimo vincitore del premio Commonwealth per i racconti brevi: il testo premiato nella categoria Caraibi, pubblicato su Granta (rivista britannica che da decenni detta il canone letterario di lingua inglese), sapeva tanto di ChatGPT. Persino la foto dell’autore sembrava poco autentica. E quando la rivista ha provato a rispondere alle accuse, ha finito per ingarbugliare ancora di più la faccenda: ha chiesto a Claude se il testo fosse stato scritto da una macchina, e Claude ha detto di no.
Intelligenza artificiale: come si riconosce la mano di una macchina
Individuare la prosa di un modello linguistico non è semplice come sembra, ma nemmeno impossibile una volta che l’occhio si è allenato. Questi sistemi non cercano la parola giusta: generano il token statisticamente più probabile in base al contesto, e questo processo lascia delle tracce. C’è la celebre struttura “non è X, è Y”, diventata una specie di Stele di Rosetta per smascherare i testi generati dall’IA. Ma ce ne sono altre: accumulo di metafore senza referenti chiari, verbi tipo “approfondire”. Gli annotatori che mettono a punto i modelli con il cosiddetto RLHF, cioè l’apprendimento per rinforzo con feedback umano, premiano quella chiarezza burocratica che alla fine rende tutto più riconoscibile.
Nel racconto di Granta si leggono cose come “il mezzogiorno che ronza” oppure “l’aria dolce con odore di canna e di oblio”. Diversi autori hanno fatto notare una particolare attrazione per i suoni ambientali e per gli stati emotivi vaghi, nostalgia, tristezza, dimenticanza, come se il testo volesse sfiorare una materialità che la macchina non possiede e di sicuro non comprende. L’accumulo di stimoli sensoriali è una regola da manuale di scrittura creativa che i modelli applicano in modo meccanico, senza discernimento. Una volta imparato a notarlo, salta agli occhi.
Perché i rilevatori non funzionano (ancora)
Il punto è che riconoscere quella scrittura a intuito è una cosa, dimostrarlo in modo oggettivo un’altra. La prima generazione di rilevatori automatici come GPTZero, Originality.ai e Turnitin AI ha collezionato una lunga serie di errori. OpenAI, per fare un esempio, ha ritirato il suo AI Text Classifier nel luglio del 2023, dopo aver ammesso che individuava correttamente solo il 26 per cento dei testi prodotti da una macchina e bollava come artificiale quasi il 9 per cento dei testi umani.
L’unica eccezione documentata finora è Pangram. La sua tecnica, chiamata mirror data, addestra il classificatore con coppie di testi stilisticamente identici ma di origine diversa. Secondo il primo benchmark indipendente del settembre 2025, i falsi positivi sono vicini allo zero e i falsi negativi oscillano tra il 2 e il 4 per cento nei passaggi medi e lunghi, mentre i concorrenti viaggiano tra il 10 e il 40 per cento. Resta però difficile fidarsi di uno strumento che vende un “umanizzatore” insieme ai propri report.
Nelle università americane la guerra è permanente. I professori passano i compiti ai detector, i detector generano falsi positivi su studenti che non hanno mai toccato un chatbot, e quegli studenti finiscono per ricorrere agli umanizzatori o, più semplicemente, a scrivere peggio per evitare le accuse. Joseph Thibault, fondatore di Cursive, ne ha rintracciati 43, con un pubblico complessivo di 33,9 milioni di visite. Grammarly ha sviluppato Authorship. Uno strumento che registra la sessione di scrittura per dimostrare che il lavoro è stato fatto davvero a mano, cinque milioni di report nell’ultimo anno. Una professoressa lo riassume così: “Quanto meglio scrivi, tanto più l’IA crede che tu sia un’IA. Metto i miei articoli nei detector solo per capire come funzionano, e mi segnala sempre al 98 per cento, senza che io abbia mai usato l’IA.”
Quando la macchina imita uno scrittore in carne e ossa
Il caso di Granta arriva mentre il mercato editoriale registra un altro sintomo dello stesso problema. Il libro di saggistica più venduto di aprile negli Stati Uniti, London Falling di Patrick Radden Keefe, ha piazzato 13.468 copie nella prima settimana; il primo romanzo in classifica ha sfiorato le 105.000. Il presidente di Harper Group lo attribuisce ai podcast: secondo un sondaggio recente, il 62 per cento degli uomini e il 54 per cento delle donne ne ha ascoltato uno il mese scorso, contro il 46 e il 39 per cento del 2023. Promettono di saziare in quaranta minuti ciò che un libro impiega tre settimane a soddisfare.
L’IA è lo scalino successivo: non compete con libri o podcast, li sostituisce con un riassunto generato in dieci secondi, che risponde alle domande senza che nessuno abbia dovuto scrivere, editare o leggere alcunché. Il problema è che quel modello punta alle risposte immediate ed elimina proprio ciò che rende prezioso un saggio: l’attenzione, la permanenza nel tempo, le sfumature riflessive.
La scrittrice Vauhini Vara si è spinta oltre. Ha incaricato il ricercatore Tuhin Chakrabarty di addestrare un modello sui suoi tre libri pubblicati e su vari articoli, così da generare passaggi della sua ipotetica prossima opera. Poi li ha mescolati con brani scritti di suo pugno e li ha inviati agli amici più stretti. Nessuno ha saputo distinguerli. Anzi: i lettori tendono a preferire il testo della macchina rispetto alle imitazioni umane quando non ne conoscono l’origine. Ma appena viene svelata la fonte, quel testo smette di interessare. Quello che conta per chi legge non è se il testo suoni umano, ma sapere che dall’altra parte c’è davvero qualcuno.