L’intelligenza artificiale torna sotto l’attenzione di editori e autori dopo la diffusione di uno studio accademico che pone domande pesanti sul modo in cui vengono addestrati i grandi modelli linguistici. Alcuni ricercatori hanno dimostrato che determinati sistemi di AI sarebbero capaci di rigenerare ampie porzioni di romanzi celebri. Essi, in certi casi, arrivano persino a ricostruire passaggi quasi parola per parola.
Le analisi, condotte in ambito universitario, avrebbero coinvolto modelli di ultima generazione messi alla prova con opere narrative di grande diffusione. I risultati mostrano che non si tratta di semplici rielaborazioni stilistiche, ma di ricostruzioni molto fedeli, ottenute attraverso prompt mirati e tecniche capaci di aggirare alcuni limiti imposti dai sistemi di sicurezza. In alcuni casi, la percentuale di corrispondenza con il testo originale sarebbe risultata sorprendentemente elevata.
Il punto critico riguarda la natura stessa dell’apprendimento dell’AI. Le aziende sostengono da tempo che i modelli non archivino copie dei testi, ma assimilino strutture linguistiche e relazioni statistiche tra parole. Eppure, la capacità di generare sequenze e coerenti tratte da opere specifiche alimenta il sospetto che il confine tra “apprendimento” e “memorizzazione” sia meno netto di quanto dichiarato.
AI e copyright, la sfida aperta tra innovazione tecnologica e tutela delle opere
Il nodo centrale resta quello del copyright. Negli Stati Uniti alcune sentenze hanno riconosciuto che l’uso di contenuti protetti per l’addestramento possa rientrare nel fair use, purché l’impiego sia considerato trasformativo. Allo stesso tempo, però, il possesso e l’utilizzo di materiale ottenuto illegalmente è stato giudicato una violazione, con conseguenze economiche rilevanti per le aziende coinvolte.
In Europa il quadro non è più semplice. In Germania, ad esempio, una decisione giudiziaria ha ritenuto che la memorizzazione di testi musicali da parte di un modello configurasse una violazione del diritto d’autore. Questo precedente rafforza l’idea che la questione non sia solo teorica ma abbia già implicazioni concrete.
Intanto cresce la pressione su colossi tecnologici impegnati nello sviluppo dell’AI, chiamati a dimostrare maggiore trasparenza sui dataset utilizzati. Molti osservatori si chiedono se sia davvero indispensabile ricorrere a opere protette per costruire sistemi più performanti oppure se esistano alternative sostenibili. Insomma, il confronto tra innovazione tecnologica e tutela della proprietà intellettuale è destinato a intensificarsi. Intanto l’AI continua a espandere il proprio raggio d’azione in ambiti sempre più sensibili.
