Quasi 400 giornali hanno deciso di muoversi insieme contro OpenAI e Microsoft, accusando le due aziende di aver fatto incetta dei loro contenuti, compresi gli articoli a pagamento, per costruire ChatGPT e Copilot senza versare un centesimo. La denuncia parla chiaro di scraping AI su vasta scala e rappresenta una delle coalizioni di editori più grandi mai viste contro l’uso gratuito del lavoro giornalistico da parte dell’intelligenza artificiale. Il punto della questione è semplice e brutale al tempo stesso, i prodotti basati sull’AI hanno generato miliardi di dollari di valore sfruttando il materiale prodotto dalle redazioni, ma di quei guadagni agli editori non è arrivato nulla.
Cosa dice davvero la denuncia
Il documento è stato depositato presso il Tribunale distrettuale degli Stati Uniti per il Distretto meridionale di New York. L’accusa è netta, OpenAI e Microsoft avrebbero setacciato in modo sistematico e silenzioso i siti degli editori, andando a prendere anche i contenuti chiusi dietro paywall e altre barriere di accesso, per poi copiare articoli, reportage e opere originali sui propri server senza alcuna autorizzazione.
Gli editori chiedono i danni e un’ingiunzione, contestando una presunta violazione del copyright e del Digital Millennium Copyright Act, il famoso DMCA. A rappresentare la coalizione c’è l’ex procuratore generale del New Jersey Matthew Platkin con il suo studio legale, un nome che pesa e che dice molto sulla serietà dell’operazione.
La risposta di OpenAI non sorprende quasi nessuno. Il portavoce Drew Pusateri ha spiegato che i modelli dell’azienda promuovono l’innovazione, sono addestrati su dati pubblicamente disponibili e si appoggiano al concetto di fair use. È la stessa linea difensiva tirata fuori da ogni azienda AI finita in tribunale per lo stesso motivo. I dati erano pubblici, quindi l’uso sarebbe legittimo. Peccato che pubblicamente disponibile e protetto dietro paywall siano due cose che non possono stare insieme, e la denuncia insiste proprio su questo, anche il materiale chiuso sarebbe stato copiato.
Il prezzo lo paga il giornalismo locale
C’è un passaggio della denuncia che colpisce più di altri. Gli editori descrivono il boom dell’AI come una campana a morto per il giornalismo locale, se le aziende che raccolgono contenuti senza pagare non verranno chiamate a risponderne. I giornali di provincia, già in difficoltà sui ricavi da anni, si ritrovano i propri articoli usati per addestrare chatbot che poi rispondono alle stesse domande che i lettori avrebbero portato proprio a quei giornali.
Il meccanismo è un circolo vizioso bello e buono. Il giornale scrive il pezzo, l’AI lo divora, ChatGPT risponde all’utente usando quel contenuto e il lettore non mette mai piede sul sito del giornale. Risultato, meno traffico, meno pubblicità, redazioni costrette a licenziare e quindi meno articoli prodotti. A quel punto l’AI ha meno materiale da saccheggiare, vero, ma il modello è già stato addestrato. Il danno, insomma, è già fatto.
Non è la prima volta che si arriva alle carte bollate. Nel 2024 otto giornali avevano già trascinato in tribunale OpenAI e Microsoft. Il New York Times porta avanti la sua causa, CNN ha fatto lo stesso contro Perplexity, mentre Getty Images prima ha citato Stability AI e poi ha cambiato strategia firmando accordi con OpenAI e Perplexity.
Quello che cambia adesso è la dimensione. Mettere 400 giornali dentro una sola coalizione significa alzare l’asticella, e il messaggio rivolto a chi non ha ancora mosso un dito è tutt’altro che velato, unirsi o restare a guardare mentre altri decidono il futuro del settore.