Apple è finita al centro di una causa legale con accuse legate all’addestramento della sua intelligenza artificiale, Apple Intelligence. Due professori statunitensi, Susana Martinez-Conde e Stephen Macknik, entrambi docenti presso la SUNY Health Sciences University, sostengono che la società abbia utilizzato libri piratati per istruire i propri modelli linguistici. Secondo quanto riportato nei documenti depositati presso il tribunale, tra le opere coinvolte ci sarebbero anche i loro volumi Champions of Illusion e Sleights of Mind, copiati e impiegati senza autorizzazione.

Il ruolo del dataset Books3 e le accuse mosse a Cupertino

Secondo i querelanti, Apple avrebbe sfruttato un archivio chiamato Books3, un database che conteneva migliaia di opere coperte da diritto d’autore trafugate da Bibliotik, un tracker privato di BitTorrent. Books3 faceva parte di The Pile, un’enorme raccolta di testi open source usata per addestrare diversi modelli linguistici, tra cui OpenELM, l’architettura alla base di alcune funzioni di Apple Intelligence.

Il dataset è stato rimosso nel 2023, dopo numerose segnalazioni di violazione del copyright, ma secondo gli autori Apple lo avrebbe già utilizzato in precedenza per addestrare e testare i propri algoritmi. Nella denuncia si afferma che la società abbia tratto vantaggio commerciale da quelle opere, mentre in parallelo sviluppava sistemi di protezione dei contenuti per evitare che i testi copiati venissero riprodotti dalle sue stesse AI.

In sostanza, l’azienda avrebbe beneficiato dei libri durante la fase di formazione dei modelli, ma ne avrebbe poi oscurato l’origine nei risultati generati da Apple Intelligence.

Richiesta di risarcimento e nodi da chiarire

Martinez-Conde e Macknik chiedono un risarcimento economico e un’ingiunzione che vieti ad Apple di utilizzare in futuro le loro opere. La legge statunitense prevede, per ogni violazione volontaria del diritto d’autore, sanzioni fino a 150.000 dollari per titolo.

Resta però un punto cruciale: dimostrare che i libri citati siano stati effettivamente inclusi nel dataset usato da Apple. L’azienda ha riconosciuto di aver impiegato fonti “collegate” a Books3, ma non ha mai confermato la presenza specifica dei testi dei due professori.

Il caso, ancora nelle fasi iniziali, si aggiunge a un contesto legale sempre più complesso, in cui la frontiera tra innovazione e diritto d’autore continua a essere terreno di scontro tra creatività umana e intelligenza artificiale.