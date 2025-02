Meta si trova nuovamente al centro di un acceso dibattito legale dopo la diffusione di nuove informazioni che gettano luce su una delle cause intentate contro l’azienda per l’utilizzo di materiale protetto da copyright nell’addestramento dei suoi modelli di intelligenza artificiale. Alcune email interne, rese pubbliche di recente, sembrano confermare che il colosso tecnologico fosse a conoscenza dell’origine illecita dei dati utilizzati.

Materiale protetto, pirateria e intelligenza artificiale

Le informazioni emerse si collegano alla causa intentata nell’estate del 2023 da un gruppo di autori contro diverse aziende tecnologiche, tra cui OpenAI, NVIDIA, Databricks e la stessa Meta. In particolare, la società guidata da Mark Zuckerberg aveva già ammesso di aver scaricato dataset via torrent, tra cui il noto LibGen, un vasto archivio contenente milioni di libri piratati.

Nuovi documenti presentati dagli accusatori rivelano che il volume complessivo dei dati scaricati sarebbe stato di almeno 81,7 terabyte, ottenuti attraverso la piattaforma Anna’s Archive, con un significativo contributo di 35,7 terabyte provenienti da Z-Library e LibGen. Inoltre, precedenti operazioni avrebbero permesso di ottenere ulteriori 80,6 terabyte di materiale da LibGen, per un totale di circa 160 terabyte.

Le email interne rese pubbliche indicano che all’interno dell’azienda alcuni dipendenti erano consapevoli delle implicazioni legali delle operazioni. In uno dei messaggi, un dipendente sottolineava che utilizzare materiale piratato non sarebbe stato eticamente accettabile, mentre un altro evidenziava come piattaforme come SciHub, ResearchGate e LibGen fossero l’equivalente di siti notoriamente dediti alla diffusione di contenuti illeciti.

Un’ulteriore testimonianza significativa proviene dall’ingegnere Nikolay Bashlykov, che nel settembre del 2023 aveva espresso preoccupazioni sull’uso dei torrent, poiché avrebbe potenzialmente comportato la condivisione dei file con terze parti, un’azione che avrebbe potuto costituire un’ulteriore violazione legale. Proprio per evitare questi rischi, l’azienda avrebbe scelto di eseguire download diretti senza impiegare i propri server.

Meta ha presentato una mozione di archiviazione il mese scorso, sostenendo che gli accusatori non hanno dimostrato che i file siano stati effettivamente distribuiti attraverso la rete BitTorrent con Meta come fonte. La distinzione tra scaricare e condividere materiale protetto è cruciale per la difesa della società, poiché la seconda attività è considerata una violazione più grave della normativa sul copyright.