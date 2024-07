Un recente rapporto pubblicato dalla rivista 404 Media ha rivelato che Runway, una società all’avanguardia nell’intelligenza artificiale, avrebbe utilizzato migliaia di video da YouTube e altre fonti per addestrare il suo generatore AI text-to-video. Questa pratica, nota come scraping, solleva molte preoccupazioni riguardo alla legalità e all’etica del processo.

Runway usa i video presi da YouTube?

La rivista è entrata in possesso di documenti riservati del team di Runway, tra cui un foglio di calcolo con canali consigliati, parole chiave e hashtag. Questi documenti fanno riferimento esplicito a canali YouTube di famose aziende di intrattenimento, digital creator come MKBHD, Linus Tech Tips e Sam Kolder, agenzie di stampa come The Verge, The New Yorker, Reuters e Wired, e persino a siti pirata come KissCartoon. Tra le società di intrattenimento citate figurano giganti come Netflix, Disney, Nintendo e Rockstar Games.

Un ex dipendente di Runway ha rivelato a 404 Media che gli sviluppatori hanno compiuto enormi sforzi per trovare video di alta qualità per costruire il loro modello. I video venivano utilizzati come input per un web crawler che automaticamente scaricava i contenuti dai canali indicati, utilizzando server proxy per evitare blocchi da parte di Google.

Nonostante queste rivelazioni, Runway ha scelto di non rilasciare dichiarazioni ufficiali alla rivista. Attualmente non ci sono prove concrete che tutti i video elencati nel foglio di calcolo siano stati utilizzati per l’addestramento del modello Gen-3 Alpha. Tuttavia, il co-fondatore di Runway, Anastasis Germanidis, ha affermato in un’intervista a TechCrunch lo scorso giugno che l’azienda utilizza un insieme di dati curati e interni per i suoi modelli di AI.

Una regolamentazione ancora troppo vaga

Se confermato, questo comportamento costituirebbe una chiara violazione delle politiche di YouTube, che proibisce espressamente l’estrapolazione di dati, specialmente se protetti da diritti d’autore. Questo caso arriva poco dopo il blocco da parte di YouTube di sei siti che permettevano di scaricare video dalla piattaforma, evidenziando la necessità di regolamentare congiuntamente le politiche di addestramento dell’AI.

La controversia sottolinea l’urgenza di stabilire norme chiare per l’utilizzo dei dati online, in un settore in rapida espansione come quello dell’intelligenza artificiale. La protezione dei diritti d’autore e il rispetto delle policy delle piattaforme diventano sempre più cruciali per evitare abusi e garantire un uso etico e legale delle tecnologie emergenti.