Distinguere un’immagine generata con AI da una foto reale sta diventando un esercizio sempre più complicato, soprattutto quando quel file viene condiviso, compresso, ricondiviso e alla fine perde qualsiasi traccia della sua origine. Per provare a mettere un argine a questo problema, OpenAI ha deciso di fare un passo avanti importante: ai Content Credentials basati sullo standard C2PA si affiancheranno adesso anche i watermark SynthID sviluppati da Google DeepMind. Due livelli di controllo, invece di uno solo, perché nessuno dei due da solo basta davvero.
Il punto è questo. I metadati C2PA sono molto utili perché trasportano informazioni dettagliate sulla provenienza di un file. Il problema è che rischiano di sparire nel momento in cui un’immagine viene caricata su una piattaforma che non li conserva, oppure viene compressa o semplicemente ricondivisa. SynthID funziona in modo diverso: inserisce un segnale invisibile direttamente nell’immagine, un watermark che resiste anche quando i metadati non ci sono più. Dopo uno screenshot, per esempio, quei dati tecnici di provenienza vengono persi, ma il watermark può restare leggibile. Insieme, i due sistemi si completano a vicenda e rendono la tracciabilità dei contenuti molto più solida di quanto potrebbe fare ciascuno separatamente.
SynthID verrà applicato inizialmente alle immagini generate tramite ChatGPT, Codex e le OpenAI API. Si interviene così su uno dei limiti più evidenti dei sistemi basati solo sui metadati: quando il contenuto esce dall’ambiente in cui è stato creato, le informazioni di origine possono andare perse durante i normali passaggi tecnici da una piattaforma all’altra.
Un portale pubblico per verificare le immagini
Oltre al doppio sistema di tracciamento, OpenAI ha lanciato in versione anteprima un portale pubblico di verifica. Funziona in modo piuttosto semplice: si carica un’immagine e lo strumento controlla se contiene metadati AI o watermark riconducibili ai sistemi supportati. Per ora, nella fase iniziale, l’analisi si limita ai segnali C2PA e SynthID, e serve a capire se quel file è stato generato con ChatGPT, le API di OpenAI o Codex.
Va detto che il controllo, almeno per il momento, riguarda solo i contenuti prodotti con strumenti OpenAI. La società ha però dichiarato di voler estendere il supporto ad altri sistemi di verifica nei prossimi mesi e, più avanti, anche ad altre tipologie di contenuti. Dalla schermata mostrata, il portale permette di caricare una sola immagine alla volta. E c’è un’avvertenza importante: nessun metodo di rilevamento è infallibile. Se non vengono trovati né metadati né watermark, lo strumento non affermerà in modo definitivo che quell’immagine non sia stata generata con strumenti OpenAI, perché quei segnali potrebbero essere stati semplicemente rimossi lungo il percorso.
Lo standard C2PA e il lavoro di OpenAI sulla provenienza dei contenuti
OpenAI è entrata anche nel C2PA Conformance Program e ricorda di lavorare sugli standard di provenienza dal 2024, quando ha iniziato ad aggiungere Content Credentials alle immagini generate con DALL·E 3, per poi estendere il sistema anche a ImageGen e Sora. Lo standard C2PA utilizza metadati e firme crittografiche per associare ai contenuti informazioni sulla loro origine, sulle eventuali modifiche e su chi ha firmato quei dati.
La società fa inoltre parte dello Steering Committee della Coalition for Content Provenance and Authenticity, il gruppo intersettoriale alla base dello standard tecnico aperto C2PA. L’ingresso nel programma di conformità ha uno scopo pratico preciso: rendere più semplice, per piattaforme e strumenti di terze parti, leggere, conservare e trasmettere le informazioni di provenienza associate ai contenuti generati con strumenti OpenAI. Il vantaggio più concreto riguarda soprattutto fact checker, redazioni, agenzie media e piattaforme online, che potranno contare su più elementi per distinguere immagini autentiche, contenuti manipolati e deepfake generati con intelligenza artificiale.
