Deepfake e AI: i software per riconoscerli continuano a sbagliare

Individuare i deepfake e le immagini generate dall'intelligenza artificiale resta un problema enorme, e chi sperava che la tecnologia avesse ormai trovato una risposta convincente dovrà ricredersi ancora una volta. Una ricerca pubblicata l'11 maggio da NewsGuard ha messo alla prova cinque tra i più diffusi strumenti di rilevamento, e il verdetto è piuttosto impietoso: nella maggior parte dei test effettuati, almeno uno dei software ha sbagliato nel giudicare se un'immagine fosse autentica oppure no. Questo significa che chi si affida a questi tool per arginare la diffusione di notizie false su siti web e social network si ritrova, di fatto, con strumenti poco affidabili tra le mani. Il cuore del problema non è solo tecnico, ma anche concettuale. L'intelligenza artificiale viene usata quotidianamente per ritocchi del tutto innocui: applicare un filtro, migliorare la luminosità, correggere il contrasto di una foto. Operazioni che non alterano in alcun modo il significato dell'immagine. Ed è proprio qui che nascono i guai. Anche i sistemi basati sui watermark, quei marchi digitali nascosti nelle proprietà dei file, faticano a imporsi per lo stesso motivo: finiscono per bollare come "falsa" una foto che, nella sostanza, è rimasta identica all'originale. Un effetto collaterale che mina la credibilità dell'intero approccio. Come è stato strutturato l'esperimento I ricercatori di NewsGuard hanno tenuto conto di questa complessità e hanno impostato il test su due livelli distinti. Nel primo caso, le immagini sono state modificate in modo leggero, con alterazioni della luminosità o sfocature che non ne cambiavano il contenuto reale. Nel secondo, le modifiche erano ben più pesanti: scritte aggiunte, simboli, bandiere, fino ad arrivare allo stravolgimento completo della scena. Per esempio, partendo dalla fotografia di un edificio, è stato chiesto all'AI di generare un'esplosione. Due scenari molto diversi, pensati per capire se i software fossero in grado di distinguere un ritocco cosmetico da una vera e propria manipolazione. I cinque strumenti testati sono stati Hive, AI or Not, ZeroGPT, Sightengine e ScamAI. Quando sono state sottoposte all'analisi 15 foto autentiche e di provenienza verificata, solo Hive e Sightengine le hanno riconosciute correttamente come reali. Gli altri tre hanno scambiato alcune immagini per dei falsi, con ScamAI che ha raggiunto un picco di falsi positivi del 40%. Praticamente quasi la metà delle foto genuine è stata etichettata come sospetta. Nessun software raggiunge un livello di sicurezza accettabile Le cose non migliorano nemmeno quando si passa alle immagini effettivamente generate o stravolte dall'AI. I risultati dei cinque strumenti non sono praticamente mai concordi tra loro, il che la dice lunga sulla maturità di questa tecnologia. Nessuno dei software testati riesce a garantire un livello di affidabilità che si avvicini anche solo al 100%. Quello che emerge, guardando i dati nel dettaglio, è un difetto di fondo piuttosto significativo. L'analisi che questi strumenti effettuano sembra essere di tipo quantitativo e non qualitativo. In altre parole, se la modifica riguarda una porzione piccola dell'immagine, alcuni tool la ignorano, anche quando quella modifica cambia radicalmente il contesto e il significato della scena. Un simbolo aggiunto, una scritta sovrapposta, un elemento che trasforma completamente la narrazione visiva: tutto questo può passare inosservato se l'alterazione in termini di pixel è contenuta. La questione, insomma, è che i software di rilevamento deepfake non sono ancora abbastanza sofisticati per il compito che viene loro richiesto. Il divario tra ciò che l'intelligenza artificiale sa creare e ciò che gli strumenti di analisi sanno intercettare resta ampio, e per ora nessuna delle soluzioni disponibili sul mercato offre garanzie sufficienti a chi combatte la disinformazione visiva.

Deepfake e AI: i software per riconoscerli continuano a sbagliare

Strumenti di rilevamento AI ancora inaffidabili: una ricerca svela errori frequenti nei principali software anti-deepfake usati online.

Come è stato strutturato l’esperimento

Nessun software raggiunge un livello di sicurezza accettabile