Gemini

L’intelligenza artificiale è ormai una delle principali porte d’accesso all’informazione, ma quanto possiamo davvero fidarci dei suoi contenuti? Una domanda tutt’altro che banale, considerando che, secondo l’European Broadcasting Union (EBU), il 15% degli under 25 utilizza regolarmente sistemi AI per informarsi.

Una nuova ricerca condotta proprio dalla BBC e dalla EBU ha provato a dare una risposta, analizzando l’accuratezza dei principali assistenti AI generativi. Il risultato non lascia spazio a dubbi: Google Gemini è il peggiore tra i modelli testati, con errori ricorrenti e mancanza di affidabilità nelle sintesi delle notizie.

Lo studio: quattro intelligenze artificiali messe alla prova

L’indagine, presentata durante la EBU News Assembly di Napoli, ha coinvolto ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft) e Perplexity, analizzando oltre 3.000 risposte a domande di attualità e informazione. I ricercatori hanno valutato diversi criteri, tra cui:

accuratezza dei contenuti,

citazione e correttezza delle fonti,

contestualizzazione storica o politica,

presenza di errori o distorsioni semantiche.

In parallelo, la BBC ha condotto gruppi di discussione e sondaggi per misurare la percezione di fiducia degli utenti verso l’IA nel Regno Unito e in altri 18 Paesi europei.

Fiducia alta, consapevolezza bassa

Uno dei dati più significativi riguarda il paradosso della fiducia. Il 42% degli adulti britannici dichiara di fidarsi dell’accuratezza delle risposte AI, percentuale che sale ulteriormente tra i giovani. Tuttavia, l’84% afferma che eventuali errori minerebbero la loro fiducia — pur non riuscendo, in molti casi, a riconoscere le imprecisioni quando si presentano. In altre parole, l’utente medio si fida dell’intelligenza artificiale più di quanto sia in grado di verificarla, creando un rischio informativo notevole. La fiducia è alta, ma la capacità critica di analisi resta bassa: un binomio che rischia di amplificare il fenomeno della disinformazione automatica.

Gemini, il fanalino di coda

Tutti i sistemi analizzati hanno mostrato qualche grado di errore, ma Gemini si è distinto in negativo. Il report evidenzia che l’assistente di Google ha registrato il più alto tasso di imprecisioni significative, con problemi ricorrenti nel 70–76% delle risposte, un valore quasi tre volte superiore alla media dei concorrenti. Le principali criticità riscontrate includono: