Google Gemini: uno studio BBC-EBU evidenzia gravi errori nelle notizie generate dall’AI

Gemini L’intelligenza artificiale è ormai una delle principali porte d’accesso all’informazione, ma quanto possiamo davvero fidarci dei suoi contenuti? Una domanda tutt’altro che banale, considerando che, secondo l’European Broadcasting Union (EBU), il 15% degli under 25 utilizza regolarmente sistemi AI per informarsi. Una nuova ricerca condotta proprio dalla BBC e dalla EBU ha provato a dare una risposta, analizzando l’accuratezza dei principali assistenti AI generativi. Il risultato non lascia spazio a dubbi: Google Gemini è il peggiore tra i modelli testati, con errori ricorrenti e mancanza di affidabilità nelle sintesi delle notizie. Lo studio: quattro intelligenze artificiali messe alla prova L’indagine, presentata durante la EBU News Assembly di Napoli, ha coinvolto ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft) e Perplexity, analizzando oltre 3.000 risposte a domande di attualità e informazione. I ricercatori hanno valutato diversi criteri, tra cui: accuratezza dei contenuti, citazione e correttezza delle fonti, contestualizzazione storica o politica, presenza di errori o distorsioni semantiche. In parallelo, la BBC ha condotto gruppi di discussione e sondaggi per misurare la percezione di fiducia degli utenti verso l’IA nel Regno Unito e in altri 18 Paesi europei. Fiducia alta, consapevolezza bassa Uno dei dati più significativi riguarda il paradosso della fiducia. Il 42% degli adulti britannici dichiara di fidarsi dell’accuratezza delle risposte AI, percentuale che sale ulteriormente tra i giovani. Tuttavia, l’84% afferma che eventuali errori minerebbero la loro fiducia — pur non riuscendo, in molti casi, a riconoscere le imprecisioni quando si presentano. In altre parole, l’utente medio si fida dell’intelligenza artificiale più di quanto sia in grado di verificarla, creando un rischio informativo notevole. La fiducia è alta, ma la capacità critica di analisi resta bassa: un binomio che rischia di amplificare il fenomeno della disinformazione automatica. Gemini, il fanalino di coda Tutti i sistemi analizzati hanno mostrato qualche grado di errore, ma Gemini si è distinto in negativo. Il report evidenzia che l’assistente di Google ha registrato il più alto tasso di imprecisioni significative, con problemi ricorrenti nel 70–76% delle risposte, un valore quasi tre volte superiore alla media dei concorrenti. Le principali criticità riscontrate includono: assenza di collegamenti chiari alle fonti, che impedisce agli utenti di verificare l’origine delle informazioni; difficoltà nel distinguere fonti attendibili da contenuti satirici o parodistici, con casi in cui notizie ironiche venivano riportate come fatti reali; uso eccessivo di Wikipedia come unica base informativa, riducendo la varietà dei punti di vista; citazioni riportate in modo errato o fuori contesto, distorcendo il significato di dichiarazioni ufficiali; mancanza di contesto storico o politico, con risposte che semplificano eccessivamente eventi complessi.

Google Gemini sotto accusa: uno studio BBC-EBU solleva dubbi sulla qualità della sua intelligenza artificiale

Una ricerca BBC-EBU rivela che Google Gemini è il meno accurato tra gli assistenti AI nel sintetizzare le notizie, con errori significativi e mancanza di fonti.

Lo studio: quattro intelligenze artificiali messe alla prova

Fiducia alta, consapevolezza bassa

Gemini, il fanalino di coda