
Gemini
L’intelligenza artificiale è ormai una delle principali porte d’accesso all’informazione, ma quanto possiamo davvero fidarci dei suoi contenuti? Una domanda tutt’altro che banale, considerando che, secondo l’European Broadcasting Union (EBU), il 15% degli under 25 utilizza regolarmente sistemi AI per informarsi.
Una nuova ricerca condotta proprio dalla BBC e dalla EBU ha provato a dare una risposta, analizzando l’accuratezza dei principali assistenti AI generativi. Il risultato non lascia spazio a dubbi: Google Gemini è il peggiore tra i modelli testati, con errori ricorrenti e mancanza di affidabilità nelle sintesi delle notizie.
Lo studio: quattro intelligenze artificiali messe alla prova
L’indagine, presentata durante la EBU News Assembly di Napoli, ha coinvolto ChatGPT (OpenAI), Gemini (Google), Copilot (Microsoft) e Perplexity, analizzando oltre 3.000 risposte a domande di attualità e informazione. I ricercatori hanno valutato diversi criteri, tra cui:
- accuratezza dei contenuti,
- citazione e correttezza delle fonti,
- contestualizzazione storica o politica,
- presenza di errori o distorsioni semantiche.
In parallelo, la BBC ha condotto gruppi di discussione e sondaggi per misurare la percezione di fiducia degli utenti verso l’IA nel Regno Unito e in altri 18 Paesi europei.
Fiducia alta, consapevolezza bassa
Uno dei dati più significativi riguarda il paradosso della fiducia. Il 42% degli adulti britannici dichiara di fidarsi dell’accuratezza delle risposte AI, percentuale che sale ulteriormente tra i giovani. Tuttavia, l’84% afferma che eventuali errori minerebbero la loro fiducia — pur non riuscendo, in molti casi, a riconoscere le imprecisioni quando si presentano. In altre parole, l’utente medio si fida dell’intelligenza artificiale più di quanto sia in grado di verificarla, creando un rischio informativo notevole. La fiducia è alta, ma la capacità critica di analisi resta bassa: un binomio che rischia di amplificare il fenomeno della disinformazione automatica.
Gemini, il fanalino di coda
Tutti i sistemi analizzati hanno mostrato qualche grado di errore, ma Gemini si è distinto in negativo. Il report evidenzia che l’assistente di Google ha registrato il più alto tasso di imprecisioni significative, con problemi ricorrenti nel 70–76% delle risposte, un valore quasi tre volte superiore alla media dei concorrenti. Le principali criticità riscontrate includono:
- assenza di collegamenti chiari alle fonti, che impedisce agli utenti di verificare l’origine delle informazioni;
- difficoltà nel distinguere fonti attendibili da contenuti satirici o parodistici, con casi in cui notizie ironiche venivano riportate come fatti reali;
- uso eccessivo di Wikipedia come unica base informativa, riducendo la varietà dei punti di vista;
- citazioni riportate in modo errato o fuori contesto, distorcendo il significato di dichiarazioni ufficiali;
- mancanza di contesto storico o politico, con risposte che semplificano eccessivamente eventi complessi.
