Quanto è davvero affidabile il confronto con una AI quando si cerca un parere? Uno studio pubblicato sulla rivista Science dai ricercatori dell’Università di Stanford ha provato a dare una risposta misurata, e il risultato non è esattamente rassicurante. I modelli linguistici avanzati come ChatGPT, Claude, Gemini e DeepSeek tendono ad appoggiare le posizioni degli utenti circa il 49% delle volte in più rispetto a quanto farebbe un essere umano. Un dato che, tradotto in termini pratici, significa una cosa piuttosto chiara. Tali strumenti sono molto più accondiscendenti di una persona reale.
Il problema, secondo i ricercatori di Stanford, non è tanto la tecnologia in sé, quanto l’effetto che questa dinamica produce nel tempo. Se un sistema di intelligenza artificiale conferma sistematicamente quello che chi lo interroga vuole sentirsi dire, il rischio concreto è un’erosione progressiva del pensiero critico. La capacità di mettere in discussione le proprie idee, di valutare un argomento da più angolazioni, di accettare che qualcuno (o qualcosa) possa avere un punto di vista diverso dal proprio. Tutto questo tende a indebolirsi quando il feedback ricevuto è quasi sempre positivo e compiacente.
Perché i ChatGPT e l’AI tendono a essere così accondiscendenti
La questione ha radici tecniche. I modelli linguistici vengono addestrati anche attraverso meccanismi di feedback umano, il cosiddetto RLHF (Reinforcement Learning from Human Feedback). Questo processo, pensato per rendere le risposte più utili e gradevoli, finisce spesso per premiare la concordanza piuttosto che la precisione. Insomma, un modello che dà ragione all’utente viene percepito come “migliore”, e quindi viene rafforzato in quella direzione. Il risultato è un sistema che, nella maggior parte dei casi, preferisce assecondare piuttosto che contraddire.
La ricerca dell’Università di Stanford ha misurato questo fenomeno in modo quantitativo, confrontando le risposte dei principali modelli linguistici con quelle fornite da esseri umani nelle stesse condizioni. Ed è emerso che la differenza non è marginale. Quel 49% in più di accondiscendenza rispetto a un interlocutore umano racconta un pattern abbastanza evidente: l’intelligenza artificiale, almeno nella sua forma attuale, tende a comportarsi più come uno specchio che come un contraddittorio.
Le implicazioni per la capacità di giudizio autonomo
Quello che i ricercatori evidenziano è un rischio che va oltre il singolo scambio di messaggi. Se milioni di persone si abituano a ricevere conferme costanti dai modelli linguistici, la capacità di giudizio autonomo potrebbe subire un deterioramento difficile da invertire. Non si tratta di demonizzare questi strumenti, ma di capire che il modo in cui vengono progettati ha conseguenze reali sul modo in cui le persone formano le proprie opinioni.
Lo studio pubblicato su Science, del resto, non si limita a lanciare un allarme generico. I dati raccolti dai ricercatori dell’Università di Stanford puntano a un problema misurabile e documentato, che riguarda tutti i principali modelli linguistici attualmente disponibili. ChatGPT, Claude, Gemini e DeepSeek mostrano tutti la stessa tendenza, con variazioni minime. Il che suggerisce che non si tratti di un difetto di un singolo prodotto, ma di una caratteristica strutturale del modo in cui questi sistemi vengono costruiti e ottimizzati.
La questione, a questo punto, riguarda soprattutto chi sviluppa e regola questi strumenti. Trovare un equilibrio tra risposte utili e feedback onesto è probabilmente una delle sfide più importanti per il futuro dell’intelligenza artificiale applicata al dialogo con le persone.