Quando qualcuno chiede a un chatbot AI se ha fatto bene o male in una situazione personale, la risposta è quasi sempre rassicurante. Troppo rassicurante. Un utente ha raccontato di aver finto per due anni con la fidanzata di essere disoccupato, solo per “testare la relazione”. Su Reddit, la comunità lo aveva giudicato senza mezzi termini: aveva torto marcio. Il chatbot, invece, gli ha risposto che le sue azioni derivavano da un genuino desiderio di comprendere le dinamiche della relazione. Praticamente un applauso. Ecco, questo è il cuore del problema che emerge da uno studio appena pubblicato su Science.
La ricerca, intitolata “Sycophantic AI decreases prosocial intentions and promotes dependence”, ha messo alla prova 11 modelli linguistici, tra cui ChatGPT, Claude, Gemini e DeepSeek. I ricercatori hanno sottoposto domande prese da database di consigli interpersonali, scenari con azioni potenzialmente dannose o illegali, e post dal celebre subreddit r/AmITheAsshole, dove la community aveva stabilito che chi poneva la domanda era nel torto. I numeri parlano chiaro: in media, le risposte dei chatbot AI validavano il comportamento dell’utente il 49% in più rispetto agli esseri umani. Nei casi Reddit, dove la comunità aveva decretato che l’utente sbagliava, i chatbot gli davano ragione nel 51% dei casi. Per le domande su azioni dannose o illegali, l’intelligenza artificiale validava il comportamento il 47% delle volte.
L’intelligenza artificiale servile piace, ma fa danni
Nella seconda fase dello studio, oltre 2.400 partecipanti hanno interagito con chatbot servili e con versioni non servili. Quello che è emerso non è particolarmente confortante: le persone preferivano nettamente la versione accomodante, si fidavano di più, e tornavano a chiedere consiglio. Fin qui, nulla di sorprendente. Il punto critico è un altro. Dopo l’interazione con il chatbot AI servile, i partecipanti risultavano più convinti di avere ragione e significativamente meno disposti a scusarsi.
Dan Jurafsky, co-autore senior dello studio, ha spiegato che gli utenti sono perfettamente consapevoli del fatto che i modelli si comportano in modo lusinghiero. Quello di cui non si rendono conto, però, è che questa servilità li sta rendendo più egocentrici e meno empatici. Il meccanismo genera quelli che i ricercatori definiscono “incentivi perversi”: le aziende che sviluppano chatbot AI sono spinte ad aumentare la servilità, non a ridurla, semplicemente perché gli utenti la apprezzano e continuano a usare il prodotto.
Adolescenti e supporto emotivo: il rischio più sottile
Non sono solo gli adulti a rivolgersi ai chatbot AI per questioni personali. Secondo il Pew Research Center, il 12% degli adolescenti americani utilizza i chatbot per ottenere supporto emotivo o consigli. Myra Cheng, autrice principale dello studio, ha raccontato di essersi interessata al tema dopo aver scoperto che molti studenti universitari chiedevano ai chatbot consigli sulle relazioni sentimentali, arrivando persino a farsi scrivere messaggi di rottura.
Cheng ha sottolineato che, per impostazione predefinita, i modelli di intelligenza artificiale evitano di contraddire chi li usa e raramente adottano un approccio diretto o critico. Il rischio concreto è che le persone, soprattutto le più giovani, si disabituino a gestire il confronto e i conflitti nella vita reale. Jurafsky ha definito la servilità dei chatbot AI un problema di sicurezza a tutti gli effetti, che necessita di regolamentazione e supervisione, esattamente come altri rischi legati alla tecnologia. Il team di ricerca sta già esaminando possibili soluzioni per rendere i modelli meno compiacenti.
