Sembra assurdo, eppure l’AI di Google non riesce a scrivere correttamente “Google”. E no, non è uno scherzo. Alla domanda su quante P ci siano in “Google”, il sistema risponde candidamente: due. Il cognome del presidente degli Stati Uniti? Contiene una P, dice, ma lo compone così: t-r-p-u-m. Una figuraccia che fa riflettere, considerando che parliamo dello stesso motore di ricerca su cui miliardi di persone si affidano ogni giorno.
Parliamoci chiaro: l’intelligenza artificiale è capace di generare un’app in pochi secondi, risolvere problemi matematici rimasti irrisolti per decenni, creare video fotorealistici partendo da una semplice descrizione testuale. Eppure, quando si tratta di contare le lettere all’interno di una parola, si comporta più o meno come un bambino di cinque anni alle prese con il primo dettato. E questa stessa tecnologia alimenta le risposte automatiche che compaiono in cima ai risultati di ricerca.
Perché l’AI di Google sbaglia con le lettere?
La cosa interessante è che non si tratta di un semplice bug da sistemare con una patch. È un limite strutturale, radicato nel modo in cui funzionano i modelli linguistici. Questi sistemi non “leggono” il testo come farebbe una persona. Non vedono parole composte da singole lettere. L’architettura su cui si basano, quella dei transformer, spezza il testo in unità chiamate “token”, che possono corrispondere a parole intere, sillabe oppure frammenti apparentemente casuali. Quando l’AI incontra un articolo come “il”, possiede una codifica del suo significato complessivo, ma non ha la minima idea di cosa siano “i” e “l” come lettere separate.
Ecco perché, da anni ormai, ogni volta che un’azienda presenta un nuovo modello AI, il test informale più gettonato è sempre lo stesso: chiedere quante R ci sono nella parola “strawberry”. E puntualmente, il modello sbaglia. È diventato quasi un rito, una sorta di cartina tornasole dell’evoluzione (o della mancata evoluzione) di questi sistemi su un compito apparentemente banale.
Un problema che non ha una soluzione semplice
Definire cosa esattamente una “parola” dovrebbe rappresentare per un modello linguistico è tutt’altro che scontato. Google ha dichiarato che contare le lettere all’interno delle parole è una sfida nota e che il team sta lavorando per risolvere questo problema specifico. Insomma, ne sono consapevoli, ma la strada è ancora lunga.
Del resto, non è la prima volta che AI Overview di Google finisce sotto i riflettori per ragioni poco lusinghiere. Al momento del primo lancio, il sistema citava articoli satirici come se fossero fonti attendibili, arrivando a suggerire alle persone di mangiare pietre e mettere la colla sulla pizza. Quell’errore è stato corretto, ma i problemi legati allo spelling e al conteggio delle lettere restano ancora lì, perché sono intrinsecamente più difficili da risolvere. Derivano dalla natura stessa del funzionamento dei transformer, non da una svista nel codice o da un dataset contaminato.
Quello che colpisce è il contrasto: un sistema capace di prestazioni straordinarie in ambiti complessi, che però inciampa su qualcosa che chiunque sappia leggere dà per scontato. Le lettere dentro una parola, contarle, riconoscerle, è roba elementare per un essere umano. Per l’AI di Google, evidentemente, non ancora.