Gemini sembra perdere colpi prima del previsto, e non è una questione da poco per chi usa l’assistente di Google per lavorare su conversazioni lunghe. Il punto è che la finestra contestuale promessa, quella che dovrebbe garantire una memoria capiente al chatbot, nella pratica si comporta in modo ben diverso da quanto raccontato. E gli utenti hanno iniziato a notarlo.
Google, come ben sappiamo, propone diversi piani a pagamento per la sua intelligenza artificiale. Oltre ai modelli più avanzati, a più spazio sul cloud e a limiti d’uso più alti, gli abbonamenti includono anche una finestra contestuale più ampia. Tradotto in parole semplici: pagando, Gemini dovrebbe ricordare molto di più all’interno di una stessa chat. Eppure qualcosa non torna.
Un milione di token sulla carta, molto meno nella realtà
Le segnalazioni che girano in rete raccontano di una bella distanza tra quello che dichiara Google e ciò che succede davvero. La casa di Mountain View sostiene che con i piani Google AI Pro e Ultra il chatbot disponga di una finestra da 1 milione di token. In soldoni, parliamo della capacità di elaborare fino a 1500 pagine di testo oppure 30.000 righe di codice tutte insieme. Sulla pagina di assistenza lo scrivono nero su bianco: questa finestra più ampia permette all’app di lavorare con messaggi e chat più lunghi.
Peccato che, stando alle testimonianze raccolte su X, la faccenda sia parecchio più sfumata. Il backend, al primo accesso, gestisce senza problemi un file statico di grandi dimensioni. Fin qui tutto bene. Il problema arriva con la memoria conversazionale attiva, che pare invece molto più ridotta: scende fino a un limite di circa 16.000 elementi, vale a dire una media di 25-30 messaggi. Niente di paragonabile al milione sbandierato. Risultato? Gemini finisce per dimenticare in fretta istruzioni, blocchi di codice o vincoli che gli erano stati dati poco prima, all’interno della stessa identica conversazione.
Server capienti, ma il chatbot non li sfrutta fino in fondo
C’è una distinzione importante da fare qui. I server di Gemini sono effettivamente in grado di reggere fino a un milione di token di contesto, su questo non ci piove. Solo che il chatbot non riesce ad analizzarli tutti in una singola sessione senza cominciare a perdere pezzi delle parti precedenti. È come avere un magazzino enorme ma riuscire a tirare fuori solo una manciata di scatole alla volta.
La questione, va detto, non è proprio nuovissima. Già nei mesi scorsi erano spuntate lamentele simili su Reddit, segno che il fastidio circola da un po’. Una nota positiva c’è: la piattaforma AI Studio sembra restare fuori dal problema, almeno per quanto emerge finora.