Negli ultimi mesi, due progetti originali hanno attirato l’attenzione della community su Twitch: Gemini Plays Pokémon e Claude Plays Pokémon. In entrambi i casi, due modelli di intelligenza artificiale generativa sono stati messi alla prova su titoli classici del Game Boy, lasciati liberi di esplorare, combattere e prendere decisioni in autonomia mentre spiegano in tempo reale cosa stanno facendo e perché.

L’esperimento non punta alla velocità. I modelli impiegano centinaia di ore per completare giochi che un bambino finirebbe in meno di una giornata. Ma l’obiettivo è un altro: osservare come reagiscono di fronte a ostacoli imprevisti, regole complesse e situazioni di stress.

Panico e scelte irrazionali nei momenti critici

Secondo quanto riportato da un’analisi interna di Google DeepMind, Gemini 2.5 Pro tende a “confondersi” quando uno dei suoi Pokémon rischia il KO. Il modello, in questi frangenti, abbandona strategie precedentemente valide e mostra un netto calo nella qualità del ragionamento. Gli spettatori riescono a notare questi segnali in diretta, quasi come se l’AI provasse una forma di ansia artificiale.

Anche Claude, il modello rivale sviluppato da Anthropic, ha mostrato comportamenti bizzarri. Dopo aver capito che, in caso di sconfitta, si torna all’ultimo Centro Pokémon, ha deciso di mandare intenzionalmente tutti i suoi Pokémon al tappeto per “saltare” fuori da una grotta. Il risultato è stato un auto-sabotaggio che ha lasciato il pubblico incredulo e divertito.

Ma c’è anche del buono: i puzzle non lo spaventano

Tra gli aspetti positivi, Gemini ha saputo sorprendere nella risoluzione di enigmi fisici, come quelli presenti lungo Via Vittoria. Con un semplice schema logico e poche indicazioni fornite all’inizio, è riuscita a completare i puzzle dei massi al primo tentativo, dimostrando un alto livello di astrazione e comprensione delle meccaniche del gioco.

Secondo il report, Gemini ha persino costruito da sola strumenti logici per valutare la correttezza delle sue mosse. Una dimostrazione interessante del potenziale evolutivo dei modelli AI, che in futuro potrebbero apprendere e correggersi senza alcun intervento umano.

Il progetto resta un esperimento affascinante e, per certi versi, ironico: l’AI che domina nei test linguistici va in crisi davanti a una pokéball. Per seguirne i progressi in tempo reale, basta sintonizzarsi sui canali Twitch ufficiali dei due esperimenti.