Il confronto tra intelligenza artificiale e talento umano si fa sempre più serrato. Stavolta è toccato a Gemini, il modello sviluppato da Google, dimostrare le proprie capacità nel campo forse più ostico per una macchina: la matematica pura. E lo ha fatto in uno dei contesti più selettivi al mondo, le Olimpiadi Internazionali della Matematica (IMO), risolvendo cinque dei sei problemi proposti e ottenendo virtualmente una medaglia d’oro.
Questo traguardo colloca Gemini sullo stesso piano del modello avanzato di OpenAI, che solo pochi giorni prima aveva raggiunto un risultato simile. A sottolineare l’importanza del momento è lo stesso team di Google, che parla di un “salto di qualità” nei sistemi di ragionamento delle AI.
Problemi da Olimpiadi, regole da umani
La prova non è stata un’esibizione senza regole. I modelli AI coinvolti hanno dovuto affrontare le stesse condizioni degli studenti: due sessioni da 4 ore e mezza, nessun accesso a Internet né calcolatrici, e dimostrazioni scritte in linguaggio naturale, come richiesto nei concorsi matematici ufficiali.
Superare cinque problemi su sei in questo contesto significa raggiungere un livello d’élite: ogni anno solo una piccola percentuale dei partecipanti in carne e ossa riesce a conquistare la medaglia d’oro.
Una nuova frontiera del ragionamento
Il merito va a una versione potenziata di Gemini Deep Think, che sfrutta una tecnica definita “pensiero parallelo”: l’AI analizza simultaneamente diverse strategie di risoluzione, moltiplicando le possibilità di successo rispetto all’approccio lineare tradizionale. Il modello è stato inoltre allenato con tecniche avanzate di apprendimento per rinforzo, usando un corpus selezionato di dimostrazioni, teoremi e problemi complessi.
Gemini non ha solo risolto correttamente i problemi, ma ha anche saputo spiegare il procedimento, un passaggio fondamentale per essere valutato con lo stesso metro di giudizio degli studenti umani.
Presto disponibile per i tester
Google ha annunciato che questa versione avanzata del modello non resterà confinata ai laboratori. Sarà inizialmente disponibile per un gruppo selezionato di tester e successivamente verrà integrata nel pacchetto Google AI Ultra, la proposta più completa e costosa tra quelle dedicate agli utenti professionali.
