Fino a oggi, nel mondo dell’intelligenza artificiale, esisteva un compromesso quasi inevitabile: i modelli più capaci erano lenti, quelli veloci sacrificavano qualità. Google DeepMind presenta al Google I/O 2026 una risposta concreta a questo problema con Gemini 3.5 Flash, il primo modello della nuova famiglia Gemini 3.5, disponibile da oggi per miliardi di persone in tutto il mondo e già integrato come modello predefinito nell’app Gemini e in AI Mode nella Ricerca Google.
I numeri di Gemini 3.5 Flash sono difficili da ignorare. Il modello supera Gemini 3.1 Pro sui benchmark più impegnativi per agenti e coding, Terminal-Bench 2.1 (76,2%), GDPval-AA (1656 Elo) e MCP Atlas (83,6%), e guida nella comprensione multimodale con l’84,2% su CharXiv Reasoning. In termini di velocità di output, è quattro volte più rapido degli altri modelli frontier attualmente disponibili. Il posizionamento nel quadrante in alto a destra dell’Artificial Analysis Intelligence Index, dove si incrociano alta intelligenza e alta velocità, traduce questi benchmark in un messaggio pratico: non è più necessario scegliere tra qualità e latenza.
Progettato per i task agentici di lunga durata
La vera ambizione di Gemini 3.5 Flash non è rispondere a domande singole, ma gestire workflow complessi e multi-step che in precedenza richiedevano giorni o settimane di lavoro umano. Attività che un sviluppatore avrebbe impiegato giorni a completare o che un revisore avrebbe affrontato in settimane possono ora essere assistite in una frazione del tempo, spesso a meno della metà del costo degli altri modelli frontier.
Integrato con la piattaforma agentica Google Antigravity, Gemini 3.5 Flash diventa un motore per il dispiegamento di subagenti collaborativi capaci di affrontare problemi su scala nei casi d’uso più esigenti. Sotto supervisione umana, esegue workflow multi-step e task di coding mantenendo prestazioni di livello frontier per tutta la durata dell’esecuzione. Le applicazioni concrete già in uso raccontano la portata di questo cambiamento. Shopify sta usando subagenti in parallelo per analizzare dati complessi su lunghi orizzonti temporali, ottenendo previsioni di crescita dei merchant più accurate su scala globale. Banche e aziende fintech stanno automatizzando workflow che prima richiedevano settimane, mentre team di data science lo usano per estrarre insight da ambienti di dati particolarmente complessi.
Gemini Spark e i nuovi agenti personali
Le capacità agentiche di Gemini 3.5 Flash alimentano direttamente Gemini Spark, il nuovo agente AI personale annunciato al Google I/O: attivo 24 ore su 24, 7 giorni su 7, capace di agire per conto dell’utente sotto la sua direzione. Il roll-out per i tester fidati inizia oggi, con la Beta prevista per gli abbonati Google AI Ultra negli Stati Uniti la settimana prossima.
Nella Ricerca Google, le capacità di coding agentico di 3.5 Flash abilitano i nuovi agenti d’informazione e le esperienze di UI generativa dinamica, interfacce costruite in tempo reale in risposta alle domande degli utenti, che includono elementi interattivi, simulazioni e visualizzazioni personalizzate.
Gemini 3.5 è stato sviluppato in conformità con il Frontier Safety Framework di Google. I sistemi di protezione in ambito cyber e CBRN sono stati rafforzati, riducendo la probabilità di generare contenuti dannosi e diminuendo i falsi rifiuti su query sicure. Tra le novità tecniche, strumenti di interpretabilità che consentono di verificare il ragionamento interno del modello prima che fornisca una risposta — un passo concreto verso AI più trasparente e verificabile.
Disponibilità e prossimi passi
Gemini 3.5 Flash è disponibile da oggi attraverso Google Antigravity, la Gemini API in Google AI Studio e Android Studio, la Gemini Enterprise Agent Platform e Gemini Enterprise. È il nuovo modello predefinito per l’app Gemini e AI Mode nella Ricerca per tutti gli utenti a livello globale. Il lavoro su Gemini 3.5 Pro è già in corso, il modello è già in uso interno, e Google prevede di renderlo disponibile il mese prossimo.







