Il problema del consumo eccessivo di token su Antigravity non è una novità per chi lavora con gli strumenti di sviluppo di Google, e adesso l’azienda prova a risolverlo con una mossa diversa dal solito. Dopo settimane di proteste da parte degli sviluppatori, che lamentavano quote insufficienti anche per operazioni banali, Mountain View ha scelto di non alzare ancora i limiti di utilizzo. Ha fatto qualcosa di più furbo: ha creato un modello pensato apposta per consumare meno risorse. Si chiama Gemini 3.5 Flash (Low), ed è già disponibile.
La vicenda parte da un dato di fatto che aveva fatto arrabbiare parecchi utenti. In una sola settimana Google aveva triplicato due volte i limiti di utilizzo dei modelli Gemini per Antigravity, ma la cosa non era bastata. Le nuove soglie restavano comunque più basse rispetto a quelle precedenti, e tanti sviluppatori continuavano a finire le proprie quote con una facilità disarmante. A quel punto, invece di insistere sulla stessa strada, Google ha deciso di ripensare il problema alla radice.
Come funziona e cosa cambia rispetto alla versione Medium
A dare l’annuncio è stato Varun Mohan, Director di Google DeepMind e responsabile di Antigravity, che su X ha ammesso apertamente il nodo: Gemini 3.5 Flash era stato ottimizzato per affrontare compiti complessi con grande efficacia, ma nel farlo si era sacrificata l’efficienza sui task più semplici. Il risultato era che anche operazioni di routine bruciavano una quantità spropositata di token.
Gemini 3.5 Flash (Low) nasce proprio per risolvere questo squilibrio. Secondo i dati condivisi da Google, la nuova variante genera circa il 45% di token in meno rispetto alla versione originale, che da adesso si chiamerà Gemini 3.5 Flash (Medium). Il modello Low non rinuncia alla lettura del prompt di sistema né alla compressione del contesto, ma adegua il livello di elaborazione alla complessità effettiva del compito. Quando non serve una risposta particolarmente articolata, lavora in modo più snello e diretto.
La famiglia Gemini 3.5 Flash si divide quindi in due varianti con gradi di elaborazione differenti. Per le attività che richiedono un’analisi più profonda resta consigliata la versione Medium. Il modello Low, invece, è pensato per le operazioni quotidiane e ripetitive, quelle che non giustificano un dispendio elevato di risorse computazionali.
Disponibilità e reset delle quote per tutti gli sviluppatori
Gemini 3.5 Flash è accessibile tramite Google AI Studio, Android Studio e ovviamente Antigravity. Vale la pena ricordare che Antigravity è l’ambiente di sviluppo integrato alimentato dall’intelligenza artificiale di Google, disponibile in anteprima pubblica da novembre 2025 su Windows, macOS e Linux. La piattaforma consente agli sviluppatori di delegare compiti di programmazione complessi ad agenti AI autonomi, il che spiega perché il consumo di token diventa un tema così centrale nell’uso di tutti i giorni.
Un dettaglio importante: Gemini 3.5 Flash (Low) nasce specificamente per l’ambiente Antigravity e non risulta disponibile come opzione nell’app Gemini. Insieme al lancio del nuovo modello, Google ha anche azzerato i contatori di utilizzo su tutti i piani Gemini, sia gratuiti che a pagamento, garantendo così agli sviluppatori token sufficienti per lavorare durante la settimana in corso.
