Google prepara una piccola rivoluzione nell’interazione con le immagini. Con la versione 16.42.61 dell’app Gemini, emergono strumenti che permettono agli utenti di evidenziare o disegnare direttamente sulle foto prima di sottoporle all’analisi dell’intelligenza artificiale. Un passo avanti che mira a rendere la comunicazione uomo-macchina più intuitiva e naturale.
Fino a oggi, Gemini ha analizzato le immagini nella loro interezza, senza distinguere tra dettagli o aree di interesse. Questo limite riduceva la precisione dei risultati in tutti quei casi in cui l’attenzione dell’AI doveva concentrarsi su un particolare elemento visivo. Con il nuovo sistema di markup, invece, l’utente potrà indicare esattamente dove dirigere l’analisi, cerchiando o colorando le aree importanti. L’interfaccia, ancora in fase di test, consente già la scelta di diversi colori e strumenti di disegno.
Oltre al markup intelligente ci sarà l’integrazione con Nano Banana e nuovi scenari d’uso
Anche senza comandi testuali, Gemini interpreta automaticamente le zone evidenziate come punti d’interesse, offrendo un controllo più mirato e semplificando l’esperienza d’uso. È un modo nuovo di dialogare con l’intelligenza artificiale, che imita il modo umano di comunicare: indicare, mostrare, sottolineare.
La funzione di markup non sarà un’aggiunta isolata. Google intende integrarla con Nano Banana, il sistema di editing basato su AI che consente di modificare o ripulire le immagini in pochi gesti. Basterà evidenziare la porzione indesiderata di una foto e dare un comando a Gemini per rimuoverla o modificarla, senza passare da app di fotoritocco complesse.
Si tratta di un’evoluzione importante per professionisti e utenti comuni. Tecnici e designer potranno eseguire analisi dettagliate su componenti visive specifiche, studenti potranno evidenziare elementi didattici nelle immagini. Mentre chi usa Gemini per curiosità quotidiana otterrà risposte più precise su oggetti o dettagli fotografici.
Sebbene l’interfaccia finale possa ancora cambiare, la direzione è chiara. Gemini si sta trasformando in uno strumento più flessibile, interattivo e umano. La possibilità di orientare l’attenzione dell’AI su punti specifici non solo migliora l’efficacia dell’analisi, ma rende la tecnologia più comprensibile e accessibile. Un piccolo gesto, come disegnare un cerchio su un’immagine, potrebbe presto diventare la nuova lingua universale per dialogare con l’intelligenza artificiale.