Google continua a puntare molto sull’evoluzione di Gemini, con aggiornamenti frequenti pensati per migliorarne le capacità creative e pratiche. Tra le aree su cui l’azienda sta lavorando con maggiore insistenza c’è la gestione delle immagini: l’assistente AI permette già di generarle, modificarle e scaricarle tramite istruzioni testuali, ma non sempre descrivere a parole ciò che si vuole ottenere risulta immediato. Oggetti, ambientazioni e dettagli specifici rischiano talvolta di essere interpretati in modo impreciso dal modello.
Per risolvere questo limite, Google sta sperimentando una funzione di annotazione manuale direttamente all’interno dell’interfaccia di generazione immagini di Gemini. L’obiettivo è chiaro: offrire un controllo più diretto sul risultato finale, soprattutto quando la descrizione testuale da sola non basta a trasmettere tutte le indicazioni necessarie.
Come funzionano le annotazioni manuali
La novità è stata individuata dall’utente @testingcatalog su X, che ha condiviso alcune anticipazioni sul funzionamento dell’interfaccia. Secondo quanto osservato, gli utenti potranno disegnare o aggiungere note sulle immagini generate prima di procedere al download. Un approccio semplice, ma potenzialmente molto utile.
Si pensi, ad esempio, alla richiesta di un’immagine da colorare che debba contenere testi o simboli in punti specifici: invece di spiegare in modo dettagliato ogni elemento a parole, sarà possibile segnare manualmente dove inserirlo. Questo permette di ottenere un risultato più accurato e riduce la necessità di usare un software di editing esterno dopo il download.
Un processo più veloce e immediato
La possibilità di intervenire direttamente sull’immagine eliminerebbe uno dei passaggi più macchinosi. Molti utenti oggi generano l’immagine con Gemini, la scaricano e infine la modificano con un editor separato. Con le annotazioni integrate, il flusso di lavoro diventerebbe più rapido e coerente, favorendo soprattutto chi utilizza l’AI come supporto creativo quotidiano.
Non è ancora chiaro se, o quando, questa funzione arriverà in modo stabile per tutti. Trattandosi di una feature sperimentale, Google potrebbe modificarla, integrarla in altro modo o persino non rilasciarla al pubblico. Ciò non toglie che l’azienda continui a cercare soluzioni che rendano Gemini più flessibile e preciso, avvicinandolo alle esigenze reali di chi lavora con contenuti visivi.
