Google avvia la distribuzione di un aggiornamento rilevante per l’app Gemini, con l’obiettivo di migliorare l’esperienza nella generazione video tramite Veo. La novità introduce la possibilità di caricare fino a tre immagini che fungono da riferimento visivo, rendendo più semplice comunicare al modello ciò che si desidera ottenere. Questo approccio riduce la necessità di prompt lunghi e dettagliati, un limite evidente nelle versioni precedenti, e rafforza le capacità multimodali dell’app, sempre più centrali nell’evoluzione degli strumenti Google.
L’aggiornamento consente di utilizzare immagini che mostrano personaggi, oggetti, stili o ambientazioni. Veo interpreta questi riferimenti per mantenere coerenza visiva nel video generato, dando maggiore controllo al creatore e riducendo gli sforzi richiesti in fase di descrizione.
Personaggi coerenti, stile controllato e scenari più stabili
L’introduzione delle immagini guida offre tre vantaggi principali. Il primo riguarda i personaggi, perché permette di preservare tratti del volto, proporzioni del corpo e caratteristiche estetiche per tutta la sequenza. Il secondo interessa lo stile visivo, con elementi come texture, illuminazione, color grading e atmosfera trasferiti dalla foto al video. Il terzo ambito è il world-building, utile per ricreare ambienti coerenti con l’idea creativa e mantenere stabilità tra le varie scene prodotte.
Google ha mostrato un esempio pratico in cui tre immagini vengono combinate: i personaggi presenti nelle foto compaiono poi nel video in modo riconoscibile e armonioso, confermando gli obiettivi dell’aggiornamento. L’intenzione è semplificare la fase preparatoria, lasciando ampio margine alla personalizzazione.
L’update segue il recente rinnovamento del menu Tools su Android e iOS, che ora indica con chiarezza quale modello viene utilizzato per la generazione. Nel caso dei video, il riferimento è Veo 3.1, una versione migliorata nelle dinamiche di movimento e nella fluidità delle animazioni.
Disponibilità e piani compatibili
Il rollout è iniziato nelle ultime ore, con disponibilità completa prevista entro una settimana. La funzione sarà accessibile agli abbonati ai piani Google AI Plus, Pro e Ultra, in linea con la strategia dell’azienda che riserva le capacità più avanzate ai livelli premium del servizio.
