Gemini ora crea video più realistici: tre foto bastano per guidare Veo

Gemini introduce la generazione video tramite immagini guida fino a tre foto per controllare Veo mantenendo coerenza di personaggi stile e ambienti nei piani AI Plus Pro e Ultra.

scritto da Felice Galluccio 2 Minuti lettura
Gemini

Google avvia la distribuzione di un aggiornamento rilevante per l’app Gemini, con l’obiettivo di migliorare l’esperienza nella generazione video tramite Veo. La novità introduce la possibilità di caricare fino a tre immagini che fungono da riferimento visivo, rendendo più semplice comunicare al modello ciò che si desidera ottenere. Questo approccio riduce la necessità di prompt lunghi e dettagliati, un limite evidente nelle versioni precedenti, e rafforza le capacità multimodali dell’app, sempre più centrali nell’evoluzione degli strumenti Google.

L’aggiornamento consente di utilizzare immagini che mostrano personaggi, oggetti, stili o ambientazioni. Veo interpreta questi riferimenti per mantenere coerenza visiva nel video generato, dando maggiore controllo al creatore e riducendo gli sforzi richiesti in fase di descrizione.

Personaggi coerenti, stile controllato e scenari più stabili

L’introduzione delle immagini guida offre tre vantaggi principali. Il primo riguarda i personaggi, perché permette di preservare tratti del volto, proporzioni del corpo e caratteristiche estetiche per tutta la sequenza. Il secondo interessa lo stile visivo, con elementi come texture, illuminazione, color grading e atmosfera trasferiti dalla foto al video. Il terzo ambito è il world-building, utile per ricreare ambienti coerenti con l’idea creativa e mantenere stabilità tra le varie scene prodotte.

Google ha mostrato un esempio pratico in cui tre immagini vengono combinate: i personaggi presenti nelle foto compaiono poi nel video in modo riconoscibile e armonioso, confermando gli obiettivi dell’aggiornamento. L’intenzione è semplificare la fase preparatoria, lasciando ampio margine alla personalizzazione.

L’update segue il recente rinnovamento del menu Tools su Android e iOS, che ora indica con chiarezza quale modello viene utilizzato per la generazione. Nel caso dei video, il riferimento è Veo 3.1, una versione migliorata nelle dinamiche di movimento e nella fluidità delle animazioni.

Disponibilità e piani compatibili

Il rollout è iniziato nelle ultime ore, con disponibilità completa prevista entro una settimana. La funzione sarà accessibile agli abbonati ai piani Google AI Plus, Pro e Ultra, in linea con la strategia dell’azienda che riserva le capacità più avanzate ai livelli premium del servizio.

Felice Galluccio

