Google ha presentato un’importante novità per il settore dell’intelligenza artificiale. In particolare, l’azienda di Mountain View, durante il suo evento I/O 2025, ha presentato le innovazioni applicate alla creazione audiovisiva. La novità in questione è Veo 3, il nuovo modello di generazione video che introduce, per la prima volta, una componente audio completamente integrata e sincronizzata. La caratteristica che rende Veo 3 innovativo è la sua capacità di generare suoni ambientali, effetti sonori e persino dialoghi perfettamente coerenti con le scene prodotte visivamente. Un salto tecnologico reso possibile grazie alle ricerche portate avanti da Google DeepMind nel campo del “video-to-audio AI”.
Google presenta Veo 3: come funziona il nuovo modello?
Demis Hassabis, CEO di DeepMind, ha commentato la presentazione soffermandosi sull’abbandono dell’era “muta” per i video AI. Con Veo 3, infatti, è possibile fornire un prompt testuale dettagliato che descrive non solo la scena e i personaggi, ma anche i dialoghi e il tono vocale. Lasciando che il modello di Google si occupi della completa organizzazione audiovisiva.
I risultati sono stati giudicati spettacolari da molti osservatori. I video generati da Google Veo 3 hanno iniziato a circolare su piattaforme come YouTube e TikTok, lasciando sbalorditi per il livello di realismo raggiunto. In alcuni casi, distinguere tra materiale reale e contenuto AI è diventato estremamente difficile. Sollevando nuove domande sull’impatto sociale e culturale di tali tecnologie. Veo 3 è accessibile tramite l’app Gemini, ma solo per chi sottoscrive il piano AI Ultra, al costo di 249,99 dollari mensili. Una scelta che, almeno inizialmente, rende il prodotto esclusivo per professionisti e aziende con risorse adeguate.
All’interno dello stesso evento, Google ha anche svelato Flow, un sistema di filmmaking assistito da AI pensato per collaborare con i modelli più evoluti dell’ecosistema. Ovvero Veo per i video, Imagen per la grafica e Gemini per la parte linguistica. Flow consente agli utenti di costruire clip partendo da una semplice descrizione scritta, combinando asset esistenti e contenuti generati in tempo reale. Al momento, è disponibile solo per gli abbonati AI Pro e AI Ultra negli Stati Uniti. Ma presto Google potrebbe espandere tale sistema.
