Durante il keynote del Google I/O 2025, una dimostrazione ha lasciato il pubblico senza fiato. La società ha catturato l’attenzione con la traduzione vocale in tempo reale con intonazione, espressione e voce originale replicati fedelmente dall’intelligenza artificiale in Meet. Un interlocutore anglofono parlava, mentre la controparte ispanofona riceveva la traduzione simultanea con un doppiaggio AI che sembrava umano. Tono, inflessioni, ritmo: tutto era lì, vivo e naturale. Solo inglese e spagnolo sono al momento supportati da oogle Meet, ma l’annuncio dell’estensione imminente a italiano, tedesco e portoghese ha acceso l’interesse globale. Le parole, tradotte istantaneamente e restituite con voce sintetica indistinguibile dall’originale, cambieranno il modo in cui le persone lavorano, trattano, decidono. Non più sottotitoli, non più silenzi imbarazzanti, la fusione tra linguaggio e identità vocale segna una svolta nelle videocall con Google Meet.
Google Beam: oltre lo schermo, dentro la conversazione
Project Starline era un sogno nel 2021, ma ora Google mostra la realtà delle sue idee con Beam, un nuovo sistema per le videoconferenze. Presentato come piattaforma di comunicazione video 3D, punta a trasformare ogni chiamata in una esperienza immersiva. Il concetto di videocall cambia forma diventando tridimensionale, dando percezione di profondità e presenza fisica simulata. L’effetto? Come avere l’interlocutore nella stanza. Google Beam sfrutta sei telecamere e un display a campo di luce che restituisce l’immagine in 3D da ogni angolazione. L’AI elabora un modello video volumetrico che riproduce espressioni, movimenti, dettagli in tempo reale. A 60 fotogrammi al secondo, ogni gesto diventa vivido. Il dispositivo segue i movimenti della testa e adatta la prospettiva. L’illusione è perfetta. Le emozioni? Quasi tangibili. Google promette i primi dispositivi entro fine anno, destinati a clienti selezionati.
Nessun prezzo ufficiale, ma il confronto con Project Ghost di Logitech, limitato al 2D, parla chiaro: tra i 15.000 e i 20.000 dollari per una postazione base. Beam, invece, promette un salto sensoriale senza precedenti. L’integrazione tra voce e presenza, lingua e forma, suono ed espressione apre una nuova fase nella comunicazione digitale. Meet traduce e Beam mostra tutto senza filtri redendo la distanza solo un’illusione.
