Gemini

Google continua ad arricchire le funzionalità dell’assistente Gemini, che ora è in grado di analizzare video caricati dagli utenti per fornire risposte pertinenti e dettagliate. La nuova funzione è disponibile in Gemini Advanced, l’abbonamento premium del servizio, e rappresenta un ulteriore passo avanti nell’integrazione tra intelligenza artificiale e contenuti multimediali.

Analisi video via caricamento: ecco come funziona

La nuova capacità permette agli utenti di caricare file video direttamente nell’interfaccia di Gemini, che può poi analizzarne il contenuto e rispondere a domande specifiche su quanto mostrato nella clip. È possibile caricare file nei formati più comuni, come .mp4 e .mov, anche direttamente da Google Drive.

Durante l’analisi, Gemini è in grado di:

Descrivere ciò che accade nel video, scena per scena.

Identificare oggetti, testi e contesti visivi presenti nelle immagini.

Rispondere a quesiti diretti (es. “quante persone compaiono?”, “qual è il marchio della macchina mostrata?”, “cosa dice il cartello?”).

Questa nuova funzionalità amplia ulteriormente il campo d’uso dell’IA di Google, passando da immagini e testi a video dinamici, con un’elaborazione multimodale sempre più avanzata.

Al momento, il caricamento e l’analisi dei video è limitato agli utenti Gemini Advanced, ovvero coloro che hanno sottoscritto il piano a pagamento di Google One. È necessario accedere con un account supportato e caricare video che rispettino le norme sui contenuti di Google.

I risultati forniti da Gemini sono contestualizzati e dettagliati, anche se alcuni video troppo lunghi o complessi possono richiedere tempi di elaborazione più lunghi o fornire risposte parziali. Non è ancora disponibile una funzionalità di sottotitolazione automatica, ma l’analisi visiva e semantica è già avanzata.

Con l’introduzione del caricamento video, Gemini si avvicina a diventare una piattaforma di assistenza visiva multimodale completa, in grado di comprendere e interpretare testo, immagini e ora anche video. Questa evoluzione apre nuovi scenari applicativi, dalla formazione al supporto tecnico, passando per l’analisi di contenuti multimediali complessi. La possibilità di porre domande specifiche su un video caricato rappresenta un potente strumento per creator, professionisti e studenti, che potranno ottenere insight rapidi e pertinenti anche su materiale audiovisivo.