News

Intelligenza artificiale: Arriva Whisper, che converte l’audio in testi elaborati

L’intelligenza artificiale e gli studi ad essa associati, risultano essere uno degli argomenti principali su cui verte la ricerca tecnologica nell’ultimo periodo.
Infatti, è proprio su questi studi che si concentra l’ attività di Open IA, l’ azienda che, senza alcuno scopo di lucro, si dedica allo sviluppo dell’intelligenza artificiale e delle sue numerose potenzialità.
È ad Open IA che si devono progetti come Big chat di Microsoft e chat GPT.
Tuttavia, esse non sono le uniche tecnologie che sfruttano le potenzialità dell’intelligenza artificiale. Infatti, nel 2022, assistiamo al lancio di Whisper.

L’intelligenza artificiale e l’app Whisper

Whisper, è un’applicazione per dispositivi mobile, la cui traduzione dall’inglese significa appunto “sussurro“, un nome che sembra definire esattamente la funzione dell’app. Whisper è infatti in grado di trascrivere sotto forma di testo, in maniera precisa e rapida, qualsiasi file audio e/o video, ed è in grado di rilevare  più di 100 lingue.
Si tratta, infatti, di un app per il  riconoscimento vocale automatico. All’applicazione è stato sottoposto un database di 680.000 ore

tra attività multitasking e multilingue.
In questo modo, l’app sarebbe in grado di trascrivere un audio o un qualsiasi testo vocale con estrema precisione, facendo molta attenzione all’eliminazione dei rumori di fondo, che possono compromettere la limpidità e la comprensione dell’audio. Inoltre, è anche in grado di rispettare ed applicare la giusta punteggiatura, di comprendere il linguaggio tecnico e di tradurre una molteplicità di lingue. Tutto questo grazie ai continui sviluppi dell’intelligenza artificiale.

Whisper: come funziona?

Il funzionamento tecnico di Whisper risulta essere molto semplice, infatti una volta caricato sulla piattaforma, il file audio e/o video che si intende far trascrivere dall’app automaticamente, viene diviso in singole sezioni di 30 secondi ognuna. In questo modo, è come se ci si concentrasse su una piccola porzione di testo alla volta. Procede inoltre, con la traduzione della trascrizione in inglese dopodiché lo converte nella lingua riconosciuta se essa è presente nel database dell’app. È possibile utilizzare  Whisper direttamente dal browser grazie a Replicate, l’ azienda che senza scopi di lucro che fornisce servizi hosting.
Replicate infatti, è una  una piattaforma che consente di semplificare l’ utilizzo dell’intelligenza artificiale, senza che vi sia la necessità di particolari competenze informatiche.

Condividi
Pubblicato da
Ilenia Violante