google-translate-Translatotron-nuova-tecnologia-traduzione-vocale-1-700x400

Interpretare e tradurre il discorso dal vivo è molto più complicato rispetto alla semplice elaborazione del testo scritto. Infatti, a differenza dei cervelli umani, le macchine dovrebbero tipicamente passare attraverso tre fasi distinte per convertire la comunicazione orale da una lingua all’altra.

Inizialmente, il discorso avrebbe dovuto essere interpretato dalla macchina e trascritto in testo, che sarebbe poi tradotto nel dialetto target, prima di essere inserito in un motore di sintesi vocale per essere pronunciato ad alta voce. Sebbene questo processo a cascata sia trasparente per l’utente e relativamente veloce, Google sta lavorando su un metodo speech-to-speech più naturale chiamato Translatotron.

Translatotron è una nuova tecnologia di Google

La nuova tecnologia non richiede l’elaborazione intermedia per la traduzione. L’interpretazione del parlato dal vivo non è qualcosa di nuovo, Google ha già reso disponibile la funzione nella sua app Translate dal 2011 e recentemente l’ha estesa ad Assistant. Microsoft ha ulteriormente migliorato il servizio consentendo la traduzione vocale in diretta nelle conversazioni Skype.

Tuttavia, queste funzioni in genere utilizzano l’elaborazione a cascata per portare a termine il lavoro. Poiché l’interpretazione diretta da speech-to-speech elimina gli intermediari, funziona più velocemente, riduce gli errori di interpretazione che potrebbero sorgere durante la conversione. Può persino ignorare le parole che non devono essere tradotte.

Ciò che è anche impressionante è che Translatotron può mantenere la voce dell’oratore originale nella lingua target, rendendolo più naturale. In realtà, questo esperimento è ancora in corso, anche se promettente. Ad esempio, i risultati attuali sono ancora sovraperformati dalla tradizionale traduzione a cascata, alcuni dei quali completamente incomprensibili.

Inoltre, mentre Translatotron può imitare la voce dell’oratore originale, sembra molto robotico, innaturale e lento. Teniamo presente che la traduzione diretta da parlato a parlato è ancora nelle sue prime fasi di sviluppo, ma è incoraggiante e potrebbe rendere più facile superare le barriere linguistiche.

Articolo precedenteMeizu 16Xs, ecco la dotazione hardware e le prime immagini
Articolo successivoOppo K3 verrà annunciato ufficialmente il prossimo 23 Maggio