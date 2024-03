Basteranno clip audio di soli 15 secondi e Voice Engine sarà in grado di clonare la voce umana di chiunque permettendo la lettura ad alta voce dei testi e la personalizzazione della lingua utilizzata per la riproduzione.

La piattaforma di OpenAi, i cui lavori di messa a punto hanno avuto inizio nel 2022, è adesso disponibile ma l’accesso è limitato per motivi riguardanti principalmente la sicurezza degli utenti.

Voice Engine di OpenAi è la piattaforma che clona la voce umana!

I rischi legati alla possibilità che malintenzionati possano clonare la voce di altri individui per realizzare tentativi di frode e che le aziende sfruttino la tecnologia in maniera illecita sono numerosi ma OpenAi dichiara di aver momentaneamente limitato all’accesso ad alcune aziende partner, le quali dovranno rispettare determinate norme e quindi richiedere il consenso prima di clonare la voce e permettere a chiunque di conoscere la natura del prodotto ascoltato. Voice Engine, infatti, utilizzerà un sistema di watermark, letteralmente una filigrana digitale, che permetterà di tracciare la provenienza delle clip audio realizzate e i suoi utilizzi.

OpenAI ha comunque reso nota la volontà di introdurre la nuova tecnologia su ChatGPT per consentire agli utenti l’utilizzo di funzionalità riguardanti la lettura ad alta voce, che potrebbero essere sfruttate soprattutto nel settore del doppiaggio. Voice Engine è un servizio a pagamento, il cui costo ufficiale non è stato ancora annunciato ma in base a quanto dichiarato da TechCrunch è prevista una spesa di 15,00 dollari per la lettura di un milione di caratteri.

L’applicazione di sistemi di intelligenza artificiale in grado di clonare la voce umana implica per sua natura dei rischi da non sottovalutare ma un aspetto interessante evidenziato dalla stessa OpenAI riguarda la possibilità di sfruttare i risultati ottenuti per permettere a quegli utenti che hanno perso la voce di poter esprimersi riproducendo dei testi generati grazie all’ascolto di una breve clip di soli 15 secondi. Staremo a vedere quali saranno i risultati prodotti dall’arrivo di tecnologie sempre più sofisticate!