Come dicevamo, Microsoft ha presentato il modello VALL-E, che utilizza la tecnologia EnCodec per scomporre la voce in blocchi di informazioni, chiamati token, sulla base dei quali vengono sintetizzate lunghezze d’onda per ricostruire una nuova voce artificiale simile all’originale. Ciò vale a dire che questa tecnologia potrebbe essere utilizzata per creare audio falsi e diffondere disinformazione. È importante quindi considerare le possibili conseguenze negative di questa tecnologia e prendere le precauzioni necessarie per evitare abusi.