Les scientifiques de Microsoft ont révélé "VALL-E", une intelligence artificielle capable de reproduire la voix de n'importe quel individu après l'avoir écoutée pendant seulement trois secondes. Le résultat est aussi remarquable que troublant. En reproduisant la voix d'une personne après l'avoir écoutée, l'IA de Microsoft peut "parler à sa place" tout en conservant le ton, les sentiments et l'ambiance sonore de la personne. Les inventeurs de VALL-E restent cependant prudents.
Chez Microsoft, VALL-E est connu sous le nom de "modèle de langage à codecs neuronaux". L'IA est un modèle de synthèse vocale capable de générer de la parole. Ce n'est pas nouveau, mais VALL-E se distingue par la rapidité de son apprentissage - il ne prend que trois secondes - et son aptitude à imiter les sentiments de son interlocuteur.
Les résultats de la technologie "VALL-E" peuvent être très variés. Alors que certains émulent une voix humaine réaliste, d'autres semblent avoir été créés par un robot. Ce n'est que le début de cette technologie, qui peut encore être améliorée au fil du temps. Il convient de noter que les échantillons ne durent que trois secondes. Avec plus de données, l'IA nommée VALL-E serait en mesure de générer des résultats plus crédibles.
Microsoft n'a pas mis le code de l'IA à la disposition du public en raison d'une éventuelle mauvaise utilisation de la technologie. Par conséquent, il n'est pas possible de tester l'IA pour le moment.