La inteligencia artificial (IA) está en todos lados y ahora llega en una nueva herramienta llamada VALL-E de Microsoft, que solo necesita un poco de información vocal para comprender cómo replicar la voz de un usuario.
De acuerdo con el sitio web Digital Trends, lo más impresionante de VALL-E es que puede reproducir las emociones, los tonos vocales y el entorno acústico que se encuentran en cada muestra.
En GitHub, Microsoft ha creado una pequeña biblioteca de ejemplos creados con VALL-E. Los resultados muestran como reproduce el tono y el acento de las voces de los oradores con apenas escuchar la voz durante 3 segundos.
TE PUEDE INTERESAR: Este Es El Bisturí Inteligente Que Detecta Los Tumores
Más sobre VALL-E
- En un documento, Microsoft explica que VALL-E «puede conllevar riesgos potenciales en el mal uso del modelo, como falsificar la identificación de voz o hacerse pasar por un altavoz específico».
- Microsoft dice que «es posible construir un modelo de detección para discriminar si un clip de audio fue sintetizado por VALL-E».
- La compañía señala que utilizará sus propios principios de IA al desarrollar su trabajo. Estos principios cubren áreas como la equidad, la seguridad, la privacidad y la responsabilidad.
Foto: FOLOU.