OpenAI anunció Voice Engine, su nueva Inteligencia Artificial (IA) generativa capaz de clonar cualquier voz, con solo escucharla 15 segundos.
Tras dos años de desarrollo, Voice Engine ha sido entrenada con grabaciones de voz licenciadas, y bases de datos públicas.
De acuerdo con OpenAI, Voice Engine se desarrolló a finales de 2022 y se ha utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así como ChatGPT Voice y Read Aloud, pero es ahora cuando salen a relucir los primeros y prometedores datos de lo que es capaz la tecnología de la compañía.
La tecnología tiene un gran campo de usos posibles, aunque la compañía la está probando a una escala bastante reducida, al menos de momento.
TE PUEDE INTERESAR: Cómo Usar Google Lens En El Escritorio
Cómo funciona Voice Engine
- OpenAI cita situaciones en las que Voice Engine puede suponer un enorme salto. Por ejemplo, la traducción de contenido como videos y podcasts, para que los creadores y las empresas puedan llegar a más personas en todo el mundo, con fluidez y con sus propias voces.
- Según OpenAI, cuando se utiliza para traducir, Voice Engine conserva el acento nativo del hablante original. Por ejemplo, generar inglés con una muestra de audio de un hablante francés produciría habla con acento francés.
- Entre los usos que ha destacado la empresa está el de asistir a personas con algún tipo de discapacidad en la lectura de textos o a la hora de enseñar a niños.
- Laempresa explica que también tiene un gran uso en la traducción y el aprendizaje de nuevos idiomas. Las voces creadas no solo sirven en el idioma en el que han sido entrenadas, sino que pueden ser usadas para leer o hablar en otros idiomas, pero manteniendo las características de dichas voces.
Cómo usar Voice Engie
- A día de hoy, el reducido grupo que está probando (y usando comercialmente) Voice Engine han aceptado una serie de medidas para evitar los problemas derivados de esta tecnología.
- OpenAI prohíbe explícitamente la suplantación de otro individuo u organización sin consentimiento o derecho legal.
- Su uso requiere el consentimiento explícito e informado del hablante original. En este caso no permiten a los desarrolladores que creen herramientas para que los usuarios individuales creen sus propias voces.
Foto: BroneArtUlm en Pixabay