FOLOU

Vasa-1, la IA de Microsoft que puede crear videos de personas a partir de una foto

Microsoft Research Asia, una división de la compañía fundada por el gigante informático, presentó Vasa-1. Se trata de un modelo de Inteligencia Artificial (IA) que puede crear un video animado sincronizado de una persona hablando o cantando a partir de una sola foto y una pista de audio existente.

Vasa-1 tiene la capacidad de generar expresiones faciales y movimientos de cabeza para una imagen fija existente y los movimientos de labios apropiados para que coincidan con un discurso o una canción.

Según explican sus creadores, Vasa-1 (abreviatura de ‘Visual Affective Skills Animator’, o ‘Animador de Habilidades Afectivas Visuales’ en español) toma el retrato de una persona y hace que literalmente hable, produciendo una muy convincente sincronización entre sus labios y el archivo de audio que se desee. 

Además, captura un amplio espectro de matices faciales y movimientos naturales de la cabeza que contribuyen a la percepción de autenticidad y vivacidad.

TE PUEDE INTERESAR: MathGPT: Conoce La IA Que Resuelve Problemas Matemáticos

Cómo funciona Vasa-1

Vasa-1 está en pruebas

https://folou.co/wp-content/uploads/2024/04/o1.mp4

Foto: Microsoft.

Salir de la versión móvil