Google lanzó Veo 3.1, su modelo de generación de video impulsado por inteligencia artificial (IA) que ahora permite convertir imágenes en clips animados con mayor fidelidad a los prompts y, por primera vez, con audio sincronizado.
Esta actualización ya está disponible a través de la API Gemini y potencia directamente el editor Flow, una herramienta pensada para creadores que buscan control narrativo y precisión visual.
Veo 3.1 se presentó como una mejora sustancial respecto a Veo 3, lanzado durante Google I/O 2025. Según la compañía, el nuevo modelo ofrece una mejor ‘adherencia al prompt’, lo que significa que interpreta con mayor precisión las instrucciones escritas y los elementos visuales que se le proporcionan. Además, permite generar audio simultáneamente al video, una capacidad que no estaba disponible en versiones anteriores.
TE PUEDE INTERESAR: YouTube lanza herramientas para el bienestar mental de adolescentes
Veo 3.1 y Veo 3.1 Fast
- Google afirma que estos nuevos modelos ahora pueden generar mejor audio nativo, que incluye conversaciones naturales y efectos de sonido sincronizados.
- Los desarrolladores ahora pueden aprovechar la mejor comprensión de los estilos cinematográficos.
- Google afirma que estos modelos ahora mantienen una mayor consistencia de los personajes en múltiples escenas.
- La nueva versión de Veo incluirá algunas funciones que quizás reconozcas si ya has usado Flow, el programa de creación de películas con IA de Google.
- La función ‘Ingredientes para video’ te permitirá subir recursos separados que Veo combinará en el video final. También podrás agregar objetos a recursos existentes, y próximamente podrás eliminarlos, una función muy necesaria.
- La compañía presentó nuevas formas para que los desarrolladores guíen mejor los modelos de Veo 3.1.
- En primer lugar, pueden proporcionar hasta tres imágenes de referencia de un personaje, objeto o escena. Esto permitirá que el modelo mantenga una mayor consistencia del personaje en múltiples tomas.
- En segundo lugar, la nueva función de extensión de escenas permitirá a los desarrolladores crear vídeos más largos generando nuevos clips que se conectan con el vídeo anterior. Anteriormente, los desarrolladores solo podían crear vídeos de 30 segundos.
- Por último, los desarrolladores ahora pueden proporcionar una imagen inicial y una final y pedirle a Veo 3.1 que genere la transición entre ellas junto con el audio.
- Los desarrolladores pueden acceder a los modelos Veo 3.1 y Veo 3.1 Fast a través de la API de Gemini en Google AI Studio y Vertex AI.
- Los usuarios pueden acceder a Veo 3.1 tanto a través de la app de Gemini como de Flow.
Foto: Google.