Google lanza Veo 3.1: generación de video más precisa y con audio integrado

Google lanzó Veo 3.1, su modelo de generación de video impulsado por inteligencia artificial (IA) que ahora permite convertir imágenes en clips animados con mayor fidelidad a los prompts y, por primera vez, con audio sincronizado. 

Esta actualización ya está disponible a través de la API Gemini y potencia directamente el editor Flow, una herramienta pensada para creadores que buscan control narrativo y precisión visual.

Veo 3.1 se presentó como una mejora sustancial respecto a Veo 3, lanzado durante Google I/O 2025. Según la compañía, el nuevo modelo ofrece una mejor ‘adherencia al prompt’, lo que significa que interpreta con mayor precisión las instrucciones escritas y los elementos visuales que se le proporcionan. Además, permite generar audio simultáneamente al video, una capacidad que no estaba disponible en versiones anteriores.

TE PUEDE INTERESAR: YouTube lanza herramientas para el bienestar mental de adolescentes

Veo 3.1 y Veo 3.1 Fast

  • Google afirma que estos nuevos modelos ahora pueden generar mejor audio nativo, que incluye conversaciones naturales y efectos de sonido sincronizados. 
  • Los desarrolladores ahora pueden aprovechar la mejor comprensión de los estilos cinematográficos. 
  • Google afirma que estos modelos ahora mantienen una mayor consistencia de los personajes en múltiples escenas.
  • La nueva versión de Veo incluirá algunas funciones que quizás reconozcas si ya has usado Flow, el programa de creación de películas con IA de Google. 
  • La función ‘Ingredientes para video’ te permitirá subir recursos separados que Veo combinará en el video final. También podrás agregar objetos a recursos existentes, y próximamente podrás eliminarlos, una función muy necesaria. 
  • La compañía presentó nuevas formas para que los desarrolladores guíen mejor los modelos de Veo 3.1.
    • En primer lugar, pueden proporcionar hasta tres imágenes de referencia de un personaje, objeto o escena. Esto permitirá que el modelo mantenga una mayor consistencia del personaje en múltiples tomas.
    • En segundo lugar, la nueva función de extensión de escenas permitirá a los desarrolladores crear vídeos más largos generando nuevos clips que se conectan con el vídeo anterior. Anteriormente, los desarrolladores solo podían crear vídeos de 30 segundos. 
    • Por último, los desarrolladores ahora pueden proporcionar una imagen inicial y una final y pedirle a Veo 3.1 que genere la transición entre ellas junto con el audio.
  • Los desarrolladores pueden acceder a los modelos Veo 3.1 y Veo 3.1 Fast a través de la API de Gemini en Google AI Studio y Vertex AI. 
  • Los usuarios pueden acceder a Veo 3.1 tanto a través de la app de Gemini como de Flow.

Foto: Google.

Deja una respuesta