Google I/O 2025: IA Veo 3 puede generar videos con sonido

Durante Google I/O 2025, la compañía presentó sus más recientes innovaciones en generación de medios con inteligencia artificial (IA). Entre ellas destaca Veo 3, el primer modelo de Google capaz de generar videos con sonido, mejorando la sincronización de labios y la física del mundo real.

Según la compañía, Veo 3 permite crear escenas con sonidos ambientales, como el canto de pájaros o el tráfico de una ciudad. Actualmente, está disponible para suscriptores de Gemini Ultra en EE. UU. dentro de la aplicación Gemini y para usuarios empresariales en Vertex AI. 

Por otra parte, Google también presentó Imagen 4, su nuevo modelo de generación de imágenes, que destaca por su capacidad de representar texturas detalladas, como telas y pelaje de animales, con gran claridad. Además, mejora la representación de tipografía y permite crear imágenes en resoluciones de hasta 2K.

TE PUEDE INTERESAR: Google integra Gemini AI en Chrome para mejorar la navegación: ¿cómo funciona?

Qué puede hacer Veo 3 de Google

  • Por primera vez, este trabajo es capaz de generar vídeos con audio sincronizado: desde el bullicio de una calle hasta el canto de los pájaros en un parque o diálogos realistas entre personajes. 
  • Su comprensión avanzada permite transformar descripciones textuales en clips que capturan fielmente la intención creativa, con una física realista y sincronización labial precisa.
  • Actualmente, Veo 3 está disponible para suscriptores Ultra en Estados Unidos a través de la app Gemini y en Flow, además de ofrecerse a empresas mediante Vertex AI.

Lyria 2: exploración musical sin límites

  • En el ámbito del sonido, Lyria 2 potencia el Music AI Sandbox, un entorno experimental para músicos, productores y compositores. 
  • Ofrece herramientas para explorar nuevas ideas y estilos, con el respaldo de la industria musical para asegurar que la IA empodera a los creadores.
  • Lyria 2 está disponible para creadores en YouTube Shorts y empresas a través de Vertex AI.
  • Lyria RealTime, el modelo interactivo de generación musical, ya se puede usar mediante API y en AI Studio, permitiendo crear y controlar música generativa en tiempo real.

SynthID Detector: un identificación de contenido generado por IA

  • Para ayudar a identificar contenido creado con IA, Google lanzó SynthID Detector, un portal donde los usuarios pueden subir imágenes o videos para verificar si contienen SynthID, la herramienta de marca de agua de Google para arte generado por IA.

Foto: Google. 

Deja una respuesta