FOLOU

Gemini Omni: crea y transforma videos con lenguaje natural 

Durante el Google I/O se anunció el lanzamiento de Gemini Omni, la tecnología más avanzada de la compañía en el terreno de la inteligencia artificial (IA) multimodal. El modelo combina la capacidad de razonamiento profundo característica de la familia Gemini con la facultad de generar y transformar secuencias de vídeo de alta calidad a partir de cualquier combinación de estímulos, marcando un hito en la creación de contenido digital.

La suite debuta con Gemini Omni Flash, un motor optimizado que expande el legado fotográfico de Nano Banana. A diferencia de las herramientas tradicionales aisladas, Gemini Omni es un sistema multimodal nativo que procesa simultáneamente audio, imágenes, vídeo y texto para fusionarlos en una única respuesta audiovisual cohesionada.

La tecnología ya ha comenzado su distribución global y promete redefinir los flujos de trabajo en industrias creativas, la producción de formatos cortos y el desarrollo de explicaciones visuales complejas para el sector educativo.

TE PUEDE INTERESAR: Gemini 3.5 Flash: más rápida y eficiente en tareas de codificación

Esto es lo que puede hacer Gemini Omni

Avatares digitales y el protocolo de seguridad SynthID

Calendario de despliegue y accesibilidad

El lanzamiento de Gemini Omni Flash se ha estructurado de forma inmediata y masiva para diferentes perfiles de usuario:

Foto: Google. 

Salir de la versión móvil