La frontera de la creatividad generativa se ha expandido una vez más. Tras el impacto visual de herramientas como Nano Banana y Veo, Google lanzó Lyria 3. Este nuevo modelo de inteligencia artificial (IA), integrado directamente en el ecosistema de Gemini, permite a los usuarios convertir conceptos abstractos, fotografías e incluso videos en piezas musicales de alta fidelidad.
Desarrollado por la división DeepMind, Lyria 3 no es solo un generador de melodías; es un compositor multimodal que entiende el contexto visual y emocional para crear bandas sonoras personalizadas de hasta 30 segundos.
A diferencia de otros generadores que se limitan al texto, la gran innovación de Lyria 3 radica en su capacidad para ‘leer’ archivos multimedia. El proceso es intuitivo: el usuario sube una imagen —por ejemplo, un perro corriendo por un bosque— y la IA analiza los elementos, los colores y el ‘ambiente’ para componer una pista que incluya instrumentos y letras que narren la escena.
TE PUEDE INTERESAR: Spotify se une a SeatGeek para vender boletos de conciertos
Características principales de Lyria 3
- Generación a partir de descripciones de texto, imágenes estáticas o clips de video.
- El modelo no solo crea la base rítmica, sino que escribe y canta letras coherentes con el tema solicitado.
- Google promete pistas de ‘alta fidelidad’, aptas para ser compartidas en redes sociales o utilizadas en proyectos creativos.
- Los usuarios pueden utilizar pistas existentes como base y modificarlas mediante sugerencias, similar a la edición de ‘Gems’ en el entorno de Gemini.
- Uno de los puntos más relevantes de este lanzamiento es la seguridad y el respeto a la propiedad intelectual. Google usa SynthID que añade una marca de agua invisible a las creaciones de audio.
- Lyria 3 ya está disponible para los usuarios de la versión de escritorio de Gemini de forma gratuita.
- Google ha confirmado que la función llegará a las aplicaciones móviles de iOS y Android en los próximos días a nivel global.
Foto: Google DeepMind.
