‘Fugatto’: el nuevo generador de audio con IA de Nvidia

Nvidia lanzó este lunes ‘Fugatto’, una Inteligencia Artificial capaz de crear música, sonidos y voces a partir de descripciones de texto y audio. Lo innovador es que puede generar sonidos nunca antes escuchados, como un trombón que ladra o un saxofón que maúlla.

Según Nvidia, la aplicación también puede modificar voces, cambiar acentos y emociones, y ajustar melodías. Es útil para productores de música, cine, videojuegos y publicidad, permitiendo personalizar voces y efectos de sonido de manera rápida.

Aunque aún no está disponible al público, ‘Fugatto’ promete cambiar la creación de contenido al permitir la generación de sonidos únicos que nunca antes han sido entrenados en su sistema.

TE PUEDE INTERESAR: Sony trabaja en una nueva consola portátil para juegos de PS5: qué sabemos

Funciones clave de Fugatto

  • Modificación de melodías. Esta función convierte una melodía tocada en piano en una voz humana cantando, lo que transforma una pieza instrumental en una interpretación vocal que sigue el mismo ritmo y armonía.
  • Creación de música por texto. Permite generar fragmentos musicales a partir de descripciones escritas, como ‘una melodía suave con piano y cuerdas’, facilitando la creación musical sin necesidad de conocimientos técnicos avanzados.
  • Edición de música existente. Los usuarios pueden modificar canciones ya grabadas, añadiendo o eliminando instrumentos, o ajustando la tonalidad, lo que ofrece flexibilidad para adaptar una canción a nuevas necesidades sin rehacerla por completo.
  • Intervención en la voz. Esta herramienta facilita cambiar la emoción en una grabación, ajustando el tono y la expresión vocal. Por ejemplo, una voz puede hacerse sonar más calmada o más agresiva según el efecto que se quiera lograr.
  • Generación de efectos de sonido complejos. Esta función permite generar efectos detallados y específicos, como el sonido de un monstruo despertando o una máquina activándose, creando ambientes sonoros realistas y personalizados.
  • Personalización en videojuegos. En los videojuegos, se pueden adaptar los efectos de sonido y las voces de los personajes según las acciones del jugador, lo que permite una experiencia sonora más inmersiva y dinámica.
  • Combinación de múltiples comandos. Los usuarios pueden combinar diferentes descripciones, como ‘una voz en inglés con acento español y tono triste’, para generar resultados más específicos y personalizados según sus necesidades.
  • Creación de efectos sonoros 3D. Los efectos 3D cambian según la perspectiva del oyente, como el sonido de la lluvia que se aleja o se acerca.
  • Efectos interactivos para contenido multimedia. Esta función permite ajustar la música y los efectos de sonido en tiempo real según las acciones de los usuarios, lo que es ideal para experiencias interactivas como la realidad virtual.

Foto: Freepik.

Deja una respuesta