Meta ha presentado una nueva herramienta de inteligencia artificial (IA) llamada SAM Audio, diseñada para separar cualquier sonido de grabaciones complejas usando simples descripciones de texto. Esta tecnología permite a los usuarios aislar voces, instrumentos o ruidos de fondo sin necesidad de usar programas de edición complicados. La herramienta ya está disponible en la plataforma Segment Anything Playground de Meta.
SAM Audio funciona con tres tipos de indicaciones: texto, selecciones visuales y marcas de tiempo. Los usuarios pueden escribir lo que quieren extraer, hacer clic en un objeto en un video para identificar el sonido deseado, o señalar cuándo aparece ese sonido. El sistema utiliza el motor Perception Encoder Audiovisual de Meta, que reconoce y entiende los sonidos antes de separarlos del resto de la mezcla. Además, incluye SAM Audio-Bench, un sistema de evaluación para medir la calidad de la separación de audio.
Esta innovación es importante porque facilita tareas como la producción musical, la creación de podcasts o la edición de películas. Aunque tiene limitaciones, como la incapacidad de manejar indicaciones basadas en audio o separar sonidos muy similares, Meta planea mejorarla. La empresa también explora aplicaciones prácticas, como colaboraciones con fabricantes de audífonos para mejorar la accesibilidad auditiva.
TE PUEDE INTERESAR: Google lanza Gemini 3 Flash: velocidad y precisión en la búsqueda por IA
Qué debes saber
- SAM Audio puede separar casi cualquier sonido de una grabación compleja.
- Funciona con indicaciones de texto, selecciones visuales y marcas de tiempo.
- Es útil para música, podcasts, cine y aplicaciones de accesibilidad.
- No maneja indicaciones de audio ni separa sonidos muy similares.
- Meta planea mejorar la herramienta y explorar usos prácticos.
Especificaciones técnicas
- Compatible con texto, selecciones visuales y marcas de tiempo.
- Incluye SAM Audio-Bench para evaluar la calidad del audio separado.
- Funciona más rápido que el tiempo real, incluso a gran escala.
Contenido generado con IA y editado por el equipo editorial.
Foto: Meta.
