Gladia: la IA que convierte cualquier audio en texto en tiempo real

Gladia es una startup francesa de IA que quiere cambiar la forma en que las empresas interactúan con los datos de audio. 

En este sentido, la compañía desarrolló una interfaz de programación de aplicaciones (API) de transcripción de audio que se puede integrar con otros productos y que, según sus desarrolladores, funciona mucho mejor que lo que está disponible en el mercado. 

Según el sitio web TechCrunch, la versión estándar sigue siendo bastante lenta, por lo que Gladia ha dedicado mucho tiempo a convertir Whisper en un modelo de transcripción rápido y receptivo. 

Los desarrolladores dicen que Gladia también cuenta con algunos algoritmos de preprocesamiento y postprocesamiento que mejoran los resultados finales.

TE PUEDE INTERESAR: WhatsApp: Podrás Silenciar Llamadas De Números Desconocidos

Más sobre Gladia

  • Gladia se basa en Whisper, el modelo de transcripción de código abierto de OpenAI. 
  • La startup dice que esta base tecnológica desbloquea nuevos casos de uso en torno al audio.
  • Gladia promete que puede transcribir una hora de audio por 0,61 dólares. Y el proceso de transcripción dura aproximadamente 60 segundos. 
  • Su API puede detectar cuando hay varios hablantes, agregar marcas de tiempo, detectar idiomas y cambiar de un idioma a otro si es necesario. 
  • Gladia también agrega automáticamente signos de puntuación y mayúsculas y minúsculas.
  • Gladia ha recaudado 4 millones de dólares en financiamiento y tiene una visión a largo plazo de mejorar la inteligencia de audio y ofrecer características adicionales más allá de la transcripción.

Foto: Gladia

Deja una respuesta