Microsoft lanza sus propios modelos de IA: conócelos aquí 

Microsoft presentó oficialmente sus dos primeros modelos de inteligencia artificial (IA) desarrollados íntegramente por sus equipos internos: MAI-Voice-1 y MAI-1-preview. Este anuncio no solo marca un hito técnico, sino que también representa una declaración de independencia frente a OpenAI, empresa con la que mantiene una estrecha colaboración desde 2019.

La compañía busca consolidar una infraestructura de IA autónoma. Mustafa Suleyman, líder de Microsoft AI y cofundador de DeepMind, afirmó en entrevista con Semafor que “el arte de entrenar modelos está en elegir los datos perfectos y no desperdiciar tokens que no enseñan nada útil”.

Aunque se está utilizando para probar los modelos internos, Microsoft Copilot se basa principalmente en la tecnología GPT de OpenAI. La decisión de construir sus propios modelos, a pesar de haberse hundido Inversiones de miles de millones de dólares en la compañía de IA más nueva, indica que Microsoft quiere ser un competidor independiente en este espacio. 

Si bien eso podría llevar tiempo alcanzar la paridad con las empresas que han surgido como precursoras en el desarrollo de IA, Suleyman le dijo a Semafor que Microsoft tiene una enorme hoja de ruta de cinco años en la que estamos invirtiendo trimestre tras trimestre’. 

TE PUEDE INTERESAR: ¿Usas Chrome en tu Android? Expertos advierten sobre la privacidad 

Estos son los nuevos modelos de IA de Microsoft 

MAI-Voice-1: voz sintética con tono humano

  • El modelo MAI-Voice-1 es una IA generativa de voz que destaca por su capacidad para producir audio expresivo y natural en menos de un segundo, utilizando apenas una GPU. 
  • Actualmente, ya está integrado en funciones como Copilot Daily y Podcasts, donde narra noticias y contenidos con entonación ajustable y estilo conversacional.
  • Microsoft también ha lanzado esta tecnología en Copilot Labs, donde los usuarios pueden experimentar con modos narrativos como ‘emotivo’ o ‘historia’, ajustando ritmo, tono y personalidad de la voz. 
  • Esta eficiencia lo posiciona como uno de los sistemas de síntesis de voz más avanzados del mercado, compitiendo directamente con propuestas como GPT-Realtime de OpenAI.

MAI-1-preview: el primer modelo fundacional de Microsoft

  • MAI-1-preview es el primer modelo de lenguaje entrenado de extremo a extremo por Microsoft. 
  • Utiliza una arquitectura de tipo Mixture-of-Experts (MoE), que activa solo los componentes necesarios para cada tarea, optimizando recursos y precisión. 
  • Fue entrenado con aproximadamente 15.000 GPU Nvidia H100, una cifra significativamente menor que los más de 100.000 chips usados por Grok de xAI.
  • Este modelo ya está disponible para pruebas públicas en la plataforma LMArena, y se espera que comience a integrarse en escenarios seleccionados de Copilot en las próximas semanas. 
  • Aunque no reemplazará a GPT-5, sí se utilizará para tareas específicas, con el objetivo de evaluar su rendimiento y ajustar sus capacidades según el feedback de los usuarios.

Foto: Microsoft.

Deja una respuesta