OpenAI lanza o1: un modelo de IA capaz de ‘razonar como un humano’

OpenAI presentó un nuevo modelo de Inteligencia Artificial (IA), llamado o1. Se trata del primero de una serie de modelos que están siendo entrenados para tener capacidades de razonamiento humano.

De acuerdo con la compañía, este modelo representa un paso más para acercar las capacidades de la IA a la inteligencia humana. Además, puede manejar consultas más complejas de varios pasos, si tomamos de referencia a Chat GPT, y mejora la escritura de códigos.

Al mismo tiempo, OpenAI brindará acceso a o1-mini, una versión más ligera y menos costosa, a todos los usuarios gratuitos de ChatGPT. Sin embargo, la compañía no ha confirmado aúnla fecha de lanzamiento.

TE PUEDE INTERESAR: Apple Intelligence: funciones que no se lanzarán con iOS 18

¿Cómo funciona el modelo de IA o1?

  • El modelo se lanzó esta semana como una versión preliminar y OpenAI indicó que espera hacer actualizaciones y mejoras periódicas.
  • Los usuarios de ChatGPT Plus y Team obtendrán acceso a o1 y a o1-mini esta misma semana, mientras que los de Enterprise y Edu podrán hacerlo la próxima.
  • El acceso de los desarrolladores a o1 en API cuesta el triple que el de GPT-4o.
  • Jerry Tworek, líder de investigación de OpenAI dijo a The Verge que el entrenamiento de este modelo es diferente al de sus predecesores. El algoritmo de optimización es nuevo y cuenta con un conjunto de datos diseñados exclusivamente para o1.
  • El nuevo modelo de IA es entrenado con una técnica de aprendizaje de recompensas, esta enseña a través de recompensas y penalizaciones. Luego usa una ‘cadena de pensamiento’ para procesar consultas, de manera similar a como lo hacen los humanos.
  • La principal diferencia con GPT-4o es que o1 puede resolver problemas complejos como codificación y matemáticas, al tiempo que explica su razonamiento. 
  • OpenAI evaluó a o1 con una examen de clasificación para la Olimpiada Internacional de Matemáticas. El sistema logró la resolución de 83% de los problemas versus el 13% de GPT-4o.
  • La próxima actualización responderá de manera similar a un estudiante de doctorado en tareas difíciles de física, química y biología.
  • o1 es menos capaz que GPT-4o en tareas que impliquen capacidades de navegación por la web y el procesamiento de archivos.

Deja una respuesta