FOLOU

GPT-5 de OpenAI se acerca a los humanos en diversas tareas laborales

OpenAI, la empresa detrás de los modelos de inteligencia artificial (IA) más avanzados, anunció un nuevo estudio llamado GDPval, que evalúa cómo sus modelos de IA, como GPT-5, se comparan con profesionales humanos en una variedad de trabajos.

Según el análisis, GPT-5 y Claude Opus 4.1, desarrollado por Anthropic, están alcanzando niveles similares a los de expertos en áreas clave como la salud, las finanzas y la ingeniería. Sin embargo, estos modelos aún no reemplazan completamente a los humanos, ya que solo cubren ciertas tareas específicas dentro de cada trabajo.

GDPval funciona evaluando el desempeño de los modelos de IA en 44 ocupaciones de nueve industrias importantes en Estados Unidos, como la atención médica y la manufactura. Para medir esto, OpenAI pidió a profesionales experimentados que compararan informes generados por IA con los producidos por humanos.

Por ejemplo, banqueros de inversión analizaron informes sobre competencia en la industria logística. En promedio, GPT-5 superó o igualó el rendimiento humano en el 40,6% de los casos, mientras que Claude Opus 4.1 lo hizo en el 49%, aunque este último recibió puntos extra por presentar gráficos bien diseñados.

TE PUEDE INTERESAR: Meta amplía protección para adolescentes en redes sociales

Qué debes saber de GPT-5 de OpenAI

Especificaciones técnicas

«El modelo se está volviendo bueno en algunas de estas cosas. Las personas en esos trabajos ahora pueden usar el modelo […] para descargar parte de su trabajo y hacer cosas potencialmente de mayor valor».

— Dr. Aaron Chatterji, economista jefe de OpenAI

Contenido generado con IA y editado por el equipo editorial.

Foto: Levart_Photographer en Unsplash.

Salir de la versión móvil