GPT-5 de OpenAI se acerca a los humanos en diversas tareas laborales

OpenAI, la empresa detrás de los modelos de inteligencia artificial (IA) más avanzados, anunció un nuevo estudio llamado GDPval, que evalúa cómo sus modelos de IA, como GPT-5, se comparan con profesionales humanos en una variedad de trabajos.

Según el análisis, GPT-5 y Claude Opus 4.1, desarrollado por Anthropic, están alcanzando niveles similares a los de expertos en áreas clave como la salud, las finanzas y la ingeniería. Sin embargo, estos modelos aún no reemplazan completamente a los humanos, ya que solo cubren ciertas tareas específicas dentro de cada trabajo.

GDPval funciona evaluando el desempeño de los modelos de IA en 44 ocupaciones de nueve industrias importantes en Estados Unidos, como la atención médica y la manufactura. Para medir esto, OpenAI pidió a profesionales experimentados que compararan informes generados por IA con los producidos por humanos.

Por ejemplo, banqueros de inversión analizaron informes sobre competencia en la industria logística. En promedio, GPT-5 superó o igualó el rendimiento humano en el 40,6% de los casos, mientras que Claude Opus 4.1 lo hizo en el 49%, aunque este último recibió puntos extra por presentar gráficos bien diseñados.

TE PUEDE INTERESAR: Meta amplía protección para adolescentes en redes sociales

Qué debes saber de GPT-5 de OpenAI

  • GPT-5 obtuvo una ‘tasa de victoria’ del 40,6% frente a expertos humanos en varias industrias.
  • Claude Opus 4.1 destacó con un 49% gracias a sus capacidades gráficas.
  • GDPval evalúa 44 ocupaciones en nueve sectores clave de la economía estadounidense.
  • OpenAI planea mejorar la prueba para incluir flujos de trabajo más complejos.
  • La versión anterior de GPT, lanzada hace 15 meses, tenía una tasa de éxito del 13,7%, lo que indica un progreso rápido.
  • Aunque GDPval aún está en desarrollo y solo prueba tareas limitadas, podría ser clave para entender cómo los modelos de IA pueden complementar el trabajo humano en el futuro cercano.

Especificaciones técnicas

  • GPT-5-high: versión mejorada de GPT-5 con mayor capacidad computacional.
  • Tasa de éxito inicial de GPT-4o: 13,7% (mejorada significativamente en GPT-5).

«El modelo se está volviendo bueno en algunas de estas cosas. Las personas en esos trabajos ahora pueden usar el modelo […] para descargar parte de su trabajo y hacer cosas potencialmente de mayor valor».

— Dr. Aaron Chatterji, economista jefe de OpenAI

Contenido generado con IA y editado por el equipo editorial.

Foto: Levart_Photographer en Unsplash.

Deja una respuesta