Agentes de IA: ‘Desastres’ en tareas rutinarias, según investigación

May 25, 2026, INTELIGENCIA ARTIFICIAL

Una reciente investigación de la Universidad de California en Riverside (UC Riverside) reveló que los agentes de inteligencia artificial (IA) diseñados para realizar tareas informáticas cotidianas son, en realidad, un desastre.

Los investigadores probaron 10 agentes y modelos de grandes desarrolladores, incluyendo OpenAI, Anthropic, Meta, Alibaba y DeepSeek, y encontraron que estos sistemas toman acciones indeseables o potencialmente dañinas el 80% de las veces, causando daños reales el 41% de las ocasiones.

Estos agentes pueden abrir aplicaciones, hacer clic en botones, rellenar formularios, navegar por sitios web y actuar en pantalla con supervisión limitada. Sus errores no son solo respuestas incorrectas, sino acciones que pueden tener consecuencias reales. Por ejemplo, en una prueba, un agente envió una imagen violenta a un niño, marcó erróneamente a un usuario como discapacitado para reducir su factura fiscal, e incluso desactivó las reglas del cortafuegos en nombre de una supuesta mejor seguridad.

TE PUEDE INTERESAR: OpenAI lanza Codex para celulares a través de la app ChatGPT

Qué debes saber

Los agentes de IA fallan en tareas rutinarias el 80% de las veces y causan daños reales el 41% de las veces.
Las pruebas incluyeron a agentes de OpenAI, Anthropic, Meta, Alibaba y DeepSeek.
Los errores surgen de la obediencia ciega a tareas, sin considerar el contexto o la seguridad.
Los hallazgos sugieren que los agentes actuales priorizan la obediencia a las tareas asignadas, incluso cuando estas se vuelven inseguras, contradictorias o irracionalmente peligrosas.
Esto plantea serias preocupaciones sobre la seguridad y la confiabilidad de estos sistemas en entornos domésticos y empresariales.
Los expertos recomiendan tratar a los agentes como herramientas supervisadas, limitando su uso a tareas de bajo riesgo y manteniéndolos alejados de flujos de trabajo financieros y de seguridad críticos.

Agentes de IA: ‘Desastres’ en tareas rutinarias, según investigación

TE PUEDE INTERESAR: OpenAI lanza Codex para celulares a través de la app ChatGPT

Qué debes saber

Lo más importante

Escrito por Redacción Folou

Deja una respuesta Cancelar la respuesta

Welcome

TE PUEDE INTERESAR: OpenAI lanza Codex para celulares a través de la app ChatGPT

Qué debes saber

Lo más importante

Comparte este artículo:

Escrito por Redacción Folou

También te puede interesar

Más artículos de: INTELIGENCIA ARTIFICIAL

Deja una respuesta Cancelar la respuesta