OpenAI oficialmente presentó el agente de IA Operator. Se trata de una herramienta de automatización de acciones en el navegador, que puede interactuar con elementos en la pantalla (botones, campos de texto, etc.) casi de la misma manera que lo haría una persona.
Operator utiliza un nuevo modelo de inteligencia artificial (IA) llamado Computer-Using Agent (CUA), que permite el control del ordenador a través de la interfaz visual (se combinan las capacidades de GPT-4o con el reconocimiento de imágenes con un mecanismo de razonamiento actualizado).
De acuerdo con OpenAI, las acciones ocurren en varias etapas: inicialmente el agente toma capturas de pantalla, las analiza y determina qué acciones debe realizar — finalmente, mediante la simulación de un ratón y teclado, realiza clics, desplazamientos o introducción de texto.
TE PUEDE INTERESAR: Instagram lanza una copia de CapCut: así es el editor de videos ‘Edits’
Así es Operator AI, el agente de IA de OpenAI
- Durante el funcionamiento de Operator, el usuario verá todas estas acciones en una ventana miniatura del navegador.
- Por ahora, el agente se desempeña mejor con tareas repetitivas (como crear listas de compras o listas de reproducción), pero algo ‘se atasca’ en interfaces desconocidas (tablas o calendarios) y en la edición de textos complejos.
- OpenAI indica que ha incorporado en Operator varios elementos de control de seguridad que requieren confirmación del usuario antes de llevar a cabo acciones confidenciales, como enviar correos electrónicos o realizar compras.
- La herramienta también tiene limitaciones en lo que puede ver, principalmente esto se refiere a sitios para adultos o de juegos de azar.
- La inteligencia artificial ‘agencial’ puede utilizar el razonamiento para ‘autocorregirse’, según aclara OpenAI. Y, si falla y no es capaz de seguir con la tarea, le dará el control al usuario de nuevo.
- Desde hoy, Operator está disponible en vista previa en la suscripción de ChatGPT Pro por 200 dólares (solo en EE.UU.), pero ‘pronto’ OpenAI añadirá la herramienta para los titulares de las tarifas Plus, Team y Enterprise.
Foto: OpenAI.