FOLOU

Google presenta un modelo de IA que usa navegadores como los humanos

Google anunció una nueva versión de su modelo de inteligencia artificial llamada Gemini 2.5 Computer Use, diseñada para interactuar con la web tal como lo haría una persona. Este avance permite que la IA realice tareas en interfaces web pensadas para usuarios humanos, como llenar formularios o navegar por sitios sin necesidad de usar APIs.

El modelo utiliza capacidades avanzadas de comprensión visual y razonamiento para analizar solicitudes y realizar acciones específicas. Por ejemplo, puede hacer clic, desplazarse y escribir dentro de una ventana del navegador. Esto abre posibilidades interesantes, como automatizar procesos en plataformas que no ofrecen integración directa a través de programación. Google ha probado esta tecnología en proyectos como AI Mode y Project Mariner, donde los agentes de IA realizan tareas complejas automáticamente.

Esta noticia llega justo después de que OpenAI presentara mejoras en ChatGPT Agent y mientras otras empresas como Anthropic ya exploran modelos similares. Aunque Gemini 2.5 Computer Use aún está limitada al navegador y no controla todo el sistema operativo, representa un paso importante hacia herramientas más autónomas e inteligentes. Los desarrolladores ya pueden acceder al modelo a través de Google AI Studio y Vertex AI, además de ver demostraciones en Browserbase.

TE PUEDE INTERESAR: Sora de OpenAI se actualiza: así cambiarán los videos generados por la IA

Qué debes saber

Especificaciones técnicas

Contenido generado con IA y editado por el equipo editorial.

Foto: Archivos FOLOU.

Salir de la versión móvil