Google lanza Gemini 2.0 con mejoras y nuevos agentes IA

Google presentó Gemini 2.0, la evolución de su modelo de Inteligencia Artificial (IA)  multimodal. Esta nueva versión refuerza su capacidad para procesar y generar imágenes y audio nativos, abriendo nuevas posibilidades para interactuar con el sistema.

Según la compañía, La IA multimodal de Gemini 2.0 llega con nuevas herramientas y capacidades que mejoran la experiencia de usuario. Google no solo optimizó el modelo para mejorar la latencia, sino que también potencia el razonamiento avanzado y la comprensión del contexto, facilitando respuestas más completas y precisas. 

Además, integra herramientas como Google Search y funciones de terceros, destacando su enfoque en los agentes de IA, capaces de realizar tareas complejas.

TE PUEDE INTERESAR: Google revela las búsquedas más populares de 2024 en Colombia

Avances de Gemini 2.0

Mejoras en capacidades y rendimiento

  • Gemini 2.0 Flash supera a su predecesor con el doble de velocidad y mejoras en la respuesta multimodal.
  • Los desarrolladores ahora tienen acceso a nuevas APIs que permiten interacción en tiempo real con audio y video.
  • Se amplían las capacidades de razonamiento de la inteligencia artificial, facilitando tareas complejas como resolución de ecuaciones o consultas de varios pasos.
  • Gemini 2.0 está integrado en productos como Google Search, mejorando la experiencia de búsqueda con consultas más complejas.
  • La capacidad de razonamiento multimodal permite una mayor comprensión de imágenes, audio y texto, mejorando las interacciones en múltiples medios.
  • Nuevas capacidades de memoria permiten que los agentes recuerden interacciones previas, personalizando la experiencia del usuario.
  • Las capacidades de latencia mejorada hacen que las interacciones sean más naturales, similares a las conversaciones humanas.

Avances en interacción y aplicaciones prácticas

  • Project Astra, un prototipo de asistente universal, incorpora nuevas herramientas como Google Maps y Lens, y mejora la memoria del agente.
  • Project Mariner explora la interacción de IA con navegadores web, permitiendo completar tareas automatizadas.
  • Jules, un prototipo para desarrolladores, asiste en la creación y ejecución de código dentro de plataformas como GitHub.
  • La nueva interfaz de usuario de Gemini 2.0 permite a los agentes realizar acciones complejas, como el seguimiento de instrucciones detalladas y la planificación avanzada.
  • Gemini 2.0 optimiza la generación de texto a voz (TTS) multilingüe, ampliando su accesibilidad a más usuarios.

Foto: Pexels.

Deja una respuesta