X actualizó su modelo de Inteligencia Artificial (IA) generativa Grok y ahora tiene la capacidad de procesar información visual, como documentos, capturas de pantalla, diagramas y fotografías.
De acuerdo con xAI, la empresa fundada por Elon Musk, Grok-1.5v ‘superó a sus pares’, en su nuevo punto de referencia RealWorldQA.
Esta evaluación del procesamiento de imágenes, que mide la comprensión espacial del mundo real y cuya versión inicial consta de más de 700 imágenes, se trata de un test simple que consiste en realizar una solo pregunta y una respuesta fácilmente verificables, para cada una.
Este conjunto de datos, además, consta de imágenes anónimas de vehículos y otros objetos del mundo real. Está disponible para su descarga y se espera que se expanda a medida que mejoren los modelos multimodales de la firma.
TE PUEDE INTERESAR: La IA De Meta Llegó A Instagram Y WhatsApp, ¿Cómo Funciona?
Más sobre las nuevas funciones de Grok
- Puedes mostrarle una foto de un diagrama de flujo y pedirle a Grok que lo traduzca a código Python, hacer que escriba una historia basada en un dibujo e incluso pedirle que explique un meme que no puedes entender.
- X indicó que Grok-1.5V estará disponible ‘pronto’ para los probadores y usuarios de su ‘chatbot’.
- La compañía comentó que en los próximos meses irá avanzando mejoras ‘significativas’ de procesamiento en diferentes modalidades, como imágenes, audio y vídeo.
- A finales de marzo, xAI anunció la actualización del modelo de IA que potencia su ‘chatbot’, Grok-1.5, que llegaba con mejoras en su capacidad de rendimiento y en tareas relacionadas con la codificación y las matemáticas.
- La firma tecnológica presentó su ‘chatbot’ en noviembre del año pasado, estando primero en pruebas para los suscriptores de Premium+.
- Al lanzar Grok, Musk explicó que era capaz de ofrecer respuestas a los usuarios en tiempo real con un sentido del humor no apto para todos.
Foto: X.