Meta presentó Llama 3.1 405B, un modelo de IA de código abierto que promete competir con GPT-4o. A diferencia de OpenAI y Google, Meta apuesta por ‘la transparencia y la colaboración abierta en sus aplicaciones’.
Llama 3.1 405B es el modelo más grande y avanzado de Meta, entrenado con más de 15 billones de tokens, priorizando tanto la cantidad como la calidad de los datos.
Este nuevo modelo se posiciona como un competidor directo de GPT-4o en áreas como conocimientos generales, traducción a múltiples idiomas y matemáticas.
TE PUEDE INTERESAR: AngryGF: la IA que simula ser una novia enojada y espera ser calmada
Así es Llama 3.1, la IA de código abierto de Meta
- Llama 3.1 405B está diseñado con una arquitectura de transformador que utiliza un único decodificador estándar.
- La empresa destacó que el entrenamiento del modelo fue uno de sus mayores desafíos debido al gran volumen de datos.
- Para optimizar el entrenamiento, la compañía implementó una pila optimizada y un proceso iterativo posterior para mejorar la calidad de las respuestas y garantizar la seguridad.
- «Balanceamos los datos con precisión para crear un modelo de alta calidad en todas las áreas», afirmó la empresa. «Nuestro modelo sigue ofreciendo respuestas útiles, incluso con las medidas de seguridad adicionales».
- Según Meta, Llama 3.1 405B supera a sus predecesores. Las primeras evaluaciones indican que esta IA puede competir directamente con otros modelos de alto calibre, como GPT-4, GPT-4o y Claude 3.5 Sonnet.
- La empresa ha hecho hincapié en la cuidadosa curación de su conjunto de datos antes del entrenamiento, así como en un filtrado y control de calidad más rigurosos en las etapas posteriores.
- Zuckerberg señaló que el código abierto es necesario para un futuro positivo de la inteligencia artificial. Recordemos que el término ‘código abierto’ significa que el modelo Llama 3.1 405B de Meta está disponible para que cualquiera pueda ver, modificar y utilizar su código fuente. En cambio, modelos propietarios como los de OpenAI y Google, mantienen su código cerrado y controlado.
Foto: Archivo FOLOU