Lenovo presentó AION, una iniciativa estratégica de Investigación y Desarrollo (I+D) que busca mejorar la eficiencia y escalabilidad de la inteligencia artificial (IA) a través de arquitecturas híbridas. Este proyecto, desarrollado en Brasil, tiene como objetivo acelerar la adopción de la IA con mayor eficiencia operacional, menor costo y mayor flexibilidad para las empresas.
AION explora el potencial de la inferencia directamente en CPUs de última generación, como el Intel Xeon 6, ofreciendo un enfoque complementario al uso tradicional de GPUs. El objetivo es optimizar las cargas de trabajo de IA de acuerdo con las necesidades de cada aplicación, garantizando mayor eficiencia operacional, mejor aprovechamiento de la infraestructura existente y reducción de costos.
El proyecto se lanza en un contexto de creciente demanda de capacidad computacional y desafíos relacionados con la disponibilidad y el alto costo de las GPUs. AION permite que las cargas de trabajo de inferencia más ligeras o distribuidas se ejecuten directamente en CPUs, liberando las GPUs para aplicaciones más críticas e intensivas. Esto reduce el tiempo de entrada en producción, aumenta la eficiencia operacional y amplía el retorno sobre la inversión en infraestructura.
TE PUEDE INERESAR: iOS 27 Beta 2 ya disponible: mejoras en Siri y más
Qué debes saber
- Lenovo lanza AION, una iniciativa I+D para mejorar la eficiencia y escalabilidad de la IA.
- AION utiliza CPUs de última generación, como el Intel Xeon 6, para optimizar las cargas de trabajo de IA.
- El proyecto reduce el costo y aumenta la flexibilidad, permitiendo a las empresas aprovechar su infraestructura existente.
- AION ya demuestra un desempeño relevante, con tiempos de inferencia de 0,3 ms y una velocidad de generación de respuesta de 11 tokens por segundo.
Especificaciones técnicas
- CPUs utilizadas: Intel Xeon 6 con Performance-cores.
- Optimizaciones: Soporte para OpenVINO y ejecución de modelos como DeepSeek R1.
- Rendimiento: Tiempo de 0,3 ms hasta el Time to First Token (TTFT) y una velocidad de generación de respuesta de 11 tokens por segundo.
Contenido generado con IA y editado por el equipo editorial.
Foto: Lenovo.