FOLOU

Así es Ironwood: el nuevo cerebro de Google para grandes modelos

Durante el evento Cloud Next 25, Google anunció Ironwood, su séptima generación de Unidades de Procesamiento Tensorial. Esta versión fue diseñada para potenciar modelos avanzados de inferencia con alto consumo de cómputo. 

Ironwood se enfoca en modelos complejos como los LLM (modelo de lenguaje grande) y MoE (Mixture of Experts), con un enfoque en minimizar la latencia y escalar de manera eficiente. El sistema puede alcanzar configuraciones de hasta 9216 chips, conectados por una red especializada.

Según la compañía, esta nueva TPU ofrece mejoras sustanciales frente a generaciones anteriores, tanto en rendimiento por vatio como en capacidad de memoria. 

TE PUEDE INTERESAR: WordPress ofrece un nuevo creador de sitios web con IA: así funciona 

Características de Ironwood

Foto: Google blog.

Salir de la versión móvil