Intel reveló que su supercomputador Aurora ha superado la barrera de la exaescala, alcanzando 1.012 exaflops y posicionándose como el supercomputador de IA más rápido dedicado a la ciencia abierta.
En ISC High Performance 2024, Intel, en colaboración con el Laboratorio Nacional de Argonne y Hewlett Packard Enterprise (HPE), anunció que el supercomputador Aurora ha superado la barrera de la exaescala con 1.012 exaflops, convirtiéndose en el sistema de IA más rápido del mundo dedicado a la ciencia abierta. Al alcanzar 10.6 exaflops en IA, Aurora ejemplifica la importancia de un ecosistema abierto en el impulso de avances en HPC e IA.
Esta colaboración entre Intel, el Laboratorio Nacional de Argonne y Hewlett Packard Enterprise (HPE) es un hito significativo para la computación de alto rendimiento (HPC) y la IA.
El logro del supercomputador Aurora marca un momento crucial en el ámbito de la IA y la HPC. Ogi Brkic, vicepresidente y gerente general de Soluciones de IA para Centros de Datos de Intel, destacó la importancia de este hito: «El supercomputador Aurora superando la exaescala le permitirá allanar el camino hacia los descubrimientos del mañana. Desde comprender los patrones climáticos hasta desentrañar los misterios del universo, los supercomputadores sirven como una brújula que nos guía hacia la solución de desafíos científicos verdaderamente difíciles que pueden mejorar la humanidad.»
Especificaciones Técnicas y Logros
Aurora es un sistema masivo, compuesto por 166 racks, 10,624 blades de computación, 21,248 procesadores Intel Xeon CPU Max Series y 63,744 unidades Intel Data Center GPU Max Series.
Esto lo convierte en uno de los mayores clusters de GPU del mundo. El sistema también incluye la interconexión de supercomputación abierta basada en Ethernet más grande en un solo sistema, con 84,992 endpoints de tejido HPE slingshot.
A pesar de clasificarse en segundo lugar en el benchmark de alto rendimiento LINPACK (HPL), Aurora rompió la barrera de la exaescala utilizando solo el 87% de sus nodos.
También aseguró el tercer lugar en el benchmark de gradiente conjugado de alto rendimiento (HPCG) con 5,612 teraflops por segundo (TF/s), demostrando su capacidad en escenarios de HPC más realistas.
Optimización de IA
En el corazón del rendimiento de Aurora está la Serie Max de GPU para Centros de Datos de Intel, que presenta la arquitectura Intel Xe GPU.
Esta arquitectura incluye hardware especializado optimizado para tareas de IA y HPC, lo que hace que Aurora sobresalga en benchmarks como LINPACK-mixed precision (HPL-MxP), que destacan las cargas de trabajo de IA en HPC.
Las capacidades de procesamiento paralelo de la arquitectura Xe son cruciales para gestionar las complejas operaciones de matriz-vector en las computaciones de redes neuronales de IA.
Apoyada por las herramientas de software de Intel, como el compilador Intel oneAPI DPC++/C++ y bibliotecas de rendimiento, la arquitectura Xe promueve un ecosistema abierto para el desarrollo flexible y escalable.
Avanzando en la Computación Acelerada:
En su sesión especial en ISC 2024, Andrew Richards, CEO de Codeplay, destacó la creciente demanda de computación acelerada y la importancia de los ecosistemas de software abiertos. Resaltó el oneAPI de Intel, que ofrece un modelo de programación unificado en diferentes plataformas de hardware, reduciendo la dependencia de proveedores y fomentando la innovación.
La Fundación de Aceleración Unificada (UXL) de la Fundación Linux tiene como objetivo romper las barreras propietarias desarrollando un ecosistema abierto para todos los aceleradores. Esta iniciativa, apoyada por empresas como Arm, Google, Intel y Qualcomm, es crucial para avanzar en la computación heterogénea basada en estándares abiertos.
Desarrollos Futuros
La nube de desarrollo Tiber de Intel está expandiendo su capacidad de cómputo con nuevas plataformas de hardware y capacidades de servicio. Estas incluyen vistas previas de sistemas Intel Xeon 6 E-core y P-core y clusters a gran escala basados en Intel Gaudi 2 y la Serie Max de GPU para Centros de Datos de Intel. Las nuevas capacidades también incluyen el Servicio de Kubernetes de Intel® para cargas de trabajo de entrenamiento e inferencia de IA nativas en la nube.
Mirando Hacia el Futuro:
La próxima generación de GPU de Intel para IA y HPC, con nombre en código Falcon Shores, aprovechará lo mejor de Intel Gaudi y la próxima generación de la arquitectura Intel Xe. Esta integración promete una interfaz de programación unificada, estableciendo una base sólida para futuros avances.
Los primeros resultados de rendimiento en Intel Xeon 6 con P-cores y memoria MCR ofrecen mejoras significativas para aplicaciones de HPC en el mundo real, como el Núcleo para la Modelización Europea del Océano (NEMO), en comparación con generaciones anteriores.
Los logros innovadores del supercomputador Aurora en ISC 2024 destacan el futuro de la IA y la HPC. Al superar la barrera de la exaescala y demostrar un rendimiento excepcional en cargas de trabajo de IA, Aurora establece un nuevo estándar para el descubrimiento científico y la innovación tecnológica.
A medida que Intel continúa avanzando en sus tecnologías, las implicaciones para diversos campos, desde la ciencia climática hasta la física de partículas, son profundas, prometiendo impulsar un progreso e innovación significativos en los próximos años.