La supercomputadora Aurora es la más rápida en IA

En el ISC 2024, Intel anuncia que Aurora es la supercomputadora de inteligencia artificial más rápida ya que ha superado la barrera del exaescala, y destaca la importancia de un ecosistema abierto en HPC e IA.

Noticias

  • 13 de mayo de 2024

  • Contacta al equipo PR de Intel

  • Siga las noticias de Intel en las redes sociales:

    Logotipo de Twitter
    Icono de YouTube

author-image

Por

Novedades: En ISC High Performance 2024, Intel anunció, en colaboración con Argonne National Laboratory y Hewlett Packard Enterprise (HPE), que la supercomputadora Aurora ha roto la barrera de exaescala en 1.012 exaflops y es el sistema de IA más rápido del mundo dedicado a la IA para la ciencia abierta, logrando 10.6 exaflops de IA. Intel también detalló el papel crucial de los ecosistemas abiertos en el impulso de la computación de alto desempeño (HPC) acelerada por IA.

"La supercomputadora Aurora, al superar la exaescala, abrirá el camino hacia los descubrimientos del mañana. Desde entender los patrones climáticos hasta desentrañar los misterios del universo, los supercomputadores actúan como una brújula que nos guía para resolver desafíos científicos realmente difíciles que podrían mejorar la humanidad."

–Ogi Brkic, vicepresidente y gerente general de Data Center AI Solutions de Intel

Por qué es importante: Diseñado como un sistema centrado en la IA desde su inicio, Aurora permitirá a los investigadores aprovechar los modelos generativos para acelerar el descubrimiento científico. Se ha logrado un progreso significativo en las primeras investigaciones impulsadas por la IA de Argonne. Las historias de éxito incluyen el mapeo de los 80 mil millones de neuronas del cerebro humano, la física de partículas de alta energía mejorada por el aprendizaje profundo (deep learning) y el diseño y descubrimiento de medicamentos acelerados por el aprendizaje automático (machine learning), entre otros.

Aurora, en detalle: La supercomputadora es un sistema enorme con 166 racks, 10,624 tarjetas de procesamiento, 21,248 procesadores Intel® Xeon® CPU Max Series y 63,744 unidades de GPU Intel® Data Center Max Series, lo que lo convierte en uno de los clusters de GPU más grandes del mundo. También, incluye la mayor interconexión de supercomputación abierta basada en Ethernet en un solo sistema, con 84,992 puntos de conexión de la red HPE Slingshot. Quedó en segundo lugar en la prueba de rendimiento LINPACK (HPL) de alto rendimiento, pero superó la barrera del exaescala con 1.012 exaflops utilizando 9,234 nodos, solamente el 87% del sistema. Aurora también se aseguró el tercer lugar en la prueba de gradiente conjugado de alto rendimiento (HPCG) con 5,612 teraflops por segundo (TF/s) con el 39% de la máquina. Este benchmark tiene como objetivo evaluar escenarios más realistas proporcionando información sobre patrones de comunicación y acceso a la memoria, que son factores importantes en las aplicaciones de HPC del mundo real. Complementa benchmarks como LINPACK al ofrecer una visión integral de las capacidades de un sistema.

Cómo se optimiza la IA: En el corazón de la supercomputadora Aurora se encuentra la Intel Data Center GPU Max Series. La arquitectura de la GPU Intel Xe es fundamental para la Serie Max, con hardware especializado como bloques de cálculo de matriz y vector optimizados para tareas tanto de IA como de HPC. El diseño de la arquitectura Intel® Xe , que ofrece un rendimiento de cálculo incomparable, es la razón por la cual el supercomputador Aurora aseguró el primer lugar en la prueba de alto rendimiento LINPACK de precisión mixta (HPL-MxP), que resalta la importancia de las cargas de trabajo de IA en HPC.

Las capacidades de procesamiento paralelo de la arquitectura Xe sobresalen en la gestión de las intrincadas operaciones de matriz-vector inherentes en la computación de redes neuronales de IA. Estos núcleos de cómputo son fundamentales para acelerar las operaciones matriciales cruciales para los modelos de aprendizaje profundo. Complementada con el conjunto de herramientas de software de Intel, incluido Intel® oneAPI DPC++/C++ Compiler, un amplio conjunto de bibliotecas de desempeño y marcos y herramientas de IA optimizados, la arquitectura Xe fomenta un ecosistema abierto para los desarrolladores que se caracteriza por la flexibilidad y la escalabilidad en diversos dispositivos y factores de forma.

Avance de la computación acelerada con software abierto y capacidad informática: En su sesión especial en ISC 2024, el martes 14 de mayo a las 6:45 p.m., (GMT+2) Hall 4, Congress Center Hamburg, Alemania, el CEO Andrew Richards de Codeplay, una compañía de Intel, abordará la creciente demanda de computación acelerada y software en HPC e IA. Destacará la importancia de oneAPI, que ofrece un modelo de programación unificado en diversas arquitecturas. Basado en estándares abiertos, oneAPI permite a los desarrolladores crear código que se ejecuta sin problemas en diferentes plataformas de hardware sin modificaciones extensas o dependencia de un único proveedor. Este es también el objetivo de la Fundación de Aceleración Unificada (UXL) de la Linux Foundation, en la que Arm, Google, Intel, Qualcomm y otros están desarrollando un ecosistema abierto para todos los aceleradores y cómputo heterogéneo unificado en estándares abiertos para romper la dependencia de proveedores propietarios. La Fundación UXL está sumando más miembros a su creciente coalición.

Mientras tanto, Intel® Tiber™ Developer Cloud está ampliando su capacidad de cómputo con nuevas plataformas de hardware de última generación y nuevas capacidades de servicio que permiten a las empresas y desarrolladores evaluar los últimos arquitectura Intel, innovar y optimizar los modelos de IA y las cargas de trabajo rápidamente, y luego implementar modelos de IA a escala. El nuevo hardware incluye previsualizaciones de sistemas Intel® Xeon® 6 E-core y P-core para clientes selectos, así como clusters a gran escala basados en Intel® Gaudi® 2 y en la serie de GPU Intel® Data Center Max. Las nuevas capacidades incluyen el servicio Intel® Kubernetes para cargas de trabajo de inferencia y entrenamiento de IA nativas de la nube y cuentas multiusuario.

Lo que sigue: Las nuevas supercomputadoras que se están implementando con tecnologías Intel Xeon CPU Max Series y Intel Data Center GPU Max Series subrayan el objetivo de Intel de promover la HPC y la IA. Los sistemas incluyen Cassandra del Euro-Mediterranean Centre on Climate Change (CMCC) para acelerar la modelización del cambio climático; Italian National Agency for New Technologies (ENEA) para posibilitar avances en la energía de fusión; el Texas Advanced Computing Center (TACC), que está en plena producción para facilitar el análisis de datos en biología, flujos de turbulencia supersónica y simulaciones atomísticas en una amplia gama de materiales; así como United Kingdom Atomic Energy Authority (UKAEA) para resolver problemas ligados a la memoria que sustentan el diseño de futuras plantas de energía de fusión.

Los resultados de la prueba de inteligencia artificial de precisión mixta serán fundamentales para la próxima generación de GPU de Intel para IA y HPC, conocida como Falcon Shores. Falcon Shores aprovechará la arquitectura Intel® Xe de próxima generación con lo mejor de Intel® Gaudi®. Esta integración permite una interfaz de programación unificada.

Los primeros resultados de desempeño en Intel® Xeon® 6 con P-cores y memoria de rangos combinados de multiplexor (MCR) a 8800 megatransferencias por segundo (MT/s) ofrecen una mejora de desempeño hasta 2,3 veces superior para aplicaciones HPC del mundo real, como Nucleus for European Modeling of the Ocean (NEMO), en comparación con la generación anterior,1 lo que establece una base sólida como la opción de CPU host preferida para soluciones HPC.

Más contexto: Intel Tiber Developer Cloud | Fundación UXL | Intel da el siguiente paso hacia la construcción de procesadores cuánticos escalables basados en silicio | Intel Gaudi, Xeon y AI PC aceleran las cargas de trabajo de la generación Meta Llama 3

Detalle:

1Consulte la sección ISC 2024 del intel.com/performanceindex para conocer las cargas de trabajo y las configuraciones. Los resultados pueden variar.
Las tecnologías Intel pueden requerir la activación de hardware, software o servicios. 
Los resultados de rendimiento se basan en pruebas realizadas en las fechas mostradas en las configuraciones y pueden no reflejar todas las actualizaciones públicamente disponibles. Ningún producto o componente puede ser absolutamente seguro.
Intel no controla ni audita los datos de terceros. Le recomendamos consultar otras fuentes para evaluar la exactitud.