Una foto muestra el Intel Data Center GPU Max Series. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto desempeño acelerada por IA con un desempeño líder para cargas de trabajo de HPC e IA en Intel Data Center GPU Max Series, aceleradores de IA Intel Gaudi2 y procesadores Intel Xeon. (Créditos: Intel Corporation)
Una foto muestra el procesador escalable Intel Xeon de 4a Generación. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto rendimiento acelerada por inteligencia artificial con un rendimiento líder para cargas de trabajo de HPC y IA a través de la serie Intel Data Center GPU Max, los aceleradores de IA Intel Gaudi2 y los procesadores Intel Xeon. (Créditos: Intel Corporation)
Una foto muestra el acelerador Intel Gaudi2. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto rendimiento acelerada por inteligencia artificial con un rendimiento líder para cargas de trabajo de HPC y IA a través de la serie Intel Data Center GPU Max, los aceleradores de IA Intel Gaudi2 y los procesadores Intel Xeon. (Créditos: Intel Corporation)
Una fotografía muestra el procesador de CPU Intel Xeon serie Max. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto rendimiento acelerada por inteligencia artificial con un rendimiento líder para cargas de trabajo de HPC y IA a través de la serie Intel Data Center GPU Max, los aceleradores de IA Intel Gaudi2 y los procesadores Intel Xeon. (Créditos: Intel Corporation)
Miembro del Gauss Centre for Supercomputing, SuperMUC-NG Fase 2 de LRZ se encuentra entre los sistemas HPC más rápidos de Alemania. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto rendimiento acelerada por inteligencia artificial con un rendimiento líder para cargas de trabajo de HPC y IA a través de la serie Intel Data Center GPU Max, los aceleradores de IA Intel Gaudi2 y los procesadores Intel Xeon. (Créditos: Intel Corporation)
La supercomputadora de IA más rápida implementada en el Reino Unido hoy en día, la Fase 1 Dawn de la Universidad de Cambridge, pasó del concepto a la ejecución de HPL en menos de seis meses. El 13 de noviembre de 2023, en SC 2023, Intel presentó la computación de alto rendimiento acelerada por inteligencia artificial con un rendimiento líder para cargas de trabajo de HPC y IA a través de la serie Intel Data Center GPU Max, los aceleradores de IA Intel Gaudi2 y los procesadores Intel Xeon. (Créditos: Intel Corporation)
Descargar Imágenes (16 MB)
Novedades: En SC23, Intel presentó la computación de alto rendimiento (HPC) acelerada por IA con un desempeño de liderazgo para cargas de trabajo de HPC e IA en Intel® Data Center GPU Max Series, aceleradores de IA Intel® Gaudí®2 y procesadores Intel® Xeon®. En colaboración con el Laboratorio Nacional Argonne, Intel compartió avances en el proyecto de inteligencia artificial generativa (genAI) Aurora, incluyendo una actualización sobre el modelo de lenguaje GPT-3 LLM de 1 billón de parámetros en la supercomputadora Aurora. Esto fue posible gracias a la arquitectura única de la GPU de la serie Max y las capacidades del sistema de la supercomputadora Aurora. Intel y Argonne demostraron la aceleración de la ciencia con aplicaciones del Aurora Early Science Program (ESP) y el Exascale Computing Project. La compañía también mostró el camino a los aceleradores y Falcon Shores de IA Intel® Gaudí®3.
"Intel siempre se ha comprometido a ofrecer soluciones tecnológicas innovadoras para satisfacer las necesidades de la comunidad de HPC e IA. El excelente desempeño de nuestras CPU Xeon junto con nuestras GPU y CPU Max ayudan a impulsar la investigación y la ciencia. Eso, junto con nuestros aceleradores Gaudi, demuestra nuestra amplia gama de tecnología para ofrecer a nuestros clientes opciones convincentes que se adapten a sus diversas cargas de trabajo.
Por qué es importante: La IA generativa para la ciencia junto con el desempeño y los resultados de referencia más recientes subrayan la capacidad de Intel para ofrecer soluciones personalizadas para satisfacer las necesidades específicas de los clientes de HPC e IA. El enfoque definido por software de Intel con oneAPI y los conjuntos de herramientas mejorados para HPC y AI facilitan a los desarrolladores la tarea de trasladar su código entre marcos arquitectónicos, acelerando así la investigación científica. Además, las GPU y CPU serie Max se implementarán en varias supercomputadoras que se conectarán.
Acerca de la IA generativa para la ciencia: El Laboratorio Nacional de Argonne compartió el progreso en sus iniciativas genAI para la ciencia con la supercomputadora Aurora. El proyecto Aurora genAI es una colaboración entre Argonne, Intel y sus socios para crear modelos de inteligencia artificial de vanguardia para la ciencia. Los modelos serán entrenados en textos, códigos y conjuntos de datos científicos a escalas de más de 1 billón de parámetros de diversos dominios. Al aprovechar las tecnologías fundamentales de Megatron con DeepSpeed, el proyecto genAI ofrecerá servicios a diversas disciplinas científicas, incluyendo biología, investigación del cáncer, ciencias climáticas, cosmología y ciencia de materiales.
La arquitectura distintiva de la GPU de la serie Max de Intel y las capacidades del sistema de la supercomputadora Aurora pueden manejar eficientemente modelos de 1 billón de parámetros con solo 64 nodos, una cantidad mucho menor de lo que normalmente se requeriría. El Laboratorio Nacional Argonne ejecutó cuatro instancias en 256 nodos, demostrando la capacidad de ejecutar múltiples instancias en paralelo en Aurora, allanando el camino para escalar el entrenamiento de modelos de trillones de parámetros de manera más rápida con trillones de tokens en más de 10,000 nodos.
Acerca de Intel y el Laboratorio Nacional de Argonne: Intel y el Laboratorio Nacional de Argonne demostraron la aceleración de la ciencia a escala gracias a las capacidades del sistema y la pila de software en Aurora. 1 Algunos ejemplos de cargas de trabajo son:
- La reconstrucción del conectoma cerebral se habilita a gran escala con Connectomics ML, mostrando una capacidad de inferencia competitiva en más de 500 nodos de Aurora.
- General Atomic and Molecular Electronic Structure System (GAMESS) demostraron un rendimiento competitivo superior a 2 veces con la GPU Intel Max en comparación con la Nvidia A100. Esto permite modelar procesos químicos complicados en el diseño de fármacos y catalizadores para desvelar los secretos de la ciencia molecular con la supercomputadora Aurora.
- Hardware/Hybrid Accelerated Cosmology Code (HACC) ha demostrado que se ejecuta en más de 1.500 nodos Aurora, lo que permite la visualización y comprensión de la física y la evolución del universo.
- La aplicación de inferencia de inteligencia artificial para cribado de medicamentos, parte del proyecto de ciencia temprana de descubrimiento de medicamentos Aurora (ESP), permite el cribado eficiente de vastos conjuntos de datos químicos al posibilitar el cribado de más de 20 mil millones de los compuestos más sintetizados en tan solo 256 nodos.
Intel también mostró un nuevo desempeño de HPC e IA, así como optimizaciones de software en hardware y aplicaciones:
- Intel y Dell publicaron los resultados de STAC-A2, un conjunto de análisis de referencia independiente basado en cargas de trabajo de análisis de riesgo de mercado del mundo real, lo que muestra un excelente desempeño para la industria financiera. En comparación con ocho GPUs Nvidia H100 PCIe, cuatro GPU Intel® Data Center GPU Max 1550 tuvieron un rendimiento de warm Greeks 10-100k-1260 un 26% superior y una eficiencia espacial 4.3 veces mayor.
- La Intel® Data Center GPU Max Series 1550 supera a la tarjeta PCIe Nvidia H100 en un promedio del 36 % (1,36 veces) en diversas cargas de trabajo de HPC.
- Intel Data Center GPU Max Series ofrece una mejor compatibilidad con los modelos de IA, incluidos varios modelos de lenguaje grandes (LLM) como GPT-J y LLAMA2.
- Intel® Xeon® CPU Max Series, el único procesador x86 con memoria de gran ancho de banda (HBM), ofreció un desempeño promedio un 19 % más alto en comparación con el procesador AMD Epyc Genoa.
- La semana pasada, MLCommons2 publicó los resultados del análisis de referencia de capacitación MLPerf v3.1 estándar de la industria para entrenar modelos de IA. Intel Gaudi2 demostró un salto significativo de desempeño 2 veces con la implementación del tipo de datos FP8 en el análisis de referencia GPT-3 de entrenamiento v3.1.
- Intel marcará el comienzo de los aceleradores de IA Intel Gaudi3 en 2024. El acelerador de inteligencia artificial Gaudi3 estará basado en la misma arquitectura de alto rendimiento que Gaudi2 y se espera que ofrezca 4 veces la capacidad de cálculo (BF16), el doble del ancho de banda de red para un mayor rendimiento en escala y 1.5 veces la memoria HBM a bordo para manejar fácilmente la creciente demanda de cómputo de alto rendimiento y eficiencia para modelos de lenguaje de gran tamaño sin degradación del rendimiento.
- Los procesadores Intel® Xeon® de 5ª generación ofrecerán un desempeño hasta 1,4 veces mayor de generación en aplicaciones HPC, como lo demuestra LAMMPS-Copper.
- Granite Rapids, un futuro procesador Intel Xeon, ofrecerá un mayor número de núcleos y aceleración integrada con Intel® Advanced Matrix Extensions y compatibilidad con DIMM de rangos combinados de multiplexor (MCR). Granite Rapids tendrá una inferencia de IA de DeepMD+LAMMPS 2,9 veces mejor. MCR alcanza velocidades de 8,800 megatransferencias por segundo basado en DDR5 y más de 1.5 terabytes por segundo de capacidad de ancho de banda de memoria en un sistema de dos sockets, lo cual es fundamental para alimentar el creciente número de núcleos de las CPU modernas y permitir eficiencia y flexibilidad.
Acerca de los nuevos avances en oneAPI: Intel ha anunciado características para sus herramientas de desarrollo de software de 2024 que impulsan el desarrollo de software abierto basado en programación multiarquitectura con oneAPI. Las nuevas herramientas ayudan a los desarrolladores a ampliar las capacidades de inteligencia artificial y computación de alto rendimiento en las CPUs y GPUs de Intel con una cobertura más amplia, incluido un rendimiento más rápido y despliegues utilizando Python estándar para cargas de trabajo numéricas, y mejoras en el compilador que ofrecen una implementación casi completa de SYCL 2020 para mejorar la productividad y la transferencia de código.
Además, el Centro de Computación Avanzada de Texas (TACC) anunció que su Centro de Excelencia oneAPI se centrará en proyectos que desarrollen y optimicen los códigos de referencia de imágenes sísmicas. Intel fomenta un entorno en el que la innovación y la investigación de software y hardware hacen avanzar a la industria, con 32 Centros de Excelencia oneAPI en todo el mundo.
Lo que sigue: Intel hizo hincapié en su compromiso con la IA y la HPC y destacó el impulso del mercado. Los nuevos despliegues de supercomputadoras con las tecnologías de GPU y CPU de la serie Max de Intel incluyen sistemas como Aurora, Dawn Phase 1, SuperMUC-NG Phase 2, Clementina XX1, y otros más. Los nuevos sistemas que incluyen los aceleradores Intel Gaudi2 cuentan con una gran supercomputadora de inteligencia artificial, siendo Stability AI el cliente principal.
Este impulso será fundamental para Falcon Shores, la GPU de próxima generación de Intel para IA y HPC. Falcon Shores aprovechará la propiedad intelectual (PI) de Intel Gaudí e Intel Xe con una única interfaz de programación de GPU basada en oneAPI. Las aplicaciones basadas en aceleradores de IA Intel Gaudí, así como en las GPU Intel serie Max de hoy, podrán migrar con facilidad a Falcon Shores en el futuro.
Más contexto: Intel Gaudí AI Accelerator obtiene un salto de desempeño 2x superior a GPT-3 con el software FP8 | La supercomputadora de IA más rápida del Reino Unido, con tecnologías Intel y Dell, impulsará la investigación
La letra pequeña:
1Pruebas realizadas por el Laboratorio Nacional de Argonne. Intel no controla ni audita los datos de terceros. Le recomendamos consultar otras fuentes para evaluar la exactitud.
2Visite https://mlcommons.org/benchmarks/training/ para conocer las cargas de trabajo y las configuraciones. Los resultados pueden variar. El rendimiento varía en función del uso, la configuración y otros factores. Obtenga más información en el sitio de MLPerf. Los resultados de rendimiento se basan en pruebas realizadas en las fechas mostradas en las configuraciones y pueden no reflejar todas las actualizaciones públicamente disponibles.
Las tecnologías Intel pueden requerir la activación de hardware, software o servicios.
Los resultados de rendimiento se basan en pruebas realizadas en las fechas mostradas en las configuraciones y pueden no reflejar todas las actualizaciones públicamente disponibles. Ningún producto o componente puede ser absolutamente seguro.
El rendimiento varía en función del uso, la configuración y otros factores. Obtenga más información en el Sitio del Índice de Rendimiento.
Sus costos y resultados pueden variar.
Intel no controla ni audita los datos de terceros. Le recomendamos consultar otras fuentes para evaluar la exactitud.