newsroom de Intel

Innovaciones aceleradas para una HPC sostenible y abierta

Intel satisface la insaciable demanda informática con la sostenibilidad como prioridad para todos en la próxima era de la supercomputación.

Por Jeff McVeigh

A medida que nos embarcamos en la era de la exaescala y corremos hacia la zettaescala, la contribución de la industria de la tecnología a las emisiones globales de carbono también está creciendo. Se ha estimado que para 2030, entre el 3% y el 7%1 de la producción mundial de energía será consumida por los centros de datos, siendo la infraestructura informática uno de los principales impulsores del nuevo uso de electricidad.

Este año, Intel se comprometió a lograr cero emisiones netas de gases de efecto invernadero en nuestras operaciones globales para 2040 y a desarrollar soluciones tecnológicas más sostenibles. Mantenerse al día con las demandas insaciables de computación mientras se crea un futuro sostenible es uno de los mayores desafíos para la computación de alto rendimiento (HPC). Si bien es desalentador, es alcanzable si abordamos cada parte de la pila de cómputo de HPC: silicio, software y sistemas.

Este es el corazón de mi discurso de apertura en ISC 2022 en Hamburgo, Alemania. (Vea la repetición en la parte superior de esta página).

Comience con el silicio y la arquitectura de cómputo heterogénea

Tenemos una hoja de ruta de HPC agresiva planificada hasta 2024 que ofrecerá una cartera diversa de arquitecturas heterogéneas. Estas arquitecturas nos permitirán mejorar el rendimiento en órdenes de magnitud al tiempo que reducen las demandas de energía en cargas de trabajo de propósito general y emergentes, como IA, cifrado y análisis.

El procesador Intel® Xeon® con nombre en código Sapphire Rapids con memoria de alto ancho de banda (HBM) es un gran ejemplo de cómo estamos aprovechando las tecnologías avanzadas de empaquetado y las innovaciones de silicio para brindar mejoras sustanciales de rendimiento, ancho de banda y ahorro de energía para HPC. Con hasta 64 gigabytes de memoria HBM2e de gran ancho de banda en el paquete y aceleradores integrados en la CPU, podemos liberar cargas de trabajo vinculadas al ancho de banda de memoria al tiempo que ofrecemos mejoras significativas de rendimiento en casos de uso clave de HPC. Al comparar los procesadores escalables Intel® Xeon® de 3.ª generación con los próximosprocesadores De apphire Rapids HBM,estamos viendo aumentos de rendimiento de dos a tres veces en las cargas de trabajo de investigación meteorológica, energía, fabricación y física2. En la conferencia magistral, Prith Banerjee, CTO de Ansys, también muestra que Sapphire Rapids HBM ofrece un aumento de rendimiento de hasta 2 veces mayor en cargas de trabajo del mundo real de Ansys Fluent y ParSeNet3.

La densidad de cómputo es otro imperativo a medida que presionamos para obtener ganancias de rendimiento de órdenes de magnitud en las cargas de trabajo de supercomputación de HPC e IA. Nuestra primera unidad insignia de procesamiento de gráficos (GPU) para centros de datos de Intel, cuyo nombre en código es Ponte Vecchio, ya está superando a la competencia por aplicaciones de servicios financieros complejos y cargas de trabajo de inferencia y capacitación de IA. También mostramos que Ponte Vecchio está acelerando la simulación de alta fidelidad 2 veces con OpenMC4.

No nos detenemos aquí. Hoy anunciamos nuestro sucesor de esta poderosa GPU de centro de datos, cuyo nombre en código es Rialto Bridge. Al evolucionar la arquitectura de Ponte Vecchio y combinar mosaicos mejorados con la próxima tecnología de nodos de proceso, Rialto Bridge ofrecerá una densidad, rendimiento y eficiencia significativamente mayores, al tiempo que proporciona consistencia de software.

Durante la Conferencia Internacional de Supercomputación el 31 de mayo de 2022, en Hamburgo, Alemania, Jeff McVeigh, vicepresidente y gerente general del Super Compute Group de Intel Corporation, anunció Rialto Bridge, la unidad de procesamiento de gráficos (GPU) del centro de datos de Intel. Utilizando la misma arquitectura que la GPU del centro de datos Intel Ponte Vecchio y combinando mosaicos mejorados con el próximo nodo de proceso de Intel, Rialto Bridge ofrecerá hasta 160 núcleos Xe, más FLOPs, más ancho de banda de I/O y límites de TDP más altos para una densidad, rendimiento y eficiencia significativamente mayores. (Crédito: Intel Corporation)

Descarga la imagen completa

De cara al futuro, Falcon Shores es la próxima gran innovación de arquitectura en nuestra hoja de ruta, reuniendo las arquitecturas x86 CPU y Xe GPU en un solo zócalo. Esta arquitectura está prevista para 2024 y se proyecta que ofrezca beneficios de más de 5 veces el rendimiento por vatio, la densidad de cómputo 5x, la capacidad de memoria 5x y las mejoras de ancho de banda5.

Durante la Conferencia Internacional de Supercomputación el 31 de mayo de 2022, en Hamburgo, Alemania, Jeff McVeigh, vicepresidente y gerente general del Super Compute Group en Intel Corporation, presentó Falcon Shores. La próxima gran innovación de arquitectura en la hoja de ruta de Intel reúne la GPU x86 y Xe en un solo enchufe. (Crédito: Intel Corporation)

Descarga la imagen completa

Principios de una estrategia de software exitosa: abierto, elección, confianza

El silicio es solo arena sin software para darle vida. Nuestro enfoque del software es facilitar el desarrollo abierto en toda la pila y proporcionar herramientas, plataformas e IP de software para ayudar a los desarrolladores a ser más productivos y producir código escalable, de mejor rendimiento y más eficiente que pueda aprovechar las últimas innovaciones de silicio sin la carga de refactorizar el código. La iniciativa de la industria oneAPI proporciona a los desarrolladores de HPC programación de arquitectura cruzada para que el código se pueda dirigir a CPU, GPU y otros aceleradores especializados de forma transparente y portátil.

Durante la Conferencia Internacional de Supercomputación el 31 de mayo de 2022, en Hamburgo, Alemania, Jeff McVeigh, vicepresidente y gerente general del Super Compute Group en Intel Corporation, mostró que el enfoque de Intel para el software es facilitar el desarrollo abierto en toda la pila y proporcionar herramientas, plataformas e IP de software para ayudar a los desarrolladores a ser más productivos, producir códigos de mejor rendimiento y más eficiente que puede aprovechar las últimas innovaciones de silicio sin la carga de refactorizar el código. (Crédito: Intel Corporation)

Descarga la imagen completa

Ahora hay más de 20 Centros de Excelencia oneAPI en instituciones académicas y de investigación líderes en todo el mundo, y están haciendo progresos significativos. Por ejemplo, Simon McIntosh-Smith y su equipo en el Departamento de Ciencias de la Universidad de Bristol están desarrollando las mejores prácticas para lograr la portabilidad del rendimiento a exaescala utilizando oneAPI y la capa de abstracción SYCL del Grupo Khronos para la programación de arquitectura cruzada. Su trabajo garantizará que el código científico pueda lograr un alto rendimiento en sistemas de supercomputación heterogéneos masivos en todo el mundo.

Vinculándolo: Sistemas para una computación heterogénea sostenible

A medida que el centro de datos y las cargas de trabajo de HPC se mueven cada vez más hacia arquitecturas desagregadas y computación heterogénea, necesitaremos herramientas que puedan ayudarnos a administrar de manera efectiva estos entornos informáticos complejos y diversos.

Hoy presentamos Intel® XPU Manager, una solución de código abierto para supervisar y administrar las GPU de centros de datos Intel de forma local y remota. Fue diseñado para simplificar la administración, maximizar la confiabilidad y el tiempo de actividad mediante la ejecución de diagnósticos completos, mejorar la utilización y realizar actualizaciones de firmware.

Un sistema de archivos de almacenamiento de objetos asincrónicos distribuidos (DAOS) proporciona optimizaciones a nivel de sistema para las tareas de consumo de energía de mover y almacenar datos. DAOS tiene un enorme impacto en el rendimiento del sistema de archivos, tanto mejorando el tiempo de acceso general como reduciendo la capacidad requerida para el almacenamiento para reducir las huellas del centro de datos y aumentar la eficiencia energética. En los resultados de I/O 500 en relación con Lustre, DAOS logró un aumento de 70 veces6 en el rendimiento del sistema de archivos de escritura dura.

Abordar el desafío de sostenibilidad de HPC

Estamos orgullosos de asociarnos con clientes de ideas afines e instituciones de investigación líderes en todo el mundo para lograr una HPC más sostenible y abierta. Ejemplos recientes incluyen nuestra asociación con el Barcelona Supercomputing Center para establecer un laboratorio pionero RISC-V zettascale, y nuestra colaboración continua con la Universidad de Cambridge y Dell para evolucionar el actual Exascale Lab en el nuevo Cambridge Zettascale Lab. Estos esfuerzos se basan en nuestros planes para crear un sólido ecosistema de innovación de la UE para el futuro de la informática.

La conclusión es que ninguna empresa puede hacerlo sola. Todo el ecosistema necesita apoyarse por igual, a través de la fabricación, el silicio, la interconexión, el software y los sistemas. Al hacer esto juntos, podemos convertir uno de los mayores desafíos de HPC del siglo en la oportunidad del siglo, y cambiar el mundo para las generaciones futuras.

Jeff McVeigh es vicepresidente y gerente general de Super Compute Group en Intel Corporation.

Noticias y avisos:
1 La hipótesis de Andrae para el uso de energía primaria, el uso de electricidad y las emisiones de CO2 de la informática global y su participación en el total entre 2020 y 2030, WSEAS Trans Power Syst, 15 (2020)
2 Según lo medido por lo siguiente:
CloverLeaf
  • Prueba realizada por Intel a partir del 26/04/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT On, Turbo On, Memoria total 256GB (16x16GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04, Kernel 5.10, 0xd0002a0, ifort 2021.5, Intel MPI 2021.5.1, compilación: -xCORE-AVX512 –qopt-zmm-usage=high
  • Prueba realizada por Intel a partir del 19/04/22. Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versión 5.16, ifort 2021.5, Intel MPI 2021.5.1, compilación: -xCORE-AVX512 –qopt-zmm-usage=high
OpenFOAM
  • Prueba realizada por Intel a partir del 26/01/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8380), 80 núcleos, HT On, Turbo On, Memoria total 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS Versión SE5C6200.86B.0020.P23.2103261309, 0xd000270, Rocky Linux 8.5 , Linux versión 4.18., OpenFOAM® v1912, Motorbike 28M @ 250 iteraciones; Notas de compilación: Herramientas: Intel Parallel Studio 2020u4, compilación: -O3 -ip -xCORE-AVX512
  • Prueba realizada por Intel a partir del 26/01/2022 Procesador escalable Intel® Xeon® de 1 nodo y 2x preproducción con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT Off, Turbo Off, Memoria total de 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, Linux versión 5.12, OpenFOAM® v1912, Motorbike 28M @ 250 iteraciones; Notas de compilación: Herramientas: Intel Parallel Studio 2020u4, compilación: -O3 -ip -xCORE-AVX512
WRF
  • Prueba realizada por Intel a partir del 05/03/2022. 1 nodo, 2 CPU Intel® Xeon® 8380, 80 núcleos, HT On, Turbo On, Memoria total 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS Versión SE5C6200.86B.0020.P23.2103261309, ucode revision=0xd000270, Rocky Linux 8.5, Linux versión 4.18, WRF v4.2.2
  • Prueba realizada por Intel a partir del 05/03/2022. Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión del BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versión 5.16, WRF v4.2.2
YASK
  • Prueba realizada por Intel a partir del 09/05/2022. 1 nodo, 2x CPU Intel® Xeon® Platinum 8360Y, 72 núcleos, HT On, Turbo On, Memoria total 256GB (16x16GB DDR4 3200 MT/s), SE5C6200.86B.0021.D40.2101090208, Rocky linux 8.5, kernel 4.18.0, 0xd000270, Build knobs: make -j YK_CXX='mpiicpc -cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,
  • Prueba realizada por Intel a partir del 03/05/22. Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM, >40 núcleos, HT ON, Turbo ON, memoria total de 128 GB (HBM2e a 3200 MHz), versión de BIOS EGSDCRB1.86B.0077.D11.2203281354, ucode revision=0x83000200, CentOS Stream 8, Linux versión 5.16, compilación: make -j YK_CXX='mpiicpc -cxx=icpx' arch=avx2 stencil=iso3dfd radius=8,
3 Ansys Fluent
  • Prueba realizada por Intel a partir de 2/2022 1 nodo, 2x CPU Intel ® Xeon ® Platinum 8380, 80 núcleos, HT On, Turbo On, Memoria total 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS versión SE5C6200.86B.0020.P23.2103261309, ucode revision=0xd000270, Rocky Linux 8.5, Linux versión 4.18, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: Versión comercial que utiliza el compilador Intel 19.3 e Intel MPI 2019u
  • Prueba realizada por Intel a partir de 2/2022 1 nodo, 2x Preproducción Intel® Xeon® Scalable Processor nombres en código Sapphire Rapids con HBM, >40 núcleos, HT Off, Turbo Off, Total Memory 128 GB (HBM2e a 3200 MHz), plataforma de preproducción y BIOS, CentOS 8, Linux versión 5.12, Ansys Fluent 2021 R2 Aircraft_wing_14m; Notas de compilación: Versión comercial que utiliza el compilador Intel 19.3 e Intel MPI 2019u8

Ansys ParSeNet
  • Prueba realizada por Intel a partir del 24/05/2022. 1 nodo, 2 CPU Intel® Xeon® Platinum 8380, 80 núcleos, HT On, Turbo On, Memoria total 256GB (16x16GB DDR4 3200 MT/s [3200 MT/s]), SE5C6200.86B.0021.D40.2101090208, Ubuntu 20.04.1 LTS, 5.10, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)
  • Prueba realizada por Intel a partir del 18/04/2022. Procesador escalable Intel® Xeon® de preproducción de 1 nodo y 2x con nombre en código Sapphire Rapids Plus HBM, 112 núcleos, HT On, Turbo On, Memoria total de 128 GB (HBM2e 3200 MT/s), EGSDCRB1.86B.0077.D11.2203281354, CentOS Stream 8, 5.16, ParSeNet (SplineNet), PyTorch 1.11.0, Torch-CCL 1.2.0, IPEX 1.10.0, MKL (2021.4-Product Build 20210904), oneDNN (v2.5.0)
4 Prueba realizada por el Laboratorio Nacional Argonne a partir del 23/05/2022, 1 nodo, 2x AMD EPYC 7532, 256 GB DDR4 3200, HT On, Turbo On, ucode 0x8301038. 1x A100 40GB PCIe. OpenSUSE Leap 15.3, Linux Versión 5.3.18, Libararies: CUDA 11.6 con compilador openMP clang. Compilación: cmake --preset=llvm_a100 -DCMAKE_UNITY_BUILD=ON -DCMAKE_UNITY_BUILD_MODE=BATCH -DCMAKE_UNITY_BUILD_BATCH_SIZE=1000 -DCMAKE_INSTALL_PREFIX=./install -Ddebug=off -Doptimize=on -Dopenmp=on -Dnew_w=on -Ddevice_history=off -Ddisable_xs_cache=on -Ddevice_printf=off. Benchmark: Rendimiento de lotes inactivos de combustible agotado en reactor HM-Large con partículas de 40 M
Prueba realizada por Intel a partir del 25/05/2022, 1 nodo, 2 procesadores escalables Intel(r) Xeon(r) 8360Y, DDR4 3200 de 256 GB, HT activado, turbo, activado, ucode 0xd0002c1. 1x Pre-producción Ponte Vecchio. Ubunt 20.04, Linux Versión 5.10.54, agama 434, Build Knobs: cmake -DCMAKE_CXX_COMPILER="mpiicpc" -DCMAKE_C_COMPILER="mpiicc" -DCMAKE_CXX_FLAGS="-cxx=icpx -mllvm -indvars-widen-indvars=false -Xclang -fopenmp-declare-target-global-default-no-map -std=c++17 -Dgsl_CONFIG_CONTRACT_CHECKING_OFF -fsycl -DSYCL_SORT -D_GLIBCXX_USE_TBB_PAR_BACKEND=0" --preset=spirv -DCMAKE_UNITY_BUILD=ON -DCMAKE_UNITY_BUILD_MODE=BATCH -DCMAKE_UNITY_BUILD_BATCH_SIZE=1000 -DCMAKE_INSTALL_PREFIX=.. /install -Ddebug=off -Doptimize=on -Dopenmp=on -Dnew_w=on -Ddevice_history=off -Ddisable_xs_cache=on -Ddevice_printf=off Benchmark: Rendimiento de lotes inactivos de combustible agotado en reactor HM-Large con partículas de 40M
5 Objetivos de rendimiento de Falcon Shores basados en estimaciones relativas a las plataformas actuales en febrero de 2022. Los resultados pueden variar.
6 Los resultados pueden variar. Obtenga más información en io500 y "Comparación del rendimiento de DAOS con la instalación de Lustre" en YouTube.
Todos los planes y las guías de productos están sujetos a cambios sin previo aviso.
Intel no controla ni audita los datos de terceros. Debería consultar otras fuentes para evaluar la exactitud.
Las tecnologías Intel podrían requerir hardware habilitado, software específico o la activación de servicios.
El desempeño varía según el uso, la configuración y otros factores. Más información en www.Intel.com/PerformanceIndex.
Los resultados de desempeño se basan en pruebas realizadas en las fechas indicadas en las configuraciones y es posible que no reflejen todas las actualizaciones públicamente disponibles. Consulte las copias de seguridad para conocer los detalles de la configuración. Ningún producto o componente puede ser absolutamente seguro.
Sus costos y resultados pueden variar.
Las declaraciones que se refieren a planes o expectativas futuras son declaraciones prospectivas. Estas declaraciones se basan en las expectativas actuales e implican muchos riesgos e incertidumbres que podrían generar que los resultados reales difieran considerablemente con aquellas declaraciones expresadas o implícitas. Para obtener más información sobre los factores que podrían causar que los resultados reales difieran considerablemente, consulte nuestros informes de ingresos y presentaciones ante la Comisión de Bolsa y Valores de EE. UU. (SEC, por sus siglas en inglés) en www.intc.com.