Novedades: Hoy, MLCommons publicó los resultados del benchmark de entrenamiento de modelos de inteligencia artificial MLPerf v3.1, que es un estándar de la industria. En este contexto, Intel presentó resultados para los aceleradores Intel® Gaudi®2 y los procesadores Intel® Xeon™ Scalable de 4ª generación con Intel® Advanced Matrix Extensions (Intel® AMX). Intel Gaudi2 mostró un notable aumento de rendimiento del 2x al implementar el tipo de datos FP8 en el benchmark de entrenamiento GPT-3 v3.1. Las contribuciones a los benchmarks subrayan el compromiso de Intel de expandir la inteligencia artificial de manera integral mediante soluciones competitivas en este campo.
"Seguimos mejorando con nuestra gama de inteligencia artificial y elevamos la vara con nuestros resultados en rendimiento en los benchmarks de MLCommons. Intel Gaudí y los procesadores Xeon de 4ª Generación ofrecen un importante beneficio de relación precio-rendimiento a los clientes y están listos para su implementación hoy mismo. Nuestra amplitud de configuración de hardware y software de IA ofrece a los clientes soluciones integrales y opciones adaptadas a sus cargas de trabajo de IA".
Por qué es importante: Los resultados más recientes de MLCommons MLPerf se basan en el sólido desempeño de Intel en IA en comparación con los resultados anteriores de capacitación de MLPerf de junio. El procesador Intel Xeon sigue siendo el único CPU que informa resultados de MLPerf, y el Intel Gaudi2 es una de las tres soluciones de aceleradores sobre las cuales se basan los resultados, de las cuales solo dos están disponibles comercialmente.
Los procesadores Intel Gaudi2 y Xeon de 4ª Generación demuestran un desempeño convincente en entrenamiento de IA en una variedad de configuraciones de hardware para abordar la gama cada vez más amplia de requisitos de cómputo de IA de los clientes.
Descargar dos imágenes (12 MB)
Acerca de los resultados de Intel Gaudi2: Gaudi2 sigue siendo la única alternativa viable al H100 de NVIDIA para las necesidades de cómputo de IA, ofreciendo una relación precio-rendimiento significativa. Los resultados de MLPerf para Gaudi2 mostraron el creciente rendimiento de entrenamiento del acelerador de IA:
- Gaudi2 demostró un aumento de rendimiento del 2x con la implementación del tipo de datos FP8 en el benchmark de entrenamiento GPT-3 v3.1, reduciendo el tiempo de entrenamiento a menos de la mitad en comparación con el benchmark de MLPerf de junio. Completó el entrenamiento en 153.58 minutos utilizando 384 aceleradores Intel Gaudi2. El acelerador Gaudi2 admite FP8 en formatos E5M2 y E4M3, con la opción de escalado diferido cuando sea necesario.
- Intel Gaudi2 demostró el entrenamiento en el modelo multimodal de difusión estable con 64 aceleradores en 20.2 minutos, utilizando BF16. En futuros benchmarks de MLPerf, el rendimiento de difusión estable se presentará en el tipo de datos FP8.
- En ocho aceleradores Intel Gaudi2, los resultados de referencia fueron de 13,27 y 15,92 minutos para BERT y ResNet-50, respectivamente, utilizando BF16.
Acerca de los resultados del procesador Xeon de 4ª generación: Intel sigue siendo el único proveedor de CPU que presenta resultados de MLPerf. Los resultados de MLPerf para Xeon de 4ta Generación destacaron su sólido desempeño:
- Intel presentó resultados para RESNet50, RetinaNet, BERT y DLRM dcnv2. Los resultados de los procesadores Intel Xeon Scalable de 4ta generación para ResNet50, RetinaNet y BERT fueron similares a los sólidos resultados de rendimiento directo presentados para el benchmark MLPerf de junio de 2023.
- DLRM dcnv2 es un nuevo modelo de la presentación de junio, con la CPU demostrando una presentación de tiempo de entrenamiento de 227 minutos utilizando solo cuatro nodos.
El rendimiento del procesador Intel Xeon de 4ta generación demuestra que muchas organizaciones empresariales pueden entrenar modelos de aprendizaje profundo de pequeño a mediano tamaño de manera económica y sostenible en su infraestructura de TI empresarial existente con CPUs de propósito general, especialmente para casos de uso en los que el entrenamiento es una carga de trabajo intermitente.
Lo que sigue: Con las actualizaciones y optimizaciones de software, Intel anticipa más avances en los resultados de desempeño de IA en los próximos benchmarks de MLPerf. Los productos de IA de Intel ofrecen a los clientes más opciones de soluciones para satisfacer los requisitos dinámicos que requieren desempeño, eficiencia y facilidad de uso.
Más contexto: Anuncio de MLCommons