PUNTOS DESTACADOS
- Intel lanza Xeon 6 con núcleos de desempeño (núcleos P), duplicando el desempeño para cargas de trabajo de IA y HPC.
- Los nuevos aceleradores de IA Gaudi 3 ofrecen hasta un 20 por ciento más de rendimiento y 2 veces precio / rendimiento en comparación con H100 para inferencia de LLaMa 2 70B1.
SANTA CLARA, California, 24 de septiembre de 2024 /PRNewswire/ -- A medida que la IA continúa revolucionando las industrias, las empresas necesitan cada vez más infraestructura que sea rentable y esté disponible para un rápido desarrollo e implementación. Para satisfacer esta demanda de frente, Intel lanzó hoy Xeon 6 con núcleos de desempeño (P-cores) y aceleradores de IA Gaudi 3, reforzando el compromiso de la compañía de ofrecer potentes sistemas de IA con un desempeño óptimo por vatio y un menor costo total de propiedad (TCO).
"La demanda de IA está llevando a una transformación masiva en el centro de datos, y la industria está pidiendo opciones en hardware, software y herramientas de desarrollo", dijo Justin Hotard, vicepresidente ejecutivo de Intel y gerente general del Grupo de Centro de Datos e Inteligencia Artificial. "Con nuestro lanzamiento de Xeon 6 con P-cores y aceleradores de IA Gaudi 3, Intel está habilitando un ecosistema abierto que permite a nuestros clientes implementar todas sus cargas de trabajo con mayor desempeño, eficiencia y seguridad".
Más: Intel Xeon 6 con P-cores y aceleradores de IA Gaudi 3 (Press Kit) | Desempeño de liderazgo con Intel Xeon serie 6900 P-core (Hoja informativa) | Una nueva era de soluciones y sistemas de IA empresarial de alto desempeño (hoja de citas)
Presentamos Intel Xeon 6 con P-cores y aceleradores de IA Gaudi 3
Los avances más recientes de Intel en infraestructura de IA incluyen dos actualizaciones importantes a su cartera de centros de datos:
- Intel® Xeon® 6 con núcleos P: Diseñado para manejar cargas de trabajo de uso intensivo de cómputo con una eficiencia excepcional, Xeon 6 ofrece el doble de desempeño que su predecesor2. Cuenta con un mayor número de núcleos, el doble de ancho de banda de memoria y capacidades de aceleración de IA integradas en cada núcleo. Este procesador está diseñado para satisfacer las demandas de desempeño de la IA, desde el perímetro hasta los entornos de centro de datos y nube.
- Acelerador de IA Intel® Gaudi® 3: Específicamente optimizado para la IA generativa a gran escala, Gaudi 3 cuenta con 64 núcleos de procesador Tensor (TPC) y ocho motores de multiplicación de matriz (MME) para acelerar los cálculos de redes neuronales profundas. Incluye 128 gigabytes (GB) de memoria HBM2e para entrenamiento e inferencia, y 24 puertos Ethernet de 200 Gigabit (Gb) para redes escalables. Gaudi 3 también ofrece compatibilidad perfecta con el marco PyTorch y los modelos avanzados de transformador y difusor Hugging Face. Intel anunció recientemente una colaboración con IBM para implementar aceleradores de IA Intel Gaudi 3 como un servicio en IBM Cloud. A través de esta colaboración, Intel e IBM pretenden reducir el costo total de propiedad para aprovechar y escalar la IA, al tiempo que mejoran el desempeño.
Mejora de los sistemas de IA con los beneficios de TCO
La implementación de IA a escala implica consideraciones como opciones de implementación flexibles, relaciones competitivas entre precio y desempeño y tecnologías de IA accesibles. La sólida infraestructura x86 y el amplio ecosistema abierto de Intel la posicionan para ayudar a las empresas a construir sistemas de IA de alto valor con un TCO y un desempeño por vatio óptimos. En particular, el 73 % de los servidores acelerados por GPU utilizan Intel Xeon como CPU host3.
Intel se asocia con los principales fabricantes de equipos originales, como Dell Technologies y Supermicro, para desarrollar sistemas de ingeniería conjunta adaptados a las necesidades específicas de los clientes para implementaciones efectivas de IA. Actualmente, Dell Technologies está diseñando conjuntamente soluciones basadas en RAG que aprovechan Gaudi 3 y Xeon 6.
Cerrando la brecha entre los prototipos y la producción con esfuerzos de ingeniería conjunta
La transición de las soluciones de IA generativa (Gen AI) de prototipos a sistemas listos para producción presenta desafíos en tiempo real, manejo de errores, registro, seguridad y escalabilidad. Intel aborda estos desafíos a través de esfuerzos de ingeniería conjunta con OEM y socios para ofrecer soluciones de generación aumentada (RAG) de recuperación lista para la producción.
Estas soluciones, basadas en la plataforma Open Platform Enterprise AI (OPEA), integran microservicios basados en OPEA en un sistema RAG escalable, optimizado para los sistemas Xeon y Gaudi AI, diseñado para permitir a los clientes integrar fácilmente aplicaciones de Kubernetes, Red Hat OpenShift AI y Red Hat Enterprise Linux AI.
Ampliación del acceso a las aplicaciones de IA empresariales
La cartera Tiber de Intel ofrece soluciones empresariales para abordar desafíos como el acceso, el costo, la complejidad, la seguridad, la eficiencia y la escalabilidad en entornos de IA, nube y perímetro. Intel® Tiber™ Developer Cloud ahora ofrece sistemas de vista previa de Intel Xeon 6 para pruebas y evaluación tecnológica. Además, algunos clientes seleccionados obtendrán acceso anticipado a Intel Gaudi 3 para validar las implementaciones del modelo de IA, y los clústeres de Gaudi 3 comenzarán a implementarse el próximo trimestre para implementaciones de producción a gran escala.
Las nuevas ofertas de servicios incluyen SeekrFlow, una plataforma de IA de extremo a extremo de Seekr para desarrollar aplicaciones de IA confiables. Las últimas actualizaciones incluyen la versión más reciente del software Intel Gaudi y las computadoras portátiles Jupyter cargadas con PyTorch 2.4 e Intel oneAPI y herramientas de IA 2024.2, que incluyen nuevas capacidades de aceleración de IA y compatibilidad con procesadores Xeon 6.
1Ver intel.com/processorclaims: Intel Gaudi 3. Los resultados pueden variar.
2Véase intel.com/processorclaims: Intel Xeon 6. Los resultados pueden variar.
3Fuente: informe IDC Server Tracker basado en el volumen del sistema Q1'24.