Intel y la IA empresarial con Gaudi 3: la estrategia de sistemas abiertos de IA y nuevos éxitos de clientes

En Vision 2024, Intel apuesta por una IA empresarial abierta y más segura con nuevos clientes, socios y colaboraciones en todo el continuo de IA.

Noticias

  • 9 de abril de 2024

  • Contacta al equipo PR de Intel

  • Siga las noticias de Intel en las redes sociales:

    Logotipo de Twitter
    Icono de YouTube

author-image

Por

Noticias destacadas:

 

  • Intel dio a conocer una estrategia integral de IA para empresas, con sistemas abiertos y escalables que funcionan en todos los segmentos de IA.
  • Presentó el acelerador de IA Intel® Gaudi® 3, que ofrece un aumento del 50% en velocidad1 y un 40 % en eficiencia energética 2 en comparación con Nvidia H100, a una fracción del costo.
  • Intel anunció la disponibilidad de Gaudi 3 a los fabricantes de equipos originales (OEM), incluidos Dell Technologies, HPE, Lenovo y Supermicro, ampliando las ofertas del mercado de centros de datos de IA para las empresas.
  • Se anunciaron nuevos clientes y socios para el acelerador Intel Gaudi, incluyendo Bharti Airtel, Bosch, CtrlS, IBM, IFF, Landing AI, Ola, NAVER, NielsenIQ, Roboflow y Seekr.
  • Intel anunció la intención de crear una plataforma abierta para la IA empresarial junto con SAP, Red Hat, VMware y otros líderes de la industria para acelerar el despliegue de sistemas de IA generativa segura (GenAI), habilitados por la generación aumentada por recuperación (RAG).
  • A través del Ultra Ethernet Consortium (UEC), Intel lidera las redes Ethernet abiertas para la estructura de IA. La compañía presentó una serie de soluciones Ethernet optimizadas para IA, incluida la NIC (tarjeta de interfaz de red) de IA y los chiplets de conectividad AI.

 

PHOENIX, 9 de abril de 2024 – En la conferencia Intel Vision 2024 , la compañía presentó el acelerador Gaudi 3 para brindar desempeño, apertura y opciones a la IA generativa empresarial (GenAI), y dio a conocer un conjunto de nuevos sistemas escalables abiertos, productos de próxima generación y colaboraciones estratégicas para acelerar la adopción de GenAI. Con solo el 10% de las empresas que lograron mover proyectos de GenAI a producción el año pasado, las últimas ofertas de Intel abordan los desafíos que estas enfrentan al escalar las iniciativas de IA.

"Gracias al silicio, la innovación avanza a un ritmo sin precedentes y todas las empresas se están convirtiendo rápidamente en empresas de IA", dijo el CEO de Intel, Pat Gelsinger. "Intel está llevando la IA a todas partes, desde la PC hasta el centro de datos y el edge. Nuestras últimas plataformas Gaudi, Xeon y Core Ultra están ofreciendo un conjunto cohesionado de soluciones flexibles adaptadas para satisfacer las necesidades cambiantes de nuestros clientes y socios, y capitalizar las inmensas oportunidades que tenemos por delante".

Más: Intel Vision 2024 (Kit de prensa) | Intel Vision 2024 Keynote (transmisión en vivo) | Intel aborda la brecha GenAI con Gaudí 3 (Noticias)

Las empresas están buscando escalar GenAI desde el piloto hasta la producción. Para hacerlo, necesitan soluciones fácilmente accesibles, basadas en procesadores eficientes en cuanto a costo y energía, como Intel Gaudi 3 AI Accelerator, que también aborden los requisitos de complejidad, fragmentación, seguridad de los datos y cumplimiento.

Presentamos Gaudi 3 para el entrenamiento y la inferencia de IA

El acelerador Intel Gaudi 3 alimentará sistemas con decenas de miles de aceleradores conectados a través del estándar común de Ethernet. Intel Gaudi 3 promete 4 veces más computación de IA para BF16 y un aumento de 1,5 veces en el ancho de banda de memoria con respecto a su predecesor. El acelerador ofrecerá un salto significativo en el entrenamiento y la inferencia de IA para las empresas globales que buscan implementar GenAI a escala.

En comparación con Nvidia H100, se proyecta que Intel Gaudi 3 ofrecerá un tiempo de entrenamiento 50% más rápido en promedio3 en todos los modelos Llama2 con parámetros 7B y 13B, y el modelo de parámetros GPT-3 175B. Además, se proyecta que el rendimiento de inferencia del acelerador Intel Gaudi 3 superará al H100 en un 50% en velocidad 1 y en un 40% en eficiencia energética 2 en los modelos de parámetros Llama 7B y 70B, y Falcon 180B.

Intel Gaudi 3 ofrece software abierto y basado en la comunidad y redes Ethernet estándar de la industria. Además, permite a las empresas escalar de manera flexible desde un solo nodo a clústeres, superclústeres y megaclústeres con miles de nodos, lo que admite la inferencia, el ajuste y la capacitación a la mayor escala.

Intel Gaudi 3 estará disponible para los fabricantes de equipos originales, incluidos Dell Technologies, HPE, Lenovo y Supermicro, en el segundo trimestre de 2024.

Lea más en "Intel aborda la brecha GenAI con Gaudi 3".

Generar valor para los clientes con soluciones Intel AI

Intel describió su estrategia para sistemas de IA abiertos y escalables, incluyendo hardware, software, marcos y herramientas. El enfoque de Intel permite un amplio ecosistema abierto de actores de IA para ofrecer soluciones que satisfagan las necesidades específicas de GenAI de las empresas. Esto incluye fabricantes de equipos, proveedores de bases de datos, integradores de sistemas, proveedores de software y servicios, entre otros. También permite a las empresas utilizar los socios del ecosistema y las soluciones que ya conocen y en los que confían.

Intel compartió un amplio impulso con clientes empresariales y socios de todos los sectores para implementar las soluciones del acelerador Intel Gaudi para nuevas e innovadoras aplicaciones de IA generativa:

 

  • NAVER: Desarrollar un potente modelo de lenguaje grande (LLM) para la implementación de servicios avanzados de IA a nivel mundial, desde la nube hasta el dispositivo. NAVER ha confirmado la capacidad fundacional de Intel Gaudi en la ejecución de operaciones informáticas para modelos de transformadores a gran escala con un rendimiento excepcional por vatio.
  • Bosch: Explorar más oportunidades para la fabricación inteligente, incluidos los modelos fundamentales que generan conjuntos de datos sintéticos de anomalías de fabricación para proporcionar conjuntos de capacitación sólidos y distribuidos de manera uniforme (por ejemplo, inspección óptica automatizada).
  • IBM: Emplea procesadores Intel® Xeon® de 5ª generación para su almacén de datos watsonx.data y colabora estrechamente con Intel para validar la plataforma watsonx™ para los aceleradores Intel Gaudi.
  • Ola/Krutrim: Pre- entrena y afina su modelo fundacional de la India con capacidades generativas en 10 idiomas, produciendo un rendimiento/coste líder en la industria (1,5-2 veces mejor) frente a las soluciones del mercado. Krutrim está entrenando un gran modelo fundacional en un clúster Gaudi 2. Krutrim ahora está entrenando previamente un modelo fundamental más grande en un clúster Intel® Gaudi® 2.
  • NielsenIQ, unacompañía de la cartera de Advent International: Implementa GenAI dentro de su plataforma Discover, incluyendo el entrenamiento de Modelos de Lenguaje Amplio (LLMs, por sus siglas en inglés) específicos del dominio en la base de datos más grande del mundo para el comportamiento de compra del consumidor, mejorando sus servicios al cliente.
  • Seekr: El líder en IA confiable ejecuta cargas de trabajo de producción en procesadores Intel® Gaudi 2, Intel® Data Center GPU Max Series y Intel® Xeon® en Intel®® Tiber™ Developer Cloud para el desarrollo de LLM y el soporte de implementación de producción.
  • IFF: Lidera la próxima ola de soluciones sostenibles para el cuidado del consumidor mediante el establecimiento de un flujo de trabajo de biología digital integrado y generado por IA para mejorar el diseño de enzimas y la tecnología de gemelos digitales para la optimización del proceso de fermentación.
  • CtrlS Group: Colabora para construir una supercomputadora de IA para clientes con sede en India y escalar los servicios de nube CtrlS para India con clústeres Gaudi adicionales.
  • Bharti Airtel: Aprovechando el poder de la tecnología de vanguardia de Intel, Airtel planea aprovechar sus ricos datos de telecomunicaciones para mejorar sus capacidades de IA y turbo cargar las experiencias de sus clientes. Los despliegues estarán en línea con el compromiso de Airtel de mantenerse a la vanguardia de la innovación tecnológica y ayudar a impulsar nuevas fuentes de ingresos en un panorama digital en rápida evolución.
  • Landing AI: Modelo de visión de gran escala adaptado a un dominio específico para segmentar células y detectar el cáncer.
  • Roboflow: Ejecuta cargas de trabajo de producción de los modelos YOLOv5, YOLOv8, CLIP, SAM y ViT para su plataforma integral de visión por ordenador.
  • Infosys: El líder mundial en servicios digitales y consultoría de próxima generación, anunció una colaboración estratégica para llevar las tecnologías de Intel, incluidos los procesadores Xeon de 4ª y 5ª generación, los aceleradores de IA Intel Gaudi 2 e Intel® Core™ Ultra a Infosys Topaz , un conjunto de servicios, soluciones y plataformas de IA que aceleran el valor comercial utilizando tecnologías de IA generativa.

 

Intel también anunció colaboraciones con Google Cloud, Thales y Cohesity para aprovechar las capacidades informáticas confidenciales en sus instancias de nube. Esto incluye Intel® Trust Domain Extensions (Intel® TDX), Intel® Software Guard Extensions (Intel® SGX) y el servicio de autenticación de Intel. Los clientes pueden ejecutar sus modelos y algoritmos de IA en un entorno de ejecución confiable (TEE) y aprovechar los servicios de confianza de Intel para verificar de forma independiente la confiabilidad de estos TEE.

El ecosistema se moviliza para desarrollar una plataforma abierta para la IA empresarial

En colaboración con Anyscale, Articul8, DataStax, Domino, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, Red Hat, Redis, SAP, VMware, Yellowbrick y Zilliz, Intel anunció la intención de crear una plataforma abierta para la IA empresarial. El esfuerzo de toda la industria tiene como objetivo desarrollar sistemas GenAI abiertos y de múltiples proveedores que ofrezcan la mejor facilidad de implementación, desempeño y valor de su clase, habilitados por la generación aumentada por recuperación. RAG permite que las vastas fuentes de datos patentadas existentes de las empresas que se ejecutan en la infraestructura de nube estándar se aumenten con capacidades LLM abiertas, acelerando el uso de GenAI en las empresas.

Como pasos iniciales en este esfuerzo, Intel lanzará implementaciones de referencia para los conductos GenAI en soluciones seguras basadas en Intel Xeon y Gaudi, publicará un marco conceptual técnico y continuará agregando capacidad de infraestructura en Intel Tiber Developer Cloud para el desarrollo del ecosistema y la validación de RAG y futuros pipelines. Intel alienta una mayor participación del ecosistema para unir fuerzas en este esfuerzo abierto para facilitar la adopción empresarial, ampliar la cobertura de soluciones y acelerar los resultados empresariales.

Hoja de ruta ampliada de IA y enfoque de ecosistema abierto

Además del acelerador Gaudi 3, Intel proporcionó actualizaciones sobre sus productos y servicios de próxima generación en todos los segmentos de la IA empresarial.

Nuevos procesadores Intel® Xeon® 6: Los procesadores Intel Xeon ofrecen una solución de rendimiento eficiente para ejecutar las soluciones GenAI actuales, incluyendo RAG, que producen resultados específicos de negocio utilizando datos propios. Intel presentó la nueva marca para sus procesadores de próxima generación para centros de datos, nube y edge: Intel Xeon 6. Los procesadores Intel Xeon 6 con nuevos núcleos E ofrecerán una eficiencia excepcional y se lanzarán este trimestre, mientras que Intel Xeon 6 con núcleos P ofrecerán un mayor desempeño de IA y se lanzarán poco después.

 

  • Procesadores Intel Xeon 6 con E-cores (cuyo nombre en código es Sierra Forest):
    • Mejora de 4 veces el desempeño por vatio 2.4 y 2,7 veces mejor densidad de rack 5 en comparación con los procesadores Intel® Xeon® de 2ª generación.
    • Los clientes pueden reemplazar los sistemas más antiguos en una proporción de casi 3 a 1, lo que reduce drásticamente el consumo de energía y ayuda a cumplir los objetivos de sostenibilidad6.
  • Intel Xeon 6 procesadores con P-cores (con nombre en código Granite Rapids):
    • Incorpora soporte de software para el formato de datos MXFP4, que mejora el rendimiento de la inferencia hasta 2,5 veces con respecto a BF16, con capacidad para ejecutar modelos Llama-2 de 70 billones de parámetros7.

 

Cliente, edge y conectividad: Intel anunció el impulso para el cliente y actualizaciones de su hoja de ruta para el edge y la conectividad, que incluyen:

 

  • Los procesadores Intel® Core™ Ultra están impulsando nuevas capacidades de productividad, seguridad y creación de contenidos, lo que supone una gran motivación para que las empresas renueven sus flotas de PC. Intel espera comercializar 40 millones de PC con inteligencia artificial en 2024, con más de 230 diseños, desde PC ultradelgados hasta dispositivos portátiles para juegos.
  • La familia de procesadores Intel Core Ultra (con nombre en código Lunar Lake), que se lanzará en 2024, tendrá más de 100 operaciones de plataforma tera por segundo (TOPS) y más de 45 TOPS de unidades de procesamiento neuronal (NPU) para PC de IA de próxima generación.
  • Intel anunció un nuevo producto de edge en las familias de productos Intel Core Ultra, Intel® Core™ y de procesadores Intel® Atom y unidades de procesamiento de gráficos (GPU) Intel® Arc™, dirigidos a mercados clave como el comercio minorista, la fabricación industrial y la atención médica. Todas las nuevas incorporaciones a la cartera de IA en edge de Intel estarán disponibles este trimestre y este año serán compatibles con la plataforma Intel® Tiber™ Edge.
  • A través del Ultra Ethernet Consortium (UEC), Intel lidera las redes Ethernet abiertas para estructuras de IA, introduciendo una variedad de soluciones optimizadas para IA. Diseñadas para transformar tejidos de IA a gran escala, tanto en aumento como en expansión, estas innovaciones permiten el entrenamiento y la inferencia para modelos cada vez más vastos, con tamaños que se expanden en un orden de magnitud en cada generación. La línea de productos incluye el Intel AI NIC, los chiplets de conectividad de IA para integrarse en los XPUs, sistemas basados en Gaudi, y una variedad de diseños de interconexión de IA de referencia tanto software como hardware para Intel Foundry.

 

Cartera de soluciones empresarialesIntel Tiber

Intel dio a conocer la cartera de soluciones empresariales Intel® Tiber™ para agilizar la implementación de software y servicios empresariales, incluyendo GenAI.

Una experiencia unificada facilita a los clientes y desarrolladores encontrar soluciones que se ajusten a sus necesidades, acelerar la innovación y desbloquear el valor sin comprometer la seguridad, el cumplimiento o el rendimiento. Ellos pueden comenzar a explorar la cartera de Intel Tiber a partir de hoy, con un lanzamiento completo planificado para el tercer trimestre de 2024. Obtenga más información en el sitio web de Intel Tiber.

Los anuncios de Intel en Vision 2024 subrayan el compromiso de la compañía de hacer que la IA sea accesible, abierta y segura para las empresas de todo el mundo. Con estas nuevas soluciones y colaboraciones, Intel está preparado para liderar el camino en la revolución de la IA, desbloqueando un valor sin precedentes para las empresas.

Declaraciones prospectivas

Este comunicado contiene declaraciones prospectivas, incluso con respecto a:

 

  • nuestros planes de negocios y estrategia y los beneficios anticipados de los mismos;
  • nuestra estrategia de IA y aceleradores de IA;
  • nuestro enfoque de plataformas abiertas y el apoyo al ecosistema con respecto a la IA; Y
  • Otras caracterizaciones de eventos o circunstancias futuras.

 

Dichas declaraciones implican muchos riesgos e incertidumbres que podrían causar que nuestros resultados reales difieran materialmente de los expresados o implícitos, incluidos aquellos asociados con:

 

  • el alto nivel de competencia y el rápido cambio tecnológico en nuestra industria;
  • las importantes inversiones a largo plazo e inherentemente riesgosas que estamos haciendo en instalaciones de investigación y desarrollo y fabricación que pueden no obtener un rendimiento favorable;
  • las complejidades e incertidumbres en el desarrollo e implementación de nuevos productos semiconductores y tecnologías de procesos de fabricación;
  • nuestra capacidad para cronometrar y escalar nuestras inversiones de capital de manera adecuada y asegurar con éxito acuerdos de financiamiento alternativos favorables y subvenciones gubernamentales;
  • implementar nuevas estrategias comerciales e invertir en nuevos negocios y tecnologías;
  • cambios en la demanda de nuestros productos;
  • las condiciones macroeconómicas y las tensiones y conflictos geopolíticos, incluidas las tensiones geopolíticas y comerciales entre Estados Unidos y China, los impactos de la guerra de Rusia contra Ucrania, las tensiones y el conflicto que afectan a Israel y las crecientes tensiones entre China continental y Taiwán;
  • la evolución del mercado de productos con capacidades de IA;
  • nuestra compleja cadena de suministro global, incluso debido a interrupciones, retrasos, tensiones y conflictos comerciales o escasez;
  • defectos del producto, erratas y otros problemas del producto, particularmente a medida que desarrollamos productos de próxima generación e implementamos tecnologías de procesos de fabricación de próxima generación;
  • posibles vulnerabilidades de seguridad en nuestros productos;
  • aumentar y evolucionar las amenazas de ciberseguridad y los riesgos de privacidad;
  • riesgos de propiedad intelectual, incluidos litigios y procedimientos regulatorios relacionados;
  • la necesidad de atraer, retener y motivar al talento clave;
  • transacciones e inversiones estratégicas;
  • riesgos relacionados con las ventas, incluida la concentración de clientes y el uso de distribuidores y otros terceros;
  • nuestro rendimiento de capital significativamente reducido en los últimos años;
  • nuestras obligaciones de deuda y nuestra capacidad para acceder a fuentes de capital;
  • leyes y regulaciones complejas y en evolución en muchas jurisdicciones;
  • fluctuaciones en los tipos de cambio de divisas;
  • cambios en nuestra tasa impositiva efectiva;
  • eventos catastróficos;
  • regulaciones ambientales, de salud, seguridad y de productos;
  • nuestras iniciativas y nuevos requisitos legales con respecto a asuntos de responsabilidad corporativa; Y
  • otros riesgos e incertidumbres descritos en este comunicado, nuestro Informe Anual más reciente en el Formulario 10-K y nuestras otras presentaciones ante la Comisión de Bolsa y Valores de los Estados Unidos (SEC).

 

Toda la información contenida en este comunicado refleja las expectativas de la gerencia a la fecha de este comunicado, a menos que se especifique una fecha anterior. No nos comprometemos, y renunciamos expresamente a cualquier obligación, a actualizar dichas declaraciones, ya sea como resultado de nueva información, nuevos desarrollos o de otra manera, excepto en la medida en que la divulgación pueda ser requerida por la ley.

1 Comparación de NV H100 basada en https://nvidia.github.io/TensorRT-LLM/performance.html#h100-gpus-fp8 , 28 de marzo de 2024. Los números informados son por GPU. Vs Intel® Gaudi® 3 proyecciones para las proyecciones LLAMA2-7B, LLAMA2-70B y Falcon 180B. Los resultados pueden variar.

2 Comparación de NV H100 basada en https://nvidia.github.io/TensorRT-LLM/performance.html#h100-gpus-fp8 , 28 de marzo de 2024. Los números informados son por GPU. Proyecciones Intel® Gaudi® 3 para LLAMA2-7B, LLAMA2-70B y Falcon 180B. Eficiencia energética tanto para Nvidia como para Gaudi 3 según estimaciones internas. Los resultados pueden variar.

3 Comparación de NV H100 basada en: https://developer.nvidia.com/deep-learning-performance-training-inference/training, 28 de marzo de 2024. Pestaña "Large Language Model" frente a las proyecciones de Intel® Gaudi® 3 para LLAMA2-7B, LLAMA2-13B y GPT3-175B al 28/03/2024. Los resultados pueden variar.

4 Basado en proyecciones arquitectónicas al 14 de febrero de 2023 en comparación con plataformas de generación anterior. Los resultados pueden variar.

5 Basado en proyecciones arquitectónicas al 14 de febrero de 2023 en comparación con plataformas de generación anterior. Los resultados pueden variar.

6 Basado en proyecciones arquitectónicas al 14 de febrero de 2023 en comparación con plataformas de generación anterior. Los resultados pueden variar.

7 Consulte la sección Visión 2024 de intel.com/performanceindex para conocer las cargas de trabajo y las configuraciones. Los resultados pueden variar.