ID del artículo: 000059718 Tipo de contenido: Product Information & Documentation Última revisión: 04/09/2024

¿Intel® Iris® Xe gráficos tienen más elementos de trabajo que Gráficos UHD Intel® 620?

Entorno

Computación heterogénea y Data Parallel C++; Gráficos UHD Intel; Linux con OpenCL

Other Linux family*

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Resumen

Describe la propiedad CL_DEVICE_MAX_WORK_ITEM_SIZES de OpenCL y si los productos gráficos Intel más recientes tienen un mejor desempeño para la computación en paralelo.

Descripción
  • ¿Intel® Iris® Xe gráficos tienen más elementos de trabajo o subprocesos que Gráficos UHD Intel®?
  • Buscar los mejores gráficos Intel® para realizar cálculos en paralelo.
  • Escribiendo el comando "clinfo" en Linux con OpenCL:

    Linux with OpenCL screenshot

Resolución
  • Intel Iris Xe Gráficos tiene 96 Unidades de Ejecución (EUs) o subprocesos en total, cuatro veces más que el Gráficos UHD Intel con 24.
  • El tamaño máximo de elemento de trabajo de la imagen anterior es un valor de una propiedad llamada CL_DEVICE_MAX_WORK_ITEM_SIZES de las especificaciones de OpenCL 2.1:

    Número máximo de elementos de trabajo que se pueden especificar en cada dimensión del grupo de trabajo en clEnqueueNDRangeKernel.
    Devuelve n size_t entradas, donde n es el valor devuelto por la consulta para CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS.
    El valor mínimo es (1, 1, 1) para los dispositivos que no son de tipo CL_DEVICE_TYPE_CUSTOM.

  • Esto no significa que la máquina pueda tener 256*256*256 = 16777216 elementos de trabajo en un grupo de trabajo y pueda ejecutar 16777216 subprocesos en paralelo.
  • La propiedad CL_DEVICE_MAX_COMPUTE_UNITS indica que la máquina tiene 24 unidades de ejecución (UE) en total.
  • Cada hilo es capaz de ejecutarse en carriles SIMD8, SIMD16 o SIMD32, SIMD depende del kernel y de cómo fue construido por el compilador.
  • Cada UE tiene 7 subprocesos de hardware (HW) (para gráficos Intel de 6ª generación).
  • El número máximo teórico de subprocesos de OpenCL para esta plataforma es 24*7*32 = 5376.
  • Será manejado por 168 hilos HW y dado que cualquier kernel en particular se construye usando el modo SIMD32.
Más información

Puede encontrar el número de unidades de ejecución para un producto específico en nuestra página de especificaciones gráficas.

Por ejemplo, 96 EU se ve en la sección de gráficos del procesador i7-11370H.

Productos relacionados

Este artículo se aplica a 126 productos

Intel® Data Center GPU Max Series
Intel® Data Center GPU Max 1550
Intel® Data Center GPU Max 1100

El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.