Describe la propiedad CL_DEVICE_MAX_WORK_ITEM_SIZES de OpenCL y si los productos gráficos Intel más recientes tienen un mejor desempeño para la computación en paralelo.
- ¿Intel® Iris® Xe gráficos tienen más elementos de trabajo o subprocesos que Gráficos UHD Intel®?
- Buscar los mejores gráficos Intel® para realizar cálculos en paralelo.
- Escribiendo el comando "clinfo" en Linux con OpenCL:
- Intel Iris Xe Gráficos tiene 96 Unidades de Ejecución (EUs) o subprocesos en total, cuatro veces más que el Gráficos UHD Intel con 24.
- El tamaño máximo de elemento de trabajo de la imagen anterior es un valor de una propiedad llamada CL_DEVICE_MAX_WORK_ITEM_SIZES de las especificaciones de OpenCL 2.1:
Número máximo de elementos de trabajo que se pueden especificar en cada dimensión del grupo de trabajo en clEnqueueNDRangeKernel.
Devuelve n size_t entradas, donde n es el valor devuelto por la consulta para CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS.
El valor mínimo es (1, 1, 1) para los dispositivos que no son de tipo CL_DEVICE_TYPE_CUSTOM. - Esto no significa que la máquina pueda tener 256*256*256 = 16777216 elementos de trabajo en un grupo de trabajo y pueda ejecutar 16777216 subprocesos en paralelo.
- La propiedad CL_DEVICE_MAX_COMPUTE_UNITS indica que la máquina tiene 24 unidades de ejecución (UE) en total.
- Cada hilo es capaz de ejecutarse en carriles SIMD8, SIMD16 o SIMD32, SIMD depende del kernel y de cómo fue construido por el compilador.
- Cada UE tiene 7 subprocesos de hardware (HW) (para gráficos Intel de 6ª generación).
- El número máximo teórico de subprocesos de OpenCL para esta plataforma es 24*7*32 = 5376.
- Será manejado por 168 hilos HW y dado que cualquier kernel en particular se construye usando el modo SIMD32.
Puede encontrar el número de unidades de ejecución para un producto específico en nuestra página de especificaciones gráficas.
Por ejemplo, 96 EU se ve en la sección de gráficos del procesador i7-11370H.