Ir al contenido principal
Base de conocimientos de asistencia

¿Por qué el tiempo de carga del modelo para la GPU es más largo que para la CPU?

Tipo de contenido: Mantenimiento y desempeño   |   ID del artículo: 000057525   |   Última revisión: 05/03/2026

Entorno

OpenVINO™ kit de herramientas Complemento de GPU Complemento de CPU

Descripción

Cargar la representación intermedia (IR) de un modelo de entrada en la GPU lleva más tiempo que cargar el mismo modelo en una CPU.

Resolución

Cree manualmente cl_cache directorio en el directorio de trabajo de la aplicación.

El controlador utilizará este directorio para almacenar las representaciones binarias de los núcleos compilados. Esto funcionará en todos los sistemas operativos compatibles.

Como alternativa, establezca la variable de entorno:

export INTEL_OPENCL_CACHE=1

Más información

Consulte este artículo para conocer la descripción general del almacenamiento en caché de modelos para optimizar la latencia.

Cargar el modelo de entrada en formato de representación intermedia (IR) en la GPU lleva más tiempo que cargar el mismo modelo en una CPU, ya que la pila de GPU está basada en OpenCL*. El tiempo de carga depende del tiempo de compilación de los kernels de OpenCL*.

Cuando habilite el cl_cache, la primera vez que cargue el modelo, todavía llevará mucho tiempo porque el kernel de OpenCL* se compilará. Sin embargo, cada carga posterior del mismo modelo será mucho más rápida.

Para la configuración de caché mediante programación en OpenVINO™ 2026.0:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

Información relacionada

Documentación del complemento de GPU OpenVINO™ 2026.0

Productos relacionados

Este artículo se aplica a 1 productos.

Descargos de responsabilidad legales

El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.