ID del artículo: 000057525 Tipo de contenido: Mantenimiento y desempeño Última revisión: 31/01/2023

¿Por qué el tiempo de carga del modelo en la GPU es mayor que en la CPU?

Entorno

Kit de herramientas OpenVINO™ Complemento de GPU Complemento de CPU

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Resumen

Paso rápido para mejorar el tiempo de carga del modelo en la GPU

Descripción

Cargar la representación intermedia (IR) de un modelo de entrada en la GPU tarda más tiempo que cargar el mismo modelo en una CPU.

Resolución

Cree manualmente cl_cache directorio en el directorio de trabajo de la aplicación.

El controlador utilizará este directorio para almacenar las representaciones binarias de los núcleos compilados. Esto funcionará en todos los sistemas operativos compatibles.

Más información

Consulte este artículo para obtener más información sobre la administración del cl_cache.

Cargar el modelo de entrada en formato de representación intermedia (IR) en la GPU tarda más tiempo que cargar el mismo modelo en una CPU porque la pila de la GPU se basa en OpenCL*. El tiempo de carga depende del tiempo de compilación de los kernels OpenCL*.

Cuando se habilita el cl_cache, la primera vez que se carga el modelo todavía tomará mucho tiempo porque se compilará el kernel de OpenCL*. Sin embargo, cada carga posterior del mismo modelo será mucho más rápida.

Productos relacionados

Este artículo se aplica a 2 productos

El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.