ID del artículo: 000089522 Tipo de contenido: Mantenimiento y desempeño Última revisión: 20/11/2023

Desempeño de inferencia más lento en Barra de cómputo neuronal Intel® 2 (Intel® NCS2) en comparación con la CPU

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Resumen

La CPU tiene más potencia de cómputo que Intel® NCS2 por lo que se espera que se ejecute más rápido al inferir el mismo modelo

Descripción
  • Se utiliza Intel® Core™ i7 procesador para ejecutar benchmark_app.py con -m model.xml, con entrada aleatoria generada
  • El desempeño en NCS2 es más lento que el de la CPU:

    Para NCS2:
    [ INFO ] First inference took 33.88 ms
    [Step 11/11] Dumping statistics report
    Count: 2596 iterations
    Duration: 60141.63 ms
    Latency: 92.60 ms
    Throughput: 5525.09 FPS

    Para CPU:
    [ INFO ] First inference took 17.07 ms
    [Step 11/11] Dumping statistics report
    Count: 148124 iterations
    Duration: 60001.79 ms
    Latency: 1.61 ms
    Throughput: 315988.43 FPS

Resolución

Se espera que el rendimiento de la CPU sea mejor en comparación con Intel® NCS2 ya que la CPU tiene más potencia de cálculo.

Intel® NCS2 es un dispositivo acelerador que ayudaría en ciertas situaciones, especialmente cuando se requiere potencia informática adicional.

Además, la CPU requiere el formato de modelo FP32 mientras que Intel® NCS2 requiere el formato de modelo FP16. FP16 podría tener un error de cuantificación, ya que se comprime de un modelo de precisión completa para hacerlo más pequeño. Esto afectaría a la precisión y el rendimiento.

El desempeño significa qué tan rápido está el modelo en implementación con dos métricas clave: latencia y rendimiento.

En OpenVINO™, hay dos enfoques para mejorar el rendimiento:

Durante el desarrollo: herramienta de optimización posterior al entrenamiento (POT), marco de compresión de redes neuronales (NNCF), optimizador de modelos.

Durante la implementación: ajuste de parámetros de inferencia y optimización de la ejecución del modelo.

Es posible combinar ambos enfoques.

Productos relacionados

Este artículo se aplica a 2 productos

El contenido de esta página es una combinación de la traducción humana y automática del contenido original en inglés. Este contenido se ofrece únicamente para su comodidad como información general y no debe considerarse completa o precisa. Si hay alguna contradicción entre la versión en inglés de esta página y la traducción, prevalecerá la versión en inglés. Consulte la versión en inglés de esta página.