Intel® Data Center Diagnostic Tool para procesadores Intel® Xeon®
Introducción
El Intel® Data Center Diagnostic Tool es una herramienta de software de diagnóstico que se puede ejecutar en las plataformas de sus centros de datos para:
- Verifique la funcionalidad de todos los núcleos dentro de un procesador Intel® Xeon®.
- Se debe utilizar como parte de un programa de mantenimiento regular del sistema.
La alta confiabilidad y disponibilidad en el centro de datos requieren las herramientas adecuadas y un compromiso con el mantenimiento. Intel cree que es una mejor práctica de la industria utilizar herramientas de mantenimiento como estas tanto para la implementación inicial como para pruebas periódicas con el fin de ayudar a garantizar la mejor experiencia del sistema.
| Nota |
|
Requisitos del sistema
El Intel Data Center Diagnostic Tool es una aplicación de Linux* que se puede instalar y ejecutar en muchas distribuciones actuales de Linux. No hay ninguna versión de Windows* de esta herramienta.
Para obtener la mejor cobertura, ejecute la aplicación en el sistema raíz de un servidor. Es posible ejecutarlo dentro de un contenedor o máquina virtual, pero tenga en cuenta que algunas funciones pueden deshabilitarse.
Procesadores compatibles:
- Procesadores escalables Intel® Xeon® de 3ª generación (anteriormente Ice Lake y Cooper Lake)
- Procesadores escalables Intel® Xeon® de 2ª generación (anteriormente Cascade Lake)
- Procesadores escalables Intel® Xeon® de 1ra Generación (anteriormente Skylake)
- Familia de procesadores Intel® Xeon® E5 v4 (anteriormente Broadwell)
- Familia de procesadores Intel® Xeon® E7 v4 (anteriormente Broadwell)
| Nota |
|
Instalación
| Notas |
|
| Debian*/Ubuntu* |
Para instalar los paquetes de software Intel® Data Center Diagnostic Tool en distribuciones basadas en Debian*, añada el repositorio del paquete Intel software e instale los paquetes adecuados. Antes de copiar y pegado en la consola, es posible que desee ejecutar sudo ls e ingresar su contraseña para evitar que los comandos se consumen en la solicitud de contraseña sudo : Configure la clave para verificar las firmas del paquete curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add - Instalar el repositorio sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main' Instale el paquete sudo apt-get update |
| Fedora*/CentOS*/RHEL* |
Para instalar los paquetes de software Intel Data Center Diagnostic Tool en una distribución basada en Fedora, añada el repositorio Intel software paquete e instale el paquete. La primera vez que se instale, YUM o DNF le solicitará que acepte la clave de firma. Verifique que la huella digital sea la siguiente y, a continuación, aceptéela: Antes de copiar y pegado en la consola, es posible que desee ejecutar sudo ls e ingresar su contraseña para evitar que los comandos se consumen en la solicitud de contraseña sudo : Instale el archivo del repositorio sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm Instale el paquete sudo yum install dcdiag |
| OpenS VENT*/SUSE Linux Enterprise*: |
Instale el archivo del repositorio sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo Instale el paquete sudo zypper install dcdiag Se mostrará que respond.xml no está firmado. Responda sí para continuar. Se le dará otra oportunidad para verificar la firma del paquete. Verifique que la huella digital sea la siguiente y, a continuación, aceptéela: Repository: dcdiag |
Cómo probar el procesador Intel Xeon
Una vez instalado, el Intel Data Center Diagnostic Tool se habilita automáticamente para la ejecución en segundo plano. Puede comprobar que esto se haya realizado correctamente con el siguiente comando:
# systemctl status dcdiag
● dcdiag.service - Intel® Data Center Diagnostic Tool
Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
Docs: file:///usr/share/doc/dcdiag/README.rst
Main PID: 8777 (dcdiag)
CGroup: /system.slice/dcdiag.service
└─8777 /usr/bin/dcdiag --service
| Nota | Si desea deshabilitar la ejecución en segundo plano del Intel Data Center Diagnostic Tool, ejecute: systemctl disable --now dcdiag Para obtener más información sobre el uso del comando systemctl(1), consulte la página del manual de Linux*. |
Si se detectan errores mientras el Intel Data Center Diagnostic Tool se ejecuta en segundo plano, la herramienta los registrará en el registro del sistema. La herramienta también puede consultar si se detectaron errores en el análisis en segundo plano mediante el argumento --query.
# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.
Esta herramienta también se puede ejecutar manualmente en el primer plano ejecutando en un indicador de comandos de Linux:
# dcdiag
La prueba manual se ejecuta durante unos 45 minutos y tiene una alta utilización de la CPU.
Cuando se complete el diagnóstico, el sistema devolverá uno de los siguientes mensajes:
- Prueba completada con éxito. No se detectaron problemas.
- Prueba completada con éxito. Se produjeron uno o más errores de verificación del equipo. Consulte los registros del sistema.
- Esta versión de la herramienta no admite este procesador.
Consulte el modelo y la versión del procesador del sistema. Este mensaje aparece si el Intel Data Center Diagnostic Tool no detecta una versión de producción de los procesadores compatibles. Esta herramienta no admite muestras de ingeniería.
Encuentre ayuda para identificar el procesador.
- Prueba completada. Los resultados no son concluyentes debido a una versión desactualizada del microcódigo.
La versión más reciente del microcódigo aborda los problemas conocidos. Actualice. Las actualizaciones de microcódigo suelen ser entregadas por su proveedor de distribución de Linux junto con correcciones de seguridad y otras actualizaciones de firmware para diversos componentes. Si el sistema no tiene habilitadas estas actualizaciones, le recomendamos que las habilite. El microcódigo se carga automáticamente por el kernel de Linux en cada arranque y se puede volver a cargar en el tiempo de ejecución con el siguiente comando como raíz:
echo 1 > /sys/devices/system/cpu/microcode
- Prueba completada. Los resultados no son concluyentes debido a que el sistema supera los límites de temperatura
Esto podría deberse a una variedad de problemas con el sistema que no proporciona suficiente refrigeración para que la CPU funcione dentro de los límites de temperatura requeridos. Le recomendamos que revise el sistema para asegurarse de que la refrigeración requerida funcione correctamente. Esto puede incluir ventiladores defectuosos, flujo de aire incorrecto o algún otro problema ambiental.
- Prueba completada. Los resultados no son concluyentes, se produjeron uno o más errores de verificación del equipo.
Consulte los registros del sistema.
- Error en la prueba. Póngase en contacto con el fabricante del sistema o con el proveedor del procesador para obtener asistencia.
Si los resultados de las pruebas muestran fallas, compruebe si los procesadores de su nodo de servidor todavía están bajo garantía:
- Si tiene un procesador de Intel® Xeon® en caja todavía tiene una garantía de tres años, comuníquese con Asistencia al cliente Intel para obtener ayuda.
- Si tiene un procesador en bandeja, póngase en contacto con el proveedor del sistema o del procesador o con el punto de compra para verificar si el procesador aún está bajo garantía.
Nota Los procesadores en bandeja se venden directamente a los fabricantes de sistemas o a los distribuidores autorizados de Intel. Intel no proporciona garantía directa a los usuarios finales para procesadores en bandeja a menos que hayan sido preinstalados en sistemas de servidor Bloques de centros de datos Intel® (Intel® DCB). A excepción de los sistemas Intel DCB, la garantía del procesador en bandeja es del proveedor o del punto de compra del procesador o del sistema si el procesador estaba preinstalado. Intel recomienda comprar a distribuidores autorizados de Intel, proveedores aprobados de Intel y revendedores de productos Intel®. - Tenga en cuenta que Intel no tiene un programa de sustitución fuera de garantía.
Error en la prueba.
Se completó la prueba y se detectó un error en el procesador físico que contiene /sys/devices/system/cpu/cpuXX.
Póngase en contacto con el fabricante del sistema o con el proveedor del procesador para obtener asistencia.
Error en la prueba.
La prueba no puede determinar qué procesador físico ha causado el fallo.
Póngase en contacto con el fabricante del sistema o con el proveedor del procesador para obtener asistencia.
Historial de versiones
| Fecha | Versión | Descripción |
| 7 de julio de 2021 | 540 | Versión inicial |
| Temas relacionados |
| Sitio web central de asistencia Intel® Xeon® |
| Guía de garantía para procesadores Intel® |
