Cómo recuperarse de un error interno (IERR) en placas Intel® para servidores

Documentación

Resolución de problemas

000006043

17/07/2023

¿Qué estoy viendo?

Un IERR es un error catastrófico informado por el procesador, pero generalmente causado por dispositivos fuera del núcleo del procesador (por ejemplo, memoria, PCIe).

  • La ejecución del procesador ha aumentado debido, por lo general, a un evento fuera del procesador.
  • A menudo, este problema se resuelve con un evento CATERR al que se puede hacer referencia cruzada para obtener información adicional.

Cómo solucionar el problema:

Siga estos pasos en orden:

  1. Revise el registro de eventos del sistema (SEL) para ver los eventos de código de corrección de errores (ECC ). La memoria defectuosa puede desencadenar un IERR.
  2. Revise el SEL para cualquier evento de PCIe. El uso de dispositivos PCIe desatar el uso de dispositivos PCIe puede desencadenar un IERR.
  3. Asegúrese de que los controladores del sistema operativo (SO) estén actualizados tanto para el servidor como para cualquier dispositivo de hardware que se haya agregado recientemente. Los controladores del sistema operativo obsoletos pueden desencadenar un IERR.
  4. Compruebe los registros del SO para cualquier entrada de Machine Check Architecture (MCA) que pueda indicar una falla de hardware que podría haber disparado el IERR.
  5. Confirme que tiene el BIOS más reciente para el sistema de servidor.
  6. Vaya a la consola web del controlador de administración de la placa base > configuración > la configuración de la memoria > tipo PPR y establezca la configuración de PPR en Difícil.
  7. Si los registros confirman que hay un(s) módulo(es) de memoria específico(s) que puede estar causando el problema, proceda a volver a colocar los módulos de memoria y supervisar el servidor durante 24 horas.

Temas relacionados
Mi servidor falla y muestra este error: Procesador CPU Machine Chk
Para actualizaciones de firmware y consejos para resolución de problemas
Guías de solución de problemas del registro de eventos del sistema para placas Intel® para servidores