¿Qué estoy viendo?
Un IERR es un error catastrófico notificado por el procesador, pero generalmente causado por dispositivos fuera del núcleo del procesador (por ejemplo, memoria, PCIe).
- La ejecución del procesador se ha estancado debido normalmente a un evento fuera del procesador.
- Este problema suele ir acompañado de un evento CATERR al que se puede hacer referencia cruzada para obtener información adicional.
Cómo solucionarlo:
Siga estos pasos en orden:
- Revise el Registro de eventos del sistema (SEL) para ver los eventos del código de corrección de errores (ECC). Una memoria defectuosa puede desencadenar un IERR.
- Revise el SEL para cualquier evento PCIe. Los dispositivos PCIe que funcionan mal pueden activar un IERR.
- Asegúrese de que los controladores del sistema operativo (SO) estén actualizados para el servidor, así como para cualquier dispositivo de hardware agregado recientemente. Los controladores de sistemas operativos obsoletos pueden desencadenar un IERR.
- Compruebe los registros del SO en busca de entradas de Machine Check Architecture (MCA) que puedan indicar una falla de hardware que podría haber desencadenado el IERR.
- Confirme que tiene el BIOS más reciente para el sistema del servidor.
- Vaya a Baseboard Management Controller Web Console > Configuración > Configuración de memoria > Tipo PPR y establezca la configuración de PPR en Difícil.
- Si los registros confirman que hay un módulo de memoria específico que puede estar causando el problema, proceda a volver a colocar la tarjeta de memoria y supervise el servidor durante 24 horas.