NMI has been received – system halted …

15 Sep

… y a cascarla.

Jo. Es que no gano para sustos con las máquinas.

Frontal del servidor Budapest El viernes pasado el servidor principal de aplicaciones se reinició por alguna razón que aún no he podido determinar con exactitud, pero que estoy casi seguro se debió a un disco defectuoso, un Seagate de 400Gb SATA, que conservaba los archivos de usuario (

/home

) y que no aguantó más.

De ello me enteré el domingo por la noche cuando intenté actualizar en remoto y el equipo dejó de responder. Al día siguiente verifiqué la avería y pensé que podría aguantar un poco más mientras encargaba otro disco para reemplazarlo; no fue así y tan sólo un día más y el disco falleció del todo. Ni accediendo como sólo lectura conseguía que no diese errores, pero al menos pude mover gran parte de los archivos hacia el RAID y parecía que bastaría con tenerlo desmontado hasta que pudiese sustituirlo. Pues no. Si está estropeado lo mejor es desconectarlo físicamente porque puede ocurrir lo que me ocurrió: que el sistema se colgó del todo en cuanto empecé a pasar datos al disco nuevo vía un conector externo USB. Y de ahí el título de esta entrada.

Una vez reseteado el equipo el BIOS me suelta el mensaje de arriba, añade un diagnóstico bastante más críptico

Error:         8110
Severity:    major
Instance:    1

y detiene la puesta en marcha hasta que le indico que continúe. Lo hace y parece que aguanta desde entonces.

Eso sí, desde ese momento me pongo a buscar en la red y como es una placa base Intel resulta que aparece la respuesta en más de un sitio. Me quedo con la respuesta del usuario Doc_SilverCreek por lo aclarativa que resulta. Parece un error interno del procesador (de los que provocan infartos en los administradores de sistemas) pero está producido por un periférico defectuoso. Al menos explica lo que sucedió. Veremos qué pasa cuando hoy pueda parar otra vez el servidor y cambiar los discos del todo.