Todo es posible …

29 May

… en el emocionante mundo del metal. Hasta puede pasar que fallen dos discos casi al mismo tiempo: uno presente y otro recién desembalado.

Frontal del servidor Budapest

Todo empezó hace unos tres días. Llegué tarde al trabajo [1] y me encontré con la temible ristra de mensajes de error de disco en la consola del servidor

Budapest

, la máquina destinada a ser el centro de la información de la empresa durante los próximos años, la más mimada, cuidada y consentida … y me falla, la jodía.

La configuración de disco era como sigue:

  1. /dev/sda

    : disco SATA II 7200 de 500 Gb Seagate con tres particiones:

    1. /dev/sda1

      empleada como arranque con formato

      ext3

      .

    2. /dev/sda2

      usada como amplio y generoso espacio de intercambio (

      swap

      ).

    3. /dev/sda3

      es el resto del disco en formato

      XFS

      y el más dañado.

  2. /dev/sdb

    : disco gemelo del anterior pero adquirido más tarde.

    1. /dev/sdb1

      es una partición

      XFS

      generosa también y afortunadamente sólo usada a un cuarto de su capacidad.

Tras convencer a los presuntos humanos con los que trabajo de que el fallo era serio, verdadero e inevitable logré parar la máquina y salvar casi todos los archivos de

sda3

a

sdb1

. Fallaron varios archivos de gestión de paquetes en

/var/lib/dpkg

(recuperables gracias a copias) y un disco virtual de la máquina Windows -no salvado en copias porque 30 gigabytes de eso me parecía demasiado- que parece que ha muerto tristemente y que no va a poder recuperarse. Creo que no tengo nada allí sin salvar, pero lo mismo termina apareciendo algo porque cuando dejas que los sentimientos personales interfieran en tu trabajo siempre se hace algo mal.

Arranqué la máquina avisando de que era lo conveniente era pararla ya y sustituir el disco de una vez, porque era un poco tonto pensar que ese tipo de fallos salvajes se diesen sólo en un par de zonas en el disco, pero que si quieres arroz Catalina.

Como ven que aguanta se aferran irracionalmente a la idea de que soy yo el que lo logra y me piden, ruegan y amenazan para que continúe así, aguantando todo el tiempo posible hasta que deje de molestarles. Ignoro cuánto tiempo debía ser eso, pero hice planes para sustituir el disco el sábado por la mañana y por la tarde pasé a recoger un disco nuevo, de 1TB, con intención de que pasase a formar parte de un sistema RAID que ya tenía planeado tiempo atrás y que nunca he podido poner en marcha.

Bien, el caso es que traje el disco y me he dedicado estos dos días a esperar a que se muriese la máquina, a que llegase el sábado o que terminase de entender cómo demonios se puede emplear un único certificado digital en un servidor Apache, una máquina con una única IP real y varios nombres virtuales. Me lo estaba pasando bien buscando información y probando diferentes configuraciones del servidor hasta que esta mañana la máquina ha dejado de aceptar conexiones sobre las ocho y media, aunque las que ya existían se mantenían, e incluso la máquina virtual de facturación

Helena

funcionaba como una campeona. La consola era un río de mensajes de error de acceso al disco y al final, dado que no podían entrar en sesión han claudicado, han completado la facturación hasta donde han podido y me han permitido apagar la máquina para sustituir el disco.

Una vez detenida la máquina me he dado cuenta de un pequeño detalle. El segundo disco

sdb

tenía una única partición con sistema de archivos

XFS

por lo que veía que

  1. No podía reducir con seguridad la única partición.
  2. No podía crear una partición de intercambio en el disco.
  3. No sabía si el núcleo estándar de Debian tenía soporte de
    XFS

    y podría tener el sistema de archivos raíz de esa forma.

Demasiadas incógnitas para arriesgarme con el servidor principal en un ratito, ¿ no ?

Notes

[1] No por mi culpa obviamente.