Programme la maintenance avant que ton équipement la programme

Ecrit le

Bien que cette phrase puisse être évidente pour certains, elle vient de tomber sur moi d’une manière assez inattendue ou presque.

Pour le contexte: j’avais un serveur mail qui reposait sur un Raspberry Pi. Sauf que la carte µSD a fini par corrompre1 et casser de la configuration dans son passage. J’étais aussi en période de révisions ce qui n’a pas rendu la gestion du temps plus simple.

Quand je me suis rendu compte que des choses ne tournaient pas rond

Je regarde de temps en temps comment la machine va, si y’a rien qui surcharge. Bizarrement, Netdata semble avoir une UI anormalement pétée. Quelques symboles inconnus, quelques trucs broken. Puis je regarde la source de la page.

Denis Brognart et son très fameux "Ah !"

Ah bah oui… bah oui. Oui. Tout à fait. Broken. Oui. Heh… >_<’

rm -Rf qui refuse de supprimer un dossier à cause d’une référence circulaire sent aussi assez mauvais. Je ne sais pas du tout comment cette référence a réussi à s’auto-invoquer mais elle l’a fait d’une manière ou d’une autre.

J’étais un peu obligé de laisser ce bazar en place à cause de mes révisions. Gé-nial. J’étais aussi préoccupé de cette dégradation et j’espérais qu’une chose: qu’elle n’empire pas sur le temps.

Et là, c’est le drame

J’essaye de réinstaller Netdata et de le recompiler à la main. Sauf qu’il y a eu un petit souci avec Git. J’essaye de réinstaller Git. Et là. APT me dit qu’il n’arrive pas à lire une des listes de paquets. Alors je mets à jour les listes. Etttt…. Nope. Même une MÀJ n’a pas pu fix le bazar ambulant. La corruption était alors plus loin que je ne l’aurais pensé. Flûte !

Enfin, j’allais m’attarder sur la configuration de Postfix. Devinez ce que je découvre là dedans.

Réfléchis deux secondes.

Encore un peu.

On y est presque !

Le fichier de configuration corrompu ! Félicitations !

Bah oui, forcément, si la configuration ne veut plus rien dire, c’est clair que le serveur mail ne va pas très très bien fonctionner hein !

La fin de l’histoire

Au final, j’ai temporairement fixé le serveur mail sur le RPi avec la configuration d’un serveur connu comme fonctionnelle. Puis j’ai migré les serveurs depuis le RPi vers le serveur principal sans problèmes. Maintenant, tout va bien dans le meilleur des mondes. Les serveurs fonctionnent très bien et je me porte mieux :p


  1. Je ne sais pas si c’est le support ou bien le système de fichiers qui a corrompu, une analyse plus poussée est nécessaire. A force de faire des hard reboot, j’ai quelques doutes :p