Mon samedi au taff à patcher un fantôme.

En ce début d’année, une annonce a fait paniquer le petit monde de Linux. Une vilaine faille critique a échappé à la sagacité des grands distributeurs dont RedHat. C’est ballot, car la brèche permet d’exécuter du code sur vos serveurs préférés et donc de prendre la main dessus. N’en déduisez pas forcément que parce que le machin concerne Nunux, vous êtes hors danger dans le confort de vos machines sous Windows. En effet, vous avez peut-être un petit appareil caché au fond d’un tiroir qui présente ce défaut (comme un NAS Synology par exemple). Pas de panique toutefois, mais il est bon de pratiquer une petite mise à jour (ou un exorcisme, c’est au choix).

En ce qui nous concerne, nous avons passé un petit moment à patcher 22 serveurs virtuels. C’était fort amusant et instructif !… Non, je plaisante, c’était chiant et stressant ! Alors comme exutoire, je partage avec vous un peu de mon taff : voici le log (journal) que j’ai pris en note durant notre opération. Nous commençons par un arrêt des serveurs pour une sauvegarde à froid, enchaînons avec le patch, redémarrage et enfin vérifications d’usage. […]

  • 13h05 : Démarrage de l’opération qui, dans le meilleur des cas se finira à 15h30.
  • 13h07 : Le prestataire de *** qui doit effectuer les restart disparaît de la conversation. On soupçonne qu’il ait rebooté le serveur de conférence ou n’ait pas supporté la pression.
  • 13h10 : Le prestataire réapparaît, ses paroles sont décousues. On soupçonne maintenant une abduction temporaire par une race alien.
  • 13h18 : Panique, un serveur ne s’arrête pas. Ah ben si en fait.
  • 13h28 : Alfresco s’arrête sainement avec un rassurant :
SEVERE: The web application [/alfresco] created a ThreadLocal with key of type [javax.faces.context.FacesContext$1] (value [javax.faces.context.FacesContext$1@51b9988d]) and a value of type [org.apache.myfaces.context.servlet.ServletFacesContextImpl] (value [org.apache.myfaces.context.servlet.ServletFacesContextImpl@71def7a6]) but failed to remove it when the web application was stopped. This is very likely to create a memory leak.

13h35 : L’arrêt du serveur Openmeetings nous fait une blague :

/opt/red5/red5-shutdown.sh: line 13: /root/red5.sh: No such file or directory
/opt/red5/red5-shutdown.sh: line 13: exec: /root/red5.sh: cannot execute: No such file or directory

En regardant dans le script, ce porc suppose que le répertoire courant est le répertoire de travail. Il faut donc lancer le script depuis son répertoire… Ah, ce n’est pas le seul…

  • 14h15 : Je gagne à un démineur débutant (j’ai pas réussi un intermédiaire… 🙁 )
  • 14h20 : Début du 1er redémarrage des serveurs après les sauvegardes.
    14h44 : je renonce à installer spdy sur mon serveur perso tant qu’il est en Beta.
  • 15h20 : les repositories locaux ne fonctionnent pas sur les reverse proxies internes et externes. Ils n’ont pas non plus accès à Internet ni au partage nfs. En termes compréhensibles par le profane : « oups, c’est la merde, j’ai oublié 4 serveurs ».
  • 15h25 : Récupération du repo pour créer un faux partage nfs qui servira de repo complètement local. Ô fun du travaille à l’arrache.
  • 16h00 : Liferay ne nous laisse pas entrer car « CAS is Unavailable », dit-il. Mais c’est pas grave, ça vient de serveurs qui ne sont pas sous notre garde. ^^
  • 16h44 : le gars qui check la partie annuaire a disparu. Il est en vacances loin et communique par chat. On suppose qu’il a bu de l’eau du robinet et ne peut pas atteindre son clavier de là où il est…
  • 17h51 : on réussit à faire croire à *** que c’est eux qui ont pété la réplication des serveurs MySQL. Ils restaurent.
  • 19h00 : La tentative de dump de *** a créé un goulot d’étranglement sur MySQL. Les applications tombent les unes après les autres. Un restart nous a fait reprendre espoir. L’aventure va enfin se terminer !
  • 19h10 : On attend le retour du gus qui colle des sondes partout. Je sais pas bien pourquoi mais comme il est énervé, tout le monde veut lui faire plaisir.
  • 19h20 : C’est enfin fini !

Bilan : de l’ennui, du stress, des larmes, de l’espoir, une victoire bien méritée. Puis on se rend compte que notre weekend est foutu.

Sur ce, je vous souhaite à tous une bonne semaine pleine de joie. Et pensez toujours que dans le monde, à ce moment précis, un éthiopien meurt de faim et un informaticien est torturé. ++ 😉

Note : plus d’information sur cette faille sur RedHat.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *