Dans la plupart des cas, les grosses implémentations de Centreon font intervenir différentes équipes.
Et bien souvent, il existe une équipe dédiée, dont le but est de traiter les alarmes 24h/24.
Cette équipe doit prendre en compte chaque nouvelle alarme, la qualifier, la traiter lorsque cela est possible. Une fois que cette équipe a terminé son traitement de l’alarme, l’alarme est alors acquittée, afin que les autres membres de l’équipe sachent qu’il n’est plus besoin de la traiter
Dans cette configuration précise, il est possible de vérifier que cette équipe 24/24 est correctement dimensionnée en surveillant le nombre de problèmes non acquittés.
Le nouvel écran d’accueil Overmon/Centreon facilite justement ce suivi :
Le graphique en haut à gauche présente le nombre de problèmes non acquittés.
En analysant l’exemple que je présente ici, on constate qu’entre 1h et 3h du matin, l’équipe 24/24 n’a pu résorber un afflux conséquent de nouvelles alarmes.
Evidemment, il n’est pas question de tirer des conclusions sur un échantillon (24h) aussi peu représentatif.
Mais comme il s’agit d’une sonde nagios classique, il est possible d’analyser cette donnée sur une période bien plus longue.
Mine de rien, grâce à ce type de sonde, Overmon peut maintenant vous aider dans un domaine où on ne l’attendait pas : la gestion des ressources humaines … ;o)
[br] [br] [hr]