Mettre en place des dépendances inter-hosts
Bienvenue dans l’Atelier !
Aujourd’hui, je vais vous montrer comment Overmon peut vous aider à implémenter des dépendances inter-hosts très rapidement.
C’est un problème récurrent dans les implémentations de solutions de monitoring : faute de temps, ou d’informations suffisantes, les dépendances inter-hosts sont souvent ignorées, alors qu’elles permettent de réduire considérablement le nombre d’alarmes, lorsqu’elles sont judicieusement mises en oeuvre.
Prenons un contexte classique.
Le postulat de départ est le suivant :
- Vous êtes en charge de la supervision du système d’information d’une grande société, disposant d’un siège, et d’un nombre important de sites distants.
- Au niveau du siège, vous disposez d’un OVS, qui va déclencher un certain nombre de checks sur l’ensemble des machines des différents sites distants.
- Chacun des sites distants héberge un ou plusieurs routeurs permettant la communication inter-site
A partir de ce postulat de départ, et si l’on considère qu’aucune dépendance inter-hosts n’a été définie dans Centreon, quel est l’impact ? C’est simple … à partir du moment ou le routeur d’un site distant tombe, des alarmes seront générées pour l’ensemble des hosts & services des machines situées derrière ce routeur !
Dans un contexte de production, au sein d’une grande entreprise, cela peut assez rapidement déboucher sur des centaines, voire des milliers d’alarmes superflues.
Pour corriger ce dysfonctionnement, Nagios & Centreon permettent évidemment de créer des dépendances entre les différentes machines. Il est donc tout à fait possible de les créer manuellement. Mais si vous avez des centaines de sites à traiter, la tâche peut vite devenir ardue. Qui plus est, il faut constamment penser à réactualiser ces dépendances, en fonctions des évolutions de votre SI.
Constant dans sa mission de « facilitateur », Overmon peut vous aider, grace à son générateur de dépendances.
Voici comment ca fonctionne …
Prenons un hostgroup assez basique :
Le site distant 1 est composé d’un routeur, ainsi que de trois serveurs
Les serveurs étant situé en aval du routeur « SAMPLE-ROUTER », je souhaite que les checks sur ces serveurs cessent, à partir du moment ou « SAMPLE-ROUTER » devient indisponible.
Et surtout … je souhaite que cette règle s’applique aux 1387 hostgroups dont j’ai la charge … ;o) !!!
Je lance l’OAT :
Je clique dans « Administration Avancée / Générer des dépendances » :
Je coche la deuxième règle, puis je clique sur OK.
Je laisse l’OAT travailler. Les logs affichent en temps réel des créations de règles telles que :
A noter : il est possible de lancer ce traitement « à blanc », c’est-à-dire demander à l’OAT de simplement afficher les règles qu’il créerait, sans qu’il les créé réellement.
Au terme du process, les règles de dépendances sont bien crées :
Si on regarde dans le détail :
Voilà ! … mine de rien, sur un parc de plusieurs centaines de sites, vous venez d’économiser quelques jours/semaines de configuration fastidieuse !
Dernière précision : les règles ne sont crées QUE si les hostgroups ne disposent que d’UN seul routeur. Dans le cas ou il y aurait plusieurs routeurs, aucune règle n’est crée, dans la mesure ou l’OAT ne peut pas déterminer quelles sont les règles de haute-disponibilité en vigueur.
L’équipe Overmon