Outils pour utilisateurs

Outils du site


monitoringnagios

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

monitoringnagios [2015/12/02 22:04] (Version actuelle)
Ligne 1: Ligne 1:
 +{{tag>​sysadmin veille}}
 +
 +===== Ce que l'on (veut) surveiller =====
 +
 +==== Objectif ====
 +
 +
 +[[:​old:​logcheck|Logcheck]]ne suffit pas (plus?) pour le monitoring, la quasi-totalité des messages reçus sont //sans importance//​ autre que de montrer que le serveur est vivant. Les rares messages importants (je pense aux disques durs de mc-productions) ont été noyés dans le flots de message liés au fonctionnement normale (notamment du serveur [[:​serveurvpn|vpn]]).
 +
 +[[:​nagios|Nagios]]pourrait compléter avantageusement [[:​old:​logcheck|logcheck]]. Celui-ci reste en place, avec un filtrage plus agressif.
 +
 +[[:​nagios|Nagios]]est configuré pour monitorer les services critiques tournant sur les serveurs, le minimum étant de monitorer la connectivité réseau.
 +
 +Il devrait être simple de configurer un groupe de services à monitorer, associé à chacune des  machines.
 +
 +Les services à monitorer sont:
 +  * connectivité réseau
 +  * samba - oui avec le plugin [http://​exchange.[[:​nagios|nagios]].org/​components/​com_mtree/​attachment.php?​link_id=1478&​cf_id=24 check_smb]
 +  *[[:apache| ]]
 +  *[[:mysql| ]]
 +  *[[:ssh| ]]
 +  * sauvegarde ?
 +  * openvpn
 +  * services mineurs (cron, syslog) - oui avec check_procps
 +  * postfix (en vrai) - oui, avec check_smtp
 +  * postfix local - avec check_procps
 +
 +Les ressources à monitorer:
 +  * espace disque
 +  * charge cpu et mémoire
 +
 +==== Bugs ====
 +
 +Voir http://​www.eisber.net/​blog/​archives/​138 pour désactiver la vérification par ping.
 +
 +
 +==== Conclusion à mi-chemin ====
 +
 +C'est bien, mais la difficulté du chois de la méthode de superivsion s'​avère critique. Dans 2 cas, [[:​nagios|nagios]] s'est planté:
 +  * crash disque externe chez mcproductions (plugin check_disk inadéquat) - [[Date]]: le crash du disque externe de ce jour (#403) a été détecté.
 +  * plus de connectivité openvpn chez [[:​clients:​securiland.securiland|securiland]] (plugin check_proc insuffisant)
 +
 +==== À VOIR ====
 +
 +===== Disques externes =====
 +Le plugin //​check_disk//​ ne permet pas de déterminer si un disque est monté ou pas. Voir check_mount (http://​exchange.[[:​nagios|nagios]].org/​directory/​Plugins/​System-Metrics/​File-System/​check_mount/​details)
 +
 +L'​astuce,​ c'est d'​utiliser l'​option ''​-p''​ et d'​utiliser un sous répertoire présente sur le disque externe (par exemple lost+found):​
 +<​code>​
 +/​usr/​lib/​nagios/​plugins/​check_disk ​  -w 10G -c 5G  -p /​media/​disque/​lost+found
 +</​code>​
 +
 +l'​option ''​--exact-match''​ fonctionne aussi
 +<​code>​
 +/​usr/​lib/​nagios/​plugins/​check_disk --exact-match -w 10G -c 5G  -p /​media/​disque
 +</​code>​
 +
 +Autre plugins intéressant:​
 +http://​exchange.[[:​nagios|nagios]].org/​directory/​Plugins/​System-Metrics/​File-System/​check_newest_file_age/​details
 +# vim: set filetype=dokuwiki:​
  
monitoringnagios.txt · Dernière modification: 2015/12/02 22:04 (modification externe)