Outils pour utilisateurs

Outils du site


monitoringnagios

Ce que l'on (veut) surveiller

Objectif

Logcheckne suffit pas (plus?) pour le monitoring, la quasi-totalité des messages reçus sont sans importance autre que de montrer que le serveur est vivant. Les rares messages importants (je pense aux disques durs de mc-productions) ont été noyés dans le flots de message liés au fonctionnement normale (notamment du serveur vpn).

Nagiospourrait compléter avantageusement logcheck. Celui-ci reste en place, avec un filtrage plus agressif.

Nagiosest configuré pour monitorer les services critiques tournant sur les serveurs, le minimum étant de monitorer la connectivité réseau.

Il devrait être simple de configurer un groupe de services à monitorer, associé à chacune des machines.

Les services à monitorer sont:

  • connectivité réseau
  • samba - oui avec le plugin [http://exchange.[[:nagios|nagios]].org/components/com_mtree/attachment.php?link_id=1478&cf_id=24 check_smb]
  • sauvegarde ?
  • openvpn
  • services mineurs (cron, syslog) - oui avec check_procps
  • postfix (en vrai) - oui, avec check_smtp
  • postfix local - avec check_procps

Les ressources à monitorer:

  • espace disque
  • charge cpu et mémoire

Bugs

Voir http://www.eisber.net/blog/archives/138 pour désactiver la vérification par ping.

Conclusion à mi-chemin

C'est bien, mais la difficulté du chois de la méthode de superivsion s'avère critique. Dans 2 cas, nagios s'est planté:

  • crash disque externe chez mcproductions (plugin check_disk inadéquat) - Date: le crash du disque externe de ce jour (#403) a été détecté.
  • plus de connectivité openvpn chez securiland (plugin check_proc insuffisant)

À VOIR

Disques externes

Le plugin check_disk ne permet pas de déterminer si un disque est monté ou pas. Voir check_mount (http://exchange.[[:nagios|nagios]].org/directory/Plugins/System-Metrics/File-System/check_mount/details)

L'astuce, c'est d'utiliser l'option -p et d'utiliser un sous répertoire présente sur le disque externe (par exemple lost+found):

/usr/lib/nagios/plugins/check_disk   -w 10G -c 5G  -p /media/disque/lost+found

l'option –exact-match fonctionne aussi

/usr/lib/nagios/plugins/check_disk --exact-match -w 10G -c 5G  -p /media/disque

Autre plugins intéressant: http://exchange.[[:nagios|nagios]].org/directory/Plugins/System-Metrics/File-System/check_newest_file_age/details # vim: set filetype=dokuwiki:

monitoringnagios.txt · Dernière modification: 2015/12/02 22:04 (modification externe)