GNU/Linux >> Tutoriels Linux >  >> Linux

30 outils et services intéressants pour surveiller vos serveurs Linux

Il ne suffit pas de déployer un serveur Linux spécifiquement configuré. La surveillance des serveurs est également cruciale pour les maintenir efficacement à long terme.

Si vous savez ce qui se passe avec vos serveurs, vous pourriez éviter des situations potentiellement catastrophiques. Prenez quelque chose d'aussi trivial que l'espace disque. Si votre serveur manque d'espace disque, les services en cours d'exécution seront affectés.

C'est pourquoi il est essentiel d'installer des outils de surveillance DevOps dédiés pour assurer une maintenance et une surveillance efficaces.

Je vais inclure un ensemble d'outils et de services que vous pouvez utiliser pour surveiller vos serveurs.

  • Certains d'entre eux vous permettent de configurer des alertes
  • certains affichent les statistiques dans un joli style de tableau de bord
  • certains d'entre eux affichent les graphiques et vous permettent de gérer les serveurs graphiquement.

​Vous pouvez parcourir la liste et décider quel outil et quel service sont adaptés à vos besoins.

Meilleure disponibilité

Better Uptime est un notificateur dont le travail principal est de vous alerter chaque fois que votre serveur tombe en panne en raison d'une anomalie grâce à une surveillance continue.

Mais c'est plus que cela. Vous pouvez définir une alerte si la RAM/les disques/le processeur atteignent un certain niveau, un cronjob échoue, la sauvegarde de la base de données échoue, etc.

C'est un service complet de surveillance d'infrastructure. Vous pouvez même ajouter des membres de l'équipe et mettre un torréfacteur sur appel. La personne d'astreinte peut être avertie par e-mail, SMS ou appel.

Vous pouvez commencer à utiliser Better Uptime gratuitement, mais certaines fonctionnalités peuvent nécessiter l'ouverture d'un compte Pro.

Nous l'utilisons pour surveiller nos serveurs et il s'est avéré très utile et productif ces derniers temps.

Webmin

Webmin est un panneau de contrôle Web open source pour l'administration système, principalement pour les systèmes de type Unix avec lequel vous pouvez facilement gérer votre système graphiquement et même à distance.

Vous pouvez lire comment l'installer et le configurer sur notre couverture précédente :

Grafana sur Prometheus

Grafana vous permet d'interroger, de visualiser et d'alerter sur les métriques et les journaux, quel que soit l'endroit où ils sont stockés. Il sert d'interface Web avec Prometheus en tant que backend.

Prometheus est une boîte à outils de surveillance et d'alerte de systèmes open source extrêmement renommée.

Vous pouvez considérablement improviser sur le duo avec Dockprom et influxDB.

Poste de pilotage

Également examiné précédemment dans le manuel Linux, Cockpit est un outil d'administration graphique basé sur un navigateur pour vos serveurs Linux. Avec Cockpit installé sur votre serveur, vous pouvez accéder au serveur à partir d'un navigateur et effectuer toutes les tâches administratives régulières quotidiennes.

M/Monit

Monit est un petit utilitaire Open Source pour gérer et surveiller les systèmes Unix. Il possède toutes les fonctionnalités nécessaires à la surveillance du système et à la récupération des erreurs et fonctionne comme un chien de garde avec une boîte à outils sur votre serveur.

Selon leur documentation officielle, M/Monit s'appuie sur les capacités de Monit et assure la surveillance et la gestion de tous vos hôtes compatibles Monit via une interface utilisateur moderne, propre et bien conçue qui fonctionne également sur les appareils mobiles.

Netdata

L'Agent Netdata est 100% open source et alimenté par plus de 300 contributeurs. Avec Netdata, vous pouvez résoudre les ralentissements et les anomalies de votre infrastructure avec des milliers de métriques par seconde, des visualisations significatives et des alarmes de santé pertinentes sans aucune configuration.

Linux Dash

Linux Dash est un tableau de bord Web de surveillance de serveur open source simple et magnifique qui inclut toutes les métriques de serveur génériques. En plus de fournir l'état du système comme indiqué ci-dessous, il fournit également des informations de base spécifiques au système, des détails sur le réseau, des comptes d'utilisateurs et des détails sur les applications existantes.

Checkmk

Checkmk fournit une surveillance rapide, efficace et puissante des réseaux, serveurs, clouds, conteneurs et applications. L'édition Raw est gratuite et open source tandis que leur édition Enterprise est disponible en version d'essai de 30 jours.

OpenNMS

OpenNMS est la première plate-forme d'applications de gestion de réseau de niveau entreprise au monde. Le modèle open source s'appelle OpenNMS Horizon tandis que le modèle basé sur l'abonnement s'appelle OpenNMS Meridian.

Nagios

Nagios propose une norme industrielle open source en matière de surveillance et d'alerte de l'infrastructure informatique. Nagios Core est disponible gratuitement.

Les outils payants de Nagios sont également proposés via des essais gratuits.

Nagios Open Source Outils payants Nagios
Nagios Core Nagios XI
Plugins Nagios Serveur de journaux Nagios
Interfaces Nagios Nagios Fusion
Modules Nagios Analyseur de réseau Nagios

Icinga

Icinga est une application de surveillance de système informatique et de réseau open source créée à l'origine en tant que fork de l'application de surveillance de système Nagios en 2009. La meilleure façon de commencer ici est la page de démarrage d'Icinga.

Sensu

Sensu est basé sur un modèle de pipeline pour combler les lacunes d'observabilité entre les métriques, la journalisation et le traçage. Les fonctionnalités de Sensu Go sont assez impressionnantes. Il est Open Source et offre jusqu'à cent nœuds maximum dans le cadre de son forfait gratuit.

Leur documentation comprend un guide étape par étape pour déployer Sensu en production nécessaire pour vous aider à démarrer.

LibreNMS

LibreNMS est un système de surveillance de réseau open source complet qui prend en charge une large gamme de matériel réseau et de systèmes d'exploitation, notamment Cisco, Linux, FreeBSD, Juniper, Brocade, Foundry, HP et bien d'autres.

NodeQuery

NodeQuery fournit des informations sur la santé, la disponibilité et les performances de vos serveurs. L'agent Open Source NodeQuery collecte des données de serveur Linux sélectionnées, qui sont envoyées à leur système de surveillance pour un traitement ultérieur.

Munin

Munin est un outil de monitoring, accessible via une interface web. Il surveille tous vos serveurs et se souvient de ce qu'il a vu. Il présente toutes les informations sous forme de graphiques. Munin est Open Source.

Robot de disponibilité

Uptime Robot fonctionne comme un autre notificateur qui surveille en permanence votre site Web, similaire à Better Uptime.

uptime.com

Uptime.com vous alerte également des temps d'arrêt du site Web par SMS, appel téléphonique ou e-mail. Il vérifie la disponibilité de votre site Web à des intervalles d'une minute à partir de 30 emplacements différents sur 6 continents. La tarification de Uptime est basée sur les plans de base, supérieurs, commerciaux et d'entreprise.

Superviseur

Supervisord est un système de contrôle de processus client/serveur qui permet à ses utilisateurs de contrôler un certain nombre de processus sur des systèmes d'exploitation de type UNIX. Il a été inspiré des groupes de commodité, de précision, de délégation et de processus et basé sur Python. Une version GoLang de Supervisord est également disponible sur GitHub.

graphite

Graphite est un outil de surveillance open source prêt pour l'entreprise qui fonctionne aussi bien sur du matériel bon marché que sur une infrastructure cloud utilisée pour suivre les performances des sites Web, des applications, des services commerciaux et des serveurs en réseau. Il a révolutionné la surveillance des serveurs en facilitant plus que jamais le stockage, la récupération, le partage et la visualisation des données de séries chronologiques.

Cabot

Mieux décrit par le développeur sur GitHub, Cabot est une plate-forme de surveillance d'infrastructure gratuite, open source et auto-hébergée qui fournit certaines des meilleures fonctionnalités de PagerDuty, Server Density, Pingdom et Nagios sans leur coût et leur complexité. Il est prêt pour Docker et prend 5 minutes à déployer.

Regards

Coups d'œil vous rappelle la commande supérieure qui pourrait être exécutée via une interface Web. Il s'agit d'un outil de surveillance système multiplateforme écrit en Python. Il peut également fonctionner en mode client/serveur avec une surveillance à distance via terminal, interface web ou API. Les statistiques peuvent également être exportées vers des fichiers ou des bases de données temps/valeur externes.

pydash

Pydash est un petit tableau de bord de surveillance basé sur le Web utile pour les serveurs Linux développés en Python et Django + Chart.js. Il utilise les bibliothèques Python disponibles dans la distribution Python principale, ayant une petite liste de dépendances sans avoir besoin d'installer de nombreux packages ou bibliothèques.

Monitorix

Moniteur a été conçu à l'origine pour surveiller les systèmes Linux Red Hat, Fedora et CentOS, mais aujourd'hui, il fonctionne sur différentes distributions GNU/Linux et même sur d'autres systèmes UNIX comme FreeBSD, OpenBSD et NetBSD.

Il est gratuit, open source et léger, capable de surveiller autant de services et de ressources système que possible. Il est bien sûr adapté aux serveurs de production et sa simplicité et sa petite taille permettent également un déploiement sur des appareils embarqués.

Voici toutes les statistiques spécifiques qu'il peut rapporter graphiquement :

  • Moyenne de charge et utilisation du système
  • Utilisation globale du noyau
  • Utilisation du noyau par processeur
  • Utilisation du système de fichiers et activité d'E/S
  • Trafic et utilisation du réseau
  • Statistiques Netstat
  • Statistiques des processus
  • Demande de services système
  • Statistiques de messagerie
  • Trafic des ports réseau
  • Utilisateurs utilisant le système
  • Statistiques FTP
  • Statistiques Apache
  • Statistiques MySQL
  • Statistiques BIND
  • Statistiques Chrony
  • Statistiques Fail2ban
  • Statistiques Redis
  • Statistiques PHP-FPM
  • Les appareils interrompent l'activité

Nixstats

Nixstats est une plate-forme de surveillance puissante et facile à utiliser pour suivre les performances du serveur et la disponibilité du site Web. Il ne nécessite pas de configuration compliquée et vous pouvez démarrer en quelques minutes avec une commande en une seule ligne pour installer l'agent de surveillance sur tous vos serveurs.

Disney utilise Nixstats pour la surveillance des serveurs et est l'un des principaux consommateurs.

Cactus

Cacti est un cadre de surveillance opérationnelle et de gestion des pannes open source, robuste et extensible avec une solution complète de graphique de réseau conçue pour exploiter la puissance de la fonctionnalité de stockage et de graphique de données de RRDTool sur des données de séries chronologiques.

Voici quelques-unes de ses principales fonctionnalités :

  • Collecteurs de données distants et locaux
  • Découverte d'appareils
  • Automatisation de la création d'appareils et de graphiques
  • Modélisation de graphiques et d'appareils
  • Méthodes de collecte de données personnalisées
  • Contrôles d'accès des utilisateurs, des groupes et des domaines

Zenoss

Zenoss Server Monitoring va au-delà de l'approche traditionnelle consistant à surveiller séparément les silos de types d'appareils, comme les serveurs. Il permet de surveiller tous les serveurs en tant qu'élément d'une pile informatique complète d'infrastructure cloud et sur site pour garantir des performances optimales des applications.

Zenoss propose des plug-ins personnalisables et extensibles pour étendre la plate-forme Zenoss, appelés ZenPacks . Il s'agit d'un modèle flexible et hautement extensible qui permet à la plate-forme Zenoss d'étendre rapidement les capacités de détection, de performance et de surveillance de la disponibilité aux nouvelles technologies.

Les ZenPacks utilisent des API et des protocoles standard, notamment SNMP, WMI, SSH et bien d'autres, pour collecter des données de santé et de performances en temps réel à partir de tout type de système ou d'application. Il existe actuellement plus de 400 ZenPacks couvrant les systèmes physiques, les conteneurs, les déploiements cloud et les applications qui sont classés dans les catégories suivantes :

  • Zenoss Commercial
  • Zenoss Open Source
  • Communauté
  • Abonnement
  • Personnalisé

Vous pouvez en savoir plus dans la fiche technique de surveillance du serveur Zenoss.

ntopng

ntopng permet l'analyse du trafic Web à haut débit et la collecte de flux en tant que version portable et de nouvelle génération de ntop, une sonde de trafic réseau qui surveille l'utilisation du réseau, basée sur libpcap/PF_RING.

ntopng est disponible en quatre versions :

  • Communauté (Open Source)
  • Professionnel
  • Entreprise M
  • Entreprise L

La version communautaire est gratuite et open-source. Les versions Professional et Enterprise offrent des fonctionnalités supplémentaires particulièrement utiles pour les PME ou les grandes organisations.

Framework de surveillance open source Shinken

Shinken propose un cadre de surveillance open source (auparavant une solution) inspiré du principe Linux "keep it simple". Il dispose d'une interface utilisateur Web autonome, qui comprend son propre serveur Web (indépendant d'Apache). L'interface utilisateur Web Shinken est lancée en même temps que le framework Shinken et est configurée à l'aide du fichier de configuration principal de Shinken en définissant quelques paramètres de base.

Observatoire

Selon la documentation officielle, Observium est une plate-forme de surveillance réseau à détection automatique prenant en charge une large gamme de plates-formes matérielles et de systèmes d'exploitation, notamment Cisco, Windows, Linux, HP, Juniper, Dell, FreeBSD, F5, Brocade, Citrix Netscaler, NetApp et bien d'autres. Suite. Observium cherche à fournir une interface puissante mais simple et intuitive pour la santé et l'état de votre réseau.

Observium est disponible en deux éditions :

  • Édition communautaire Open Source : L'édition communautaire est publiée sur un cycle semestriel
  • Édition d'abonnement : L'édition d'abonnement comprend des fonctionnalités supplémentaires, des corrections de bogues rapides et des améliorations de fonctionnalités quotidiennes, ainsi qu'un mécanisme de mise à jour basé sur SVN facile à utiliser.

Marionnette

Puppet est un outil qui utilise une approche DevOps pour vous aider à gérer et automatiser la configuration des serveurs. La marionnette est disponible en :

  • Marionnette open source
  • Entreprise de marionnettes

Le serveur Puppet est une application requise qui s'exécute sur la machine virtuelle Java (JVM) et contrôle les informations de configuration pour un ou plusieurs nœuds d'agent Puppet gérés.

Lequel utilisez-vous ?

Compiler cette liste et naviguer à travers ces fonctionnalités intéressantes m'a pris un certain temps. Mais cela valait vraiment la peine de créer cette liste exhaustive d'outils de surveillance de serveur divers et utiles à explorer.

Si vous avez d'autres outils à partager ou des suggestions, des commentaires ou des commentaires, n'hésitez pas à utiliser la section des commentaires ci-dessous.


Linux
  1. Comment joindre votre serveur Linux au projet de pool NTP

  2. Xorg, X11, Wayland ? Serveurs d'affichage Linux et protocoles expliqués

  3. Surveiller le serveur Linux en utilisant Prometheus et Grafana

  4. Utilisation de Checkmk pour surveiller votre infrastructure de serveur Linux

  5. 6 outils open source indispensables pour sécuriser votre serveur Linux

Comment surveiller les serveurs Linux à l'aide de CloudStats

Comment surveiller vos serveurs Linux avec Checkmk

ReaR :sauvegardez et restaurez votre serveur Linux en toute confiance

Serveur de surveillance Graylog sur Ubuntu Linux pour la surveillance du serveur/des services

Comment surveiller vos serveurs Linux avec Checkmk

Comment surveiller la santé du serveur Linux avec des outils de ligne de commande