Débuter avec les monitors
Présentation
Les monitors de métrique vous permettent de définir des alertes et de recevoir des notifications lorsqu’une métrique spécifique passe au-dessus ou en dessous d’un certain seuil. Cette page décrit la marche à suivre pour configurer un monitor de métrique chargé de vous alerter en cas d’espace disque faible.
Prérequis
Avant de commencer, vous avez besoin d’un compte Datadog associé à un host sur lequel l’Agent Datadog est installé. Pour vérifier cela, consultez votre liste d’infrastructures dans Datadog.
Configuration
Pour créer un monitor de métrique dans Datadog, utilisez la navigation principale : Monitors –> New Monitor –> Metric.
Choisir la méthode de détection
Lorsque vous créez un monitor de métrique, la méthode de détection Threshold Alert est sélectionnée par défaut. Une alerte de seuil compare les valeurs d’une métrique aux seuils que vous avez définis. Ce monitor a pour objectif d’envoyer une alerte en fonction d’un seuil statique : aucune modification n’est donc nécessaire.
Définir la métrique
Pour recevoir une alerte en cas d’espace disque faible, utilisez la métrique system.disk.in_use
de l’intégration Disk et calculez la moyenne par host
et par device
:
Une fois cette configuration effectuée, le monitor passe automatiquement en mode Multi Alert
afin de déclencher une alerte distincte pour chaque host
, device
qui envoie votre métrique.
Définir vos conditions d’alerte
Selon la documentation relative à l’intégration Disk, system.disk.in_use
correspond à la quantité proportionnelle d’espace disque utilisé par rapport au total. Ainsi, lorsque la métrique envoie une valeur de 0.7
, l’appareil est plein à 70 %.
Pour recevoir une alerte en cas d’espace disque faible, le monitor doit se déclencher lorsque la valeur de la métrique est above
(supérieure à) la valeur seuil. Vous êtes libre de définir la valeur seuil que vous souhaitez. Pour cette métrique, les valeurs comprises entre 0
et 1
sont appropriées :
Pour cet exemple, les autres paramètres par défaut ont été laissés tels quels. Pour en savoir plus, consultez la documentation relative aux monitors de métrique.
Say what’s happening
Avant d’enregistrer votre monitor, vous devez définir un titre et un message.
Titre
Le titre doit être unique pour chaque monitor. Étant donné qu’il s’agit d’un monitor à alertes multiples, vous pouvez utiliser des template variables de message pour ajouter le nom de l’élément de chaque groupe (host
et device
) :
Disk space is low on {{device.name}} / {{host.name}}
Message
Utilisez le message pour indiquer à votre équipe comment résoudre le problème. Par exemple :
Étapes à suivre pour libérer de l'espace disque :
1. Supprimer les paquets non utilisés
2. Vider le cache APT
3. Désinstaller les applications superflues
4. Supprimer les fichiers en double
Pour définir des messages différents en fonction des seuils d’alerte et d’avertissement, consultez la documentation relative aux notifications.
Utilisez cette section pour envoyer des notifications à votre équipe par e-mail, Slack, PagerDuty, etc. La liste déroulante vous permet de rechercher des membres d’équipe et des comptes connectés. Lorsqu’une @notification
est ajoutée dans cette zone, celle-ci est automatiquement ajoutée au message :
Si la @notification
est supprimée de l’une de ces deux sections, elle est également supprimée de l’autre section.
Autorisations
Utilisez cette option pour faire en sorte que seul le créateur de votre monitor ainsi que certains rôles spécifiques puissent le modifier. Pour en savoir plus sur les rôles, consultez la section Contrôle d’accès à base de rôles (RBAC).
Visualiser les monitors et les alertes de triage sur mobile
Vous pouvez consulter vos vues enregistrées de monitors et consulter ou désactiver des monitors avec l’application mobile Datadog, disponible sur l’App Store d’Apple et le Google Play Store. Vous pourrez ainsi procéder au triage des alertes même lorsque vous n’avez pas accès à votre ordinateur.
Pour aller plus loin
Documentation, liens et articles supplémentaires utiles: