Nouvelles annonces sur les technologies sans serveur et réseau ainsi que sur le RUM (Real-User Monitoring) dévoilées à la conférence Dash ! Nouvelles annonces dévoilées à la conférence Dash !

Débuter avec les monitors

Présentation

Les monitors de métrique vous permettent de définir des alertes et de recevoir des notifications lorsqu’une métrique spécifique passe au-dessus ou en dessous d’un certain seuil. Cette page décrit la marche à suivre pour configurer un monitor de métrique chargé de vous alerter en cas d’espace disque faible.

Prérequis

Avant de commencer, vous avez besoin d’un compte Datadog associé à un host sur lequel l’Agent Datadog est installé. Pour vérifier cela, consultez votre liste d’infrastructures dans Datadog.

Implémentation

Pour créer un monitor de métrique dans Datadog, utilisez la navigation principale : Monitors –> New Monitor –> Metric.

Choisir la méthode de détection

Lorsque vous créez un monitor de métrique, la méthode de détection Threshold Alert est sélectionnée par défaut. Une alerte de seuil compare les valeurs d’une métrique aux seuils que vous avez définis. Ce monitor a pour objectif d’envoyer une alerte en fonction d’un seuil statique : aucune modification n’est donc nécessaire.

Définir la métrique

Pour recevoir une alerte en cas d’espace disque faible, utilisez la métrique system.disk.in_use de l’intégration Disk et calculez la moyenne par host et par device :

Une fois cette configuration effectuée, le monitor passe automatiquement en mode Multi Alert afin de déclencher une alerte distincte pour chaque host, device qui envoie votre métrique.

Définir vos conditions d’alerte

Selon la documentation relative à l’intégration Disk, system.disk.in_use correspond à la quantité proportionnelle d’espace disque utilisé par rapport au total. Ainsi, lorsque la métrique envoie une valeur de 0.7, l’appareil est plein à 70 %.

Pour recevoir une alerte en cas d’espace disque faible, le monitor doit se déclencher lorsque la valeur de la métrique est above (supérieure à) la valeur seuil. Vous êtes libre de définir la valeur seuil que vous souhaitez. Pour cette métrique, les valeurs comprises entre 0 et 1 sont appropriées :

Pour cet exemple, les autres paramètres par défaut ont été laissés tels quels. Pour en savoir plus, consultez la documentation relative aux monitors de métrique.

Say what’s happening

Avant d’enregistrer votre monitor, vous devez définir un titre et un message.

Titre

Le titre doit être unique pour chaque monitor. Étant donné qu’il s’agit d’un monitor à alertes multiples, vous pouvez utiliser des template variables de message pour ajouter le nom de l’élément de chaque groupe (host et device) :

Disk space is low on {{device.name}} / {{host.name}}

Message

Utilisez le message pour indiquer à votre équipe comment résoudre le problème. Par exemple :

Steps to free up disk space:
1. Remove unused packages
2. Clear APT cache
3. Uninstall unnecessary applications
4. Remove duplicate files

Pour définir des messages différents en fonction des seuils d’alerte et d’avertissement, consultez la documentation relative aux notifications.

Notify your team

Utilisez cette section pour envoyer des notifications à votre équipe par e-mail, Slack, PagerDuty, etc. La liste déroulante vous permet de rechercher des membres d’équipe et des comptes connectés. Lorsqu’une @notification est ajoutée dans cette zone, celle-ci est automatiquement ajoutée au message :

Si la @notification est supprimée de l’une de ces deux sections, elle est également supprimée de l’autre section.

Pour aller plus loin