Un monitor de check de processus surveille le statut généré par le check de l’Agent process.up
. Au niveau de l’Agent, vous pouvez configurer les seuils de votre check en fonction du nombre processus correspondants.
Pour créer un monitor de check de processus dans Datadog, utilisez la navigation principale : Monitors –> New Monitor –> Process Check.
Dans la liste déroulante, sélectionnez un processus à surveiller. Filtrez la liste en saisissant vos critères de recherche.
Sélectionnez les hosts à surveiller en spécifiant les hostnames ou des tags, ou sélectionnez All Monitored Hosts
. Si vous souhaitez exclure certains hosts, spécifiez leurs hostnames ou des tags dans le second champ. Si vous souhaitez exclure certains hosts, spécifiez leurs noms ou des tags dans le second champ.
AND
. Tous les hostnames et tags spécifiés doivent correspondre à un host pour que celui-ci soit inclus.OR
. Tout host correspondant à l’un des hostnames ou tags est exclu.Une alerte de check récupère les statuts consécutifs envoyés pour chaque groupe de checks et les compare à vos seuils. Pour les monitors de check de processus, les groupes sont statiques : host
et process
.
Paramètres d’une alerte de check :
Déclencher l’alerte après le nombre d’échecs consécutifs sélectionné : <NOMBRE>
Chaque exécution du check transmet un statut unique (OK
, WARN
ou CRITICAL
). Choisissez le nombre de statuts WARN
et CRITICAL
consécutifs à partir duquel une notification doit être envoyée. Par exemple, il arrive que la connexion à un processus échoue pendant un bref instant seulement ; en définissant cette valeur sur > 1
, les échecs ponctuels sont ignorés, tandis que les échecs prolongés déclenchent une notification.
Résoudre l’alerte après le nombre de réussites consécutives sélectionné : <NOMBRE>
Choisissez le nombre de statuts OK
consécutifs à partir duquel l’alerte doit être résolue.
Une alerte de cluster calcule le pourcentage de checks de processus présentant un statut donné et le compare à vos seuils.
Paramètres d’une alerte de cluster :
Choisissez si vos checks de processus doivent être regroupés en fonction d’un tag ou non. Ungrouped
calcule le pourcentage de statuts sur l’ensemble des sources. Grouped
calcule le pourcentage de statuts pour chaque groupe.
Sélectionnez les seuils d’alerte et d’avertissement en pourcentage. Il est possible de ne définir qu’un seul de ces paramètres (alerte ou avertissement).
Consultez la documentation relative aux monitors de métrique pour en savoir plus sur les options No data, Auto resolve et Evaluation delay.
Pour obtenir des instructions détaillées sur l’utilisation des sections Say what’s happening et Notify your team, consultez la page Notifications.
Documentation, liens et articles supplémentaires utiles:
Sur cette page