Log Monitors
Présentation
Une fois la fonctionnalité Log Management activée pour votre organisation, vous pouvez créer des logs monitors afin de recevoir une alerte lorsqu’un type de log spécifique dépasse un seuil défini par l’utilisateur sur une période donnée.
Création d’un monitor
Pour créer un log monitor dans Datadog, utilisez la navigation principale : Monitors –> New Monitor –> Logs.
Définir la requête de recherche
À mesure que vous définissez votre requête de recherche, le graphique au-dessus des champs de recherche se met à jour.
- Créez votre requête de recherche en utilisant la même logique que pour une recherche dans le Log Explorer.
- Choisissez de surveiller un nombre de logs, une facette ou une mesure :
- Monitor over a log count : utilisez la barre de recherche (facultatif) et ne sélectionnez pas une facette ou une mesure. Datadog évalue le nombre de logs sur une période sélectionnée, puis le compare aux conditions de seuil.
- Monitor over a facet : si vous sélectionnez une facette, le monitor envoie une alerte en fonction du
Unique value count
(nombre de valeurs uniques) de la facette. - Monitor over a measure : si vous sélectionnez une mesure, le monitor envoie une alerte en fonction de la valeur numérique de la facette de log (comme le ferait un monitor de métrique). Vous devez simplement sélectionner l’agrégation (
min
, avg
, sum
, median
, pc75
, pc90
, pc95
, pc98
, pc99
ou max
).
- Définissez les groupes d’alertes (facultatif). Remarque : que vous définissiez ou non des groupes d’alertes, vous recevez une seule alerte lorsque la valeur agrégée remplit les conditions définies. Même si vous triez la requête par host, une seule notification est envoyée si plusieurs hosts remplissent les conditions définies définies. Ce système permet de réduire le nombre de notifications reçues.
Définir vos conditions d’alerte
- Envoyer une alerte lorsque la métrique est
above
, above or equal to
, below
ou below or equal to
(supérieure, supérieur ou égale à, inférieure ou égale à) - au seuil durant les
5 minutes
, 15 minutes
ou encore 1 hour
précédentes. - Seuil d’alerte
<NOMBRE>
- Seuil d’avertissement
<NOMBRE>
Absence de données et alertes Below
Définissez la condition below 1
pour recevoir une notification lorsque les groupes d’un service ont tous arrêté d’envoyer des logs. Vous serez ainsi alerté lorsqu’aucun log ne correspond à la requête du monitor sur un intervalle de temps donné pour tous les groupes d’agrégation.
Lorsque vous répartissez le monitor par dimension (tag ou facette) tout en utilisant une condition below
, l’alerte se déclenche uniquement s’il existe des logs pour un groupe donné et que le nombre est inférieur au seuil, ou s’il n’y a aucun log pour tous les groupes.
Exemples :
- Le monitor suivant se déclenche uniquement s’il n’y a aucun log pour tous les services :
- Le monitor suivant se déclenche s’il n’y a aucun log pour le service
backend
:
Notifications
Pour obtenir des instructions détaillées sur l’utilisation des sections Say what’s happening et Notify your team, consultez la page Notifications.
Exemples de log
Par défaut, lorsqu’un log monitor se déclenche, le message de notification envoyé comprend des exemples de log ou les valeurs principales.
Élément surveillé | Informations ajoutées au message de notification |
---|
Nombre de logs | Alertes groupées : les 10 principales valeurs dépassant le seuil et les nombres de logs correspondants. Alertes non groupées : jusqu’à 10 exemples de logs. |
Facette ou mesure | Les valeurs les plus élevées pour la facette ou la mesure. |
Ces informations peuvent être envoyées via Slack, Jira, Webhook, Microsoft Teams, PagerDuty ou e-mail. Remarque : les notifications de rétablissement n’affichent aucun exemple de log.
Pour désactiver les exemples de logs, décochez la case correspondante en bas de la section Say what’s happening. Le texte affiché à côté de la case reflète les groupes définis pour votre monitor (comme indiqué ci-dessus).
Exemples
Inclure un tableau des 10 principales valeurs dépassant le seuil :
Inclure 10 exemples de log dans la notification d’alerte :
Pour aller plus loin
Documentation, liens et articles supplémentaires utiles: