Datadog WatchdogTM

La page d'alertes de Watchdog, avec une alerte d'anomalie en cours dans des logs d'erreur, une alerte d'anomalie résolue dans des logs d'erreur et une alerte de taux d'erreur résolue via une analyse des causes d'origine

Présentation

Watchdog est une fonction à base d’algorithmes qui analyse les métriques d’infrastructure et de performance APM ainsi que les logs afin de détecter les problèmes potentiels au niveau de vos applications et de votre infrastructure. Elle repose sur les mêmes algorithmes saisonniers que ceux utilisés par les dashboards et la fonctionnalité de détection d’anomalies. Watchdog identifie les tendances et les patterns parmi les métriques suivantes :

  • Métriques APM :

    • Hits (taux de requête)
    • Taux d’erreur
    • Latence
  • Logs

    • Nouveaux logs d’erreur
    • Augmentations du nombre de logs d’erreur existants
  • Métriques d’infrastructure issues des intégrations :

Watchdog recherche des irrégularités dans les métriques, comme une élévation soudaine du taux de hits. Pour chaque irrégularité, une alerte est affichée sur la page Watchdog. Chaque alerte comprend un graphique illustrant l’irrégularité détectée et offre des informations supplémentaires sur l’intervalle et les endpoints pertinents. Watchdog surveille automatiquement les données envoyées par l’Agent Datadog ou par les intégrations.

En cas de nouvelle source de métriques, de logs ou d’autres données, Watchdog a besoin de deux semaines de données pour analyser le comportement normal attendu. Les anomalies détectées par Watchdog alors qu’il existe moins de deux semaines de données sont susceptibles d’être inexactes.

Watchdog dans la liste des services

Lorsque Watchdog détecte une irrégularité dans une métrique APM, l’icône Watchdog rose en forme de jumelles s’affiche à proximité du service affecté dans la liste des services APM. Le nombre affiché à côté des jumelles indique le nombre de problèmes détectés par Watchdog dans ce service.

Capture d'écran de la liste des services APM avec 5 services affichés. Une icône rose en forme de jumelles est visible à côté du nom du service web-store.

Accédez à la page Services pour consulter des informations détaillées sur une anomalie de métrique. Une case Watchdog Insights est visible en haut de la page. Watchdog Insights vous aide à découvrir les valeurs de tag associées à un comportement inattendu, comme un taux d’erreurs ou une latence élevée.

L’icône Watchdog apparaît également sur les graphiques de métriques.

Un graphique illustrant la latence d'un service, en secondes, sur l'axe des ordonnées et l'heure de la journée sur l'axe des abscisses. Le graphique est représenté sur un fond rose et le texte May 2: 13:31 Ongoing apparaît en haut.

Cliquez sur l’icône en forme de jumelles pour visualiser une alerte Watchdog dans une carte plus détaillée.

Dépannage

Besoin d’aide ? Contactez l’assistance Datadog.

Pour aller plus loin