Watchdog Insights pour les logs

Présentation

Grâce à la fonctionnalité Watchdog Insights de la solution Log Management de Datadog, vous pouvez résoudre plus facilement vos incidents en visualisation des informations contextuelles dans le Log Explorer. Les Watchdog Insights renforcent vos connaissances et confirment vos intuitions en mettant en avant des anomalies et des goulots d’étranglement nuisant potentiellement à un sous-ensemble d’utilisateurs.

Le Log Explorer affichant la bannière Watchdog Insights avec cinq anomalies dans les logs

La bannière Watchdog Insights est affichée dans le Log Explorer. Elle présente des insights à propos de la requête actuelle :

La bannière Watchdog Insights dans la vue développée

Pour afficher un aperçu de tous les insights, développez la bannière Watchdog Insights :

La bannière Watchdog Insights présentant trois singularités

Pour ouvrir entièrement le volet latéral Watchdog Insights, cliquez sur View all :

Le volet latéral Watchdog Insights affichant plus de détails sur les singularités

Chaque insight propose des interactions ainsi qu’un volet latéral affichant des informations de dépannage. Les interactions et le volet latéral varient en fonction du type d’insight Watchdog.

Types d’insights

La fonctionnalité Watchdow Insights affiche les anomalies et singularités qui ont été détectées pour certains tags, vous aidant ainsi déterminer la cause à l’origine d’un problème. Les Insights proviennent des solutions APM et Log Management, du profileur en continu et des données d’infrastructure comportant le tag service. Les deux types d’insights spécifiques à Log Management sont les suivants :

Détection des anomalies dans les logs

Les logs ingérés sont analysés au niveau de l’admission. Watchdog agrège les logs en fonction de certains patterns détectés ainsi que des tags environment, service, source et status. Ces logs agrégés sont ensuite analysés afin d’identifier différents comportements anormaux, notamment :

  • Une augmentation du nombre de logs possédant un statut d’avertissement ou d’erreur
  • Une hausse soudaine du nombre de logs possédant un statut d’avertissement ou d’erreur

Les logs sont présentés sous la forme d’insights dans le Log Explorer. Ils tiennent compte du contexte de recherche ainsi que des restrictions appliquées au rôle de l’utilisateur.

Cliquez sur un insight précis pour afficher la description complète de l’anomalie détectée, ainsi que la liste des patterns ayant permis l’identification de l’anomalie.

Les anomalies considérées comme graves par Watchdog s’affichent également dans le fil d’alertes Watchdog. Vous pouvez créer des alertes à partir de ces anomalies en configurant un monitor de logs Watchdog. Une anomalie grave répond aux critères suivants :

  • Elle contient des logs d’erreur
  • Elle dure au moins 10 minutes (pour éviter les erreurs passagères)
  • Elle est caractérisée par une forte augmentation (pour ignorer les hausses négligeables)

Pour en savoir plus sur la recherche de logs dans le Log Explorer, consultez les sections Syntaxe de recherche de logs et Intervalles personnalisés.

Singularités

Les singularités (ou « error outliers ») affichent des champs, comme des tags ou attributs à facettes, susceptibles d’indiquer une erreur pour la requête actuelle. Les paires key:value qui sont statistiquement surreprésentées parmi les erreurs mettent en lumière les causes possibles d’un problème.

Voici quelques exemples de singularités sur des erreurs habituelles : env:staging, docker_image:acme:3.1 et http.useragent_details.browser.family:curl.

Les informations suivantes sont accessibles depuis la fiche de la bannière :

  • Le nom du champ
  • La proportion du nombre total d’erreurs et de logs globaux associés au champ en question
La fiche « error outlier » affichant une barre rouge représentant 73,3 % des erreurs totales ainsi qu'une barre bleue représentant 8,31 % des erreurs totales

La fiche du volet latéral présente le principal pattern des logs d’erreur comportant le champ.

Fiche Error Outlier (grande)

Les informations suivantes sont accessibles depuis le volet latéral développé :

  • Les séries temporelles pour les logs d’erreur associés au champ
  • Les tags généralement associés aux logs d’erreur
  • La liste complète des patterns de log
Volet latéral de la singularité sur des erreurs

Pour aller plus loin