Suivi des erreurs pour les services backend

Présentation

Pour garantir l’intégrité de votre système, il est essentiel de surveiller en permanence les erreurs recueillies par Datadog. Lorsque les événements d’erreur sont trop nombreux, il est difficile de savoir lesquels doivent être traités en priorité. En assurant le suivi, le triage et le debugging des stack traces, vous pouvez minimiser l’impact des erreurs critiques sur vos services backend.

Après avoir configuré APM pour le suivi des erreurs des services backend, les problèmes détectés commencent à apparaître sous forme de cartes. Accédez à APM > Error Tracking pour consulter les problèmes en cours, les problèmes ignorés ou tous les problèmes, les trier par volume ou par ancienneté, et les filtrer en fonction de n’importe quelle facette par défaut ou personnalisée sur vos services backend.

L'Error Tracking Explorer pour APM affichant les problèmes de vos services backend

Le suivi des erreurs vous permet d’accomplir ce qui suit :

  • Définir des alertes sur des événements de suivi des erreurs, afin d’être informé en cas d’erreur critique
  • Regrouper les erreurs connexes au sein d’un problème unique, afin d’identifier plus facilement les erreurs importantes et de réduire les alertes superflues
  • Suivre l’évolution des problèmes au fil du temps pour identifier à quel moment ils sont apparus, s’ils surviennent toujours ainsi que la fréquence à laquelle ils se produisent
  • Rassembler tous les éléments de contexte pour un diagnostic simplifié
  • Accéder à une trace dans son référentiel de code source, un Git blame ou un commit

Utiliser des tags de span pour le suivi des spans d’erreur

La fonctionnalité de suivi des erreurs est disponible pour tous les langages pris en charge par l'APM. Elle ne nécessite pas l'utilisation d'un autre SDK.

Les traceurs Datadog recueillent des erreurs par l’intermédiaire des intégrations et de l’instrumentation manuelle du code source de vos services backend. La fonctionnalité de suivi des erreurs traite les spans d’erreur des traces si l’erreur se situe dans une span d’entrée de service (la span de service la plus élevée). Pour qu’une erreur puisse être surveillée, la span doit également contenir les tags de span error.stack, error.message et error.type.

Flamegraph avec des erreurs

La fonctionnalité de suivi des erreurs calcule une empreinte pour chaque span d’erreur traitée, à l’aide du type et du message de l’erreur, ainsi que des frames formant la stack trace. Les erreurs partageant la même empreinte sont regroupées au sein d’un même problème. Pour en savoir plus, consultez la documentation relative au Trace Explorer.

Examiner des problèmes pour commencer le dépannage ou le debugging

Le suivi des erreurs regroupe automatiquement les erreurs recueillies depuis vos services backend sous forme de catégories dans l’Error Tracking Explorer.

Cliquez sur un problème pour afficher un résumé de l’erreur, la distribution des spans concernées, les stack traces les plus récentes et les plus pertinentes, les tags de span, les tags de host, les tags de conteneur et les métriques.

Pour aller plus loin