バックエンドサービスのエラー追跡

概要

エラートラッキングエクスプローラーの問題の詳細画面

Datadog によって収集されたエラーを一貫して監視することは、システムの健全性のために非常に重要です。個々のエラーイベントが多数存在する場合、トラブルシューティングのためにエラーの優先順位をつけることが困難になります。

Error Tracking は、何千もの類似したエラーを 1 つの問題にグループ化することで、デバッグを簡素化します。問題はエラーデータの集約であり、以下のような洞察を提供します。

  • 影響を受けたユーザーの数
  • エラーが最初に発生したとき
  • おそらくどのコミットがエラーを引き起こしたか

エラー追跡は、以下のことを可能にします。

  • 致命的なエラーの追跡、トリアージ、デバッグ
  • 類似のエラーを課題にまとめることで、重要なエラーをより簡単に特定し、ノイズを減らすことができます
  • 大量のエラーや新しい問題など、エラー追跡イベントのモニターを設定します
  • 経時的に問題を監視するため、開始のタイミングや継続した場合の頻度を把握できます

セットアップ

エラー追跡は、APM でサポートされているすべての言語で利用でき、別の SDK を使用する必要はありません。

オプションで、スタックトレース内でコードスニペットを見たい場合は、GitHub インテグレーションをセットアップしてください。

スタックトレース内のインラインコードスニペット

リポジトリの構成を始めるには、ソースコードインテグレーションのドキュメントを参照してください。

エラースパンを追跡するために span タグを使用する

Datadog トレーサーは、インテグレーションやバックエンドサービスのソースコードの手動インスツルメンテーションを通じて、エラーを収集します。トレース内のエラースパンは、エラーがサービスエントリースパン (一番上のサービススパン) に位置する場合、エラー追跡によって処理されます。このスパンには、追跡対象の error.stackerror.messageerror.type スパンタグが含まれている必要があります。

エラーのあるフレームグラフ

エラー追跡は、エラータイプ、エラーメッセージ、スタックトレースを形成するフレームを使用して、処理する各エラースパンのフィンガープリントを計算します。同じフィンガープリントを持つエラーはグループ化され、同じ問題に属します。詳しくは、トレースエクスプローラーのドキュメントを参照してください。

トラブルシューティングやデバッグを開始するための問題点の検討

Error Tracking は、バックエンドサービスから Error Tracking Explorer に収集されたエラーを自動的に問題に分類します。主な機能を確認するには、Error Tracking Explorer のドキュメントを参照してください。

APM から作成される問題には、影響を受けたスパンの分布、最新の最も関連性の高いスタックトレース、スパンタグ、ホストタグ、コンテナタグ、およびメトリクスが含まれます。

その他の参考資料