バックエンドサービスのエラー追跡

概要

エラートラッキングエクスプローラーの問題の詳細画面

It is critical for your system’s health to consistently monitor the errors collected by Datadog. When there are many individual error events, it becomes hard to prioritize errors for troubleshooting.

Error Tracking simplifies debugging by grouping thousands of similar errors into a single issue. An issue is an aggregation of error data that provides insights such as

  • How many users have been impacted
  • When the error first occurred
  • Which commit probably caused the error

Error Tracking enables you to:

  • Track, triage, and debug fatal errors
  • Group similar errors into issues, so that you can more easily identify important errors and reduce noise
  • Set monitors on error tracking events, such as high error volume or new issues
  • Follow issues over time to know when they first started, if they are still ongoing, and how often they occur

計画と使用

エラー追跡は、APM でサポートされているすべての言語で利用でき、別の SDK を使用する必要はありません。

オプションで、スタックトレース内でコードスニペットを見たい場合は、GitHub インテグレーションをセットアップしてください。

スタックトレース内のインラインコードスニペット

リポジトリの構成を始めるには、ソースコードインテグレーションのドキュメントを参照してください。

エラースパンを追跡するために span タグを使用する

Datadog トレーサーは、インテグレーションやバックエンドサービスのソースコードの手動インスツルメンテーションを通じて、エラーを収集します。トレース内のエラースパンは、エラーがサービスエントリースパン (一番上のサービススパン) に位置する場合、エラー追跡によって処理されます。このスパンには、追跡対象の error.stackerror.messageerror.type スパンタグが含まれている必要があります。

エラーのあるフレームグラフ

エラー追跡は、エラータイプ、エラーメッセージ、スタックトレースを形成するフレームを使用して、処理する各エラースパンのフィンガープリントを計算します。同じフィンガープリントを持つエラーはグループ化され、同じ問題に属します。詳しくは、トレースエクスプローラーのドキュメントを参照してください。

トラブルシューティングやデバッグを開始するための問題点の検討

Error Tracking は、バックエンドサービスから Error Tracking Explorer に収集されたエラーを自動的に問題に分類します。主な機能を確認するには、Error Tracking Explorer のドキュメントを参照してください。

APM から作成される問題には、影響を受けたスパンの分布、最新の最も関連性の高いスタックトレース、スパンタグ、ホストタグ、コンテナタグ、およびメトリクスが含まれます。

その他の参考資料