APMと分散型トレーシング
Dash が新機能を発表!インシデントマネジメント、Continuous Profiler など多数の機能が追加されました! Dash イベントで発表された新機能!

APMと分散型トレーシング


Datadog APM と分散型トレーシングは、Web サービス、キュー、データベースがリクエスト、エラー、レイテンシーを監視するための標準のパフォーマンスダッシュボードを使用して、アプリケーションを詳細に可視化します。分散型トレースは、ホスト、コンテナ、プロキシ、サーバーレス機能全体で、ブラウザセッション、ログ、synthetic チェック、ネットワーク、プロセス、インフラストラクチャーのメトリクスにシームレスに関連付けられます。システム停止中、サンプリングなしで、トレースの 100% を収集して、最近 15 分間について検索、分析し、タグベースの保持フィルターを使用してビジネスに必要なトレースを 15 日間保持します。

Tracing Without Limits: トレースジャーニー

トレースは、インスツルメントされたアプリケーションで開始し Datadog へ流れ、トレースの 100%、1 秒につき最大 50 トレース(APM ホストあたり)まで収集します。高スループットのサービスに必要な場合は、Ingestion Controls を使用してこれを表示、制御できます。収集されたすべてのトレースは、15 分間ライブ検索および分析が可能です。また、タグベースのカスタム保持フィルターを使用して、ビジネスに有用なトレースを 15 日間保持し、検索、分析できます。

Datadog へトレースを送信

モノリスからマイクロサービスに移行すると、ホスト、コンテナ、またはサーバーレス機能全体の Datadog APM の設定に数分しかかかりません。

Datadog Tracing Library を追加し、ご使用の環境および言語、トレースの対象がプロキシまたは AWS Lambda 関数全体なのか、また自動インスツルメンテーション、dd-trace-api、OpenTracing、または OpenTelemetry のいずれを使用するのかに応じて、手順を見つけます。


Datadog APM の確認

これで、トレースを Datadog に送信するようにアプリケーションを構成したので、アプリケーションのパフォーマンスに関する情報を入手できます。

サービスマップ

トレースから自動生成されたサービスマップとサービスパフォーマンスメトリクスおよびモニターアラート状態のモニタリングによりサービスの依存関係を理解します

サービスマップ

サービスパフォーマンスダッシュボード

リクエスト、エラー、レイテンシーパーセンタイルに関するサービスメトリクスを監視します。インフラストラクチャーに関連づけられたデータベースクエリまたはエンドポイントにドリルダウンします。

サービスページ

タグを使用して、サンプリングなしのライブで 15 分間、トレースの 100% を検索します。

Live Analytics

停止中に、15 分間ライブで任意のタグにより任意のスパンのパフォーマンスを分析し、影響を受けたユーザーまたはトランザクションを特定します。

トレースの取り込みと保存

タグベースの保持フィルターで、最も重要なトレースを保持し、インデックス化されたすべてのスパンで 15 日間分析を実行します。

デプロイ追跡

サービスパフォーマンスを監視して、ローリング、ブルー/グリーン、シャドウ、またはカナリアデプロイに対しバージョン間で比較します。

ログと分散型トレースの接続

自動トレース ID インジェクションを使用した単一の分散リクエストのトレースとアプリケーションログを並べて表示します。

Synthetic テストデータとトレースの接続

トレースにシュミレーションされた API テストをリンクして、フロントエンド、ネットワーク、バックエンドリクエスト全体における障害の根本原因を突き止めます。

Synthetic テスト

Continuous Profiler

CPU、メモリ、または I/O を最も多く消費するコード行を特定するため、常時稼働の本番環境プロファイラーによりコードの効率を向上します。

その他の参考資料