APM


Datadog Application Performance Monitoring (APM) は、Web サービス、キュー、データベースがリクエスト、エラー、レイテンシーを監視するための標準のパフォーマンスダッシュボードを使用して、アプリケーションを詳細に可視化します。分散型トレースは、ホスト、コンテナ、プロキシ、サーバーレス機能全体で、ブラウザセッション、ログ、プロファイル、synthetic チェック、ネットワーク、プロセス、インフラストラクチャーのメトリクスにシームレスに関連付けられます。コードのホットスポットで、遅延しているトレースの調査から、パフォーマンスのボトルネックになっている特定のコード行を識別へ直接移動できます。

Datadog APM で使用される用語の紹介は、APM の用語と概念を参照してください。

Datadog へトレースを送信

モノリスからマイクロサービスに移行すると、ホスト、コンテナ、またはサーバーレス機能全体の Datadog APM の設定に数分しかかかりません。

トレースの対象がプロキシまたは AWS Lambda 関数およびホスト全体なのか、また自動インスツルメンテーション、dd-trace-api、または OpenTelemetry のいずれを使用するのかに応じて、ご使用の環境および言語に Datadog Tracing Library を追加します。

Java
Python
Ruby
Go
Node.js
PHP
C++
.Net
.Net

Datadog に流入するデータ、Datadog が保持するデータの制御と管理

APM ライフサイクル

トレースは、インスツルメントされたアプリケーションで開始し Datadog へ流れます。高スループットのサービスの場合は、Ingestion Controls を使用して取り込みを表示、制御できます。取り込まれたすべてのトレースは、15 分間ライブ検索および分析が可能です。また、タグベースのカスタム保持フィルターを使用して、ビジネスに有用なトレースを 15 日間保持し、検索、分析できます。

トレースの保持と収集

スパンからカスタムメトリクスを生成

取り込んだすべてのスパンから 15 か月間保持されるメトリクスを生成して、主要なビジネスおよびパフォーマンスの指標を作成、長期的に監視します。

取り込んだスパンからカスタムメトリクスを生成する

トレースと他のテレメトリーとの連携

アプリケーションログと、自動トレース ID 挿入による単一の分散リクエストのトレースを並べて表示することができます。実際のユーザーセッションとトレースをリンクさせ、ユーザーの経験や報告された問題に対応する正確なトレースを確認することができます。フロントエンド、ネットワーク、バックエンドのリクエストにまたがる障害の根本原因を見つけるために、トレースとシミュレーションテストのリンクを行います。

ログとトレースをつなげる

ライブトレースとインデックストレースの確認

取り込んだトレースの検索を任意のタグで、15 分間ライブで実行できます。停止中に任意のスパンの任意のタグでパフォーマンスを分析し、影響を受けたユーザーやトランザクションを特定します。リクエストフローを示すマップやその他の視覚化により、コードが何をしているのか、どこでパフォーマンスを向上させることができるのかを理解することができます。

サービスに対する深い洞察力を得る

トレースから自動生成されたサービスマップとサービスパフォーマンスメトリクスおよびモニターアラート状態のモニタリングによりサービスの依存関係を理解します

リクエスト、エラー、レイテンシーパーセンタイルに関するサービスメトリクスを監視します。インフラストラクチャーに関連づけられた個々のデータベースクエリまたはエンドポイントを分析します。

サービスページ

サービスパフォーマンスを監視して、ローリング、ブルー/グリーン、シャドウ、またはカナリアデプロイに対しバージョン間で比較します。

サービス詳細画面のバージョン

本番環境コードのプロファイル

CPU、メモリ、または I/O を最も多く消費するコード行を特定するために、常時稼働の本番環境プロファイリングによりアプリケーションのレイテンシーを向上し、リソースの計算を最適化します。

プロファイリング

その他の参考資料