サービス詳細画面

サービス詳細画面

概要

サービス詳細画面でサービスを選択すると、詳細なサービス詳細画面に移動します。サービスとは、ウェブフレームワークやデータベースなど、同じジョブを実行するプロセスのセットです(サービスの定義方法については APM を開始するをご覧ください)。

このページで参照できる内容

サービスモニター

Datadog は、サービスタイプに応じてモニターのリストを提案します。

サービスモニター

直接有効にするか、独自の APM モニターを作成します。

: モニターに service:<サービス名> をタグ付けして、APM サービスにアタッチします。

サマリーカード

サービス詳細画面には、サービスの健全性に関するハイライトを示すサマリーカードが表示されます。カード内をクリックすると、最新のデプロイメントの詳細やトレースを表示したり、このサービス上のすべてのデプロイメントを表示したりできます。エラー追跡とのインテグレーションにより、サービス上でフラグが立てられた新しい問題を見ることができます。ここで、エラーは自動的に問題に集約されます。

サマリーカード

サービスレベル目標 (SLO)インシデントのサマリーにより、SLO と進行中のインシデントの状態を監視し、パフォーマンス目標を常に念頭に置いておくことができます。カードをクリックすると、サービスに関する新しい SLO を作成したり、インシデントを宣言したりすることができます。

Watchdog インサイト

Watchdog インサイトカルーセルでは、特定のタグで検出された異常が表示され、問題の根本原因を直接掘り下げることができます。

すぐに使えるグラフ

Datadog は、特定のサービスに対してすぐに使用できるグラフを提供しています。

  • リクエスト - 選択して表示:

    • リクエストとエラーの合計量
    • 1 秒あたりのリクエストとエラーの量
  • レイテンシー - 選択して表示:

    • トレースされたリクエストの平均/p75/p90/p95/p99/最大レイテンシー
    • ** レイテンシー分布** 
    • ウェブサービスの Apdex スコアApdex の詳細
  • エラー - 選択して表示:

    • エラーの合計量
    • 1 秒あたりのエラーの量
    • % エラー率
  • 依存関係マップ:

    • 上流と下流のサービスを示した依存関係マップです。
  • サブサービス: 複数のサービスが関係している場合、(依存関係マップと同じトグルオプションにある) 4 番目のグラフが、サービスのリクエストあたりの合計消費時間/消費時間の割合/平均時間サービスごとまたはタイプごとに分類します。

    これは、現在のサービスから他のサービスまたはタイプへの下流サービスでトレースに費やされた合計、相対、平均時間を表します。

    : PostgresRedis などのサービスは、他のサービスを呼び出さない「最終的な」オペレーションであり、サブサービスのグラフはありません。 Watchdog は、リクエスト、レイテンシー、エラーのグラフで自動的な異常検出を実行します。異常が検出されると、グラフにオーバーレイが表示され、クリックするとサイドパネルに詳細が表示される Watchdog のアイコンが表示されます。

すぐに使えるサービスグラフ

エクスポート

グラフを既存のダッシュボードにエクスポートするには、各グラフの右上隅にある矢印をクリックします。

ダッシュボードに保存

リソース

リソースごとに分類されたリクエスト、レイテンシー、エラーのグラフを参照し、問題のあるリソースを特定します。リソースとは、サービスに対する特定のアクション (通常は個々のエンドポイントやクエリ) です。詳しくは、APM を開始するをご覧ください。

下には、サービスに関連するリソースのリストがあります。このサービスのリソースをリクエスト、レイテンシー、エラー、時間でソートし、トラフィックの多いエリアや潜在的な問題を特定します。なお、これらのメトリクス列は構成することができます (下の画像を参照)。

リソース

詳細については、専用のリソースドキュメントを参照してください

リソースリストに表示するものを選択します。

  • Requests: トレースされたリクエストの絶対量(1 秒あたり)
  • Requests per second: 1 秒あたりのトレースされたリクエストの絶対量
  • Total time: このリソースで費やしたすべての時間の合計
  • Avg/p75/p90/p95/p99/Max Latency: トレースされたリクエストの平均/p75/p90/p95/p99/最大レイテンシー
  • Errors: 特定のリソースのエラーの絶対量
  • Error Rate: 特定のリソースのエラーの割合
リソース列

その他のタブ

デプロイ

バージョンタグで構成されたサービスは、Deployment タブにバージョンが表示されます。バージョンセクションには、選択した時間間隔にアクティブだったサービスの全バージョンが表示され、アクティブなバージョンが一番上に表示されます。

デフォルトで、以下が表示されます。

  • タイムフレーム中にこのサービスにデプロイされたバージョン名。

  • このバージョンに対応するトレースが確認された最初および最後の時間。

  • 各バージョンに出現した、直前バージョンでは出現しなかったエラータイプの回数を表示するエラータイプインジケーター。

    : ここには、前バージョンのトレースでは見られなかったエラーが表示されますが、このバージョンがこのようなエラーを発生させることを意味するものではありません。新しいエラータイプを確認することは、エラー調査を始める良い方法です。

  • 1 秒あたりのリクエスト数。

  • 合計リクエスト数のパーセンテージとしてのエラー率。

この概要テーブルに列を追加またはテーブルから列を削除することができます。選択はすべて保存されます。利用可能な列は以下のとおりです。

  • 前バージョンに存在しなかったバージョンでアクティブなエンドポイント。
  • アクティブな時間。このバージョンで Datadog に送信された最初のトレースから最後のトレースまでの時間を表示。
  • リクエスト総数。
  • エラー総数。
  • p50、p75、p90、p95、p99、または最大で計測されたレイテンシー。
デプロイメント

サービス詳細画面のデプロイメントについてご覧ください。

エラー トラッキング

類似のエラーを集約して表示することで、ノイズの多いエラーの流れを管理しやすい問題に変え、サービスのエラーの影響を評価するのに役立ちます。エラー追跡で問題の詳細をお読みください。

このタブには、どのリソースに最も多くの問題があるかを示す概要グラフと、サービスで発生する最も一般的な問題のリストがあります。リスト内の問題をクリックすると、サイドパネルにそのスタックトレース、関連するコードのバージョン、開始以来のエラーの総発生数などの詳細が表示されます。

Error Tracking タブ

インフラストラクチャー

サービスが Kubernetes 上で実行されている場合、サービス詳細画面に Infrastructure タブが表示されます。ライブ Kubernetes Pods テーブルには、メモリ使用量が限界に近づいているかどうかなど、ポッドの詳細情報が表示されます。これにより、プロビジョニングされたコンピュートリソースが最適なアプリケーションパフォーマンスに必要なものを超えているかを明確に確認することによって、リソース割り当てを改善することが可能です。

Kubernetes ポッド

Kubernetes Metrics セクションは、選択した期間のインフラストラクチャーの健全性の要約を示し、CPU、メモリ、ネットワーク、およびディスクメトリクスを含みます。

Kubernetes メトリクス

Kubernetes 以外の環境 (ホストベースのインストールなど) については、統合サービスタグ付けのドキュメントをご覧ください。

ランタイムメトリクス

トレースクライアントでランタイムメトリクスが有効になっている場合、サービスのランタイム言語に対応する Runtime metrics タブが表示されます。詳しくは、ランタイムメトリクスをご覧ください。

ランタイムメトリクス

Profiling

サービスに Continuous Profiler が設定されている場合、Profiling タブが表示されます。利用可能なバージョンやランタイム言語などの概要が上部に表示されます。以下は、バージョン、エンドポイント、メソッド別のすぐに使えるプロファイリングメトリクスで、リソースを大量に消費するメソッドの特定とデバッグを支援します。グラフをクリックすると、関連するトレース、ログ、およびその他のデータが表示されます。APM と Continuous Profiler の詳細についてご確認ください

プロファイリング

トレース

トレースタブで、サービスに関連するトレースのリストを表示します。トレースは、サービス、環境、および操作名ですでにフィルタリングされています。ステータス、リソース、エラータイプなどのコアファセットを使用して、問題のあるスパンをドリルダウンします。詳細については、スパンをクリックすると、そのトレースのフレーム グラフや詳細が表示されます。

トレース

ログ管理

サービスのログによくあるパターンを表示し、検索バーのステータスなどのファセットを使用して、パターンのリストをフィルタリングします。パターンをクリックすると、サイドパネルが開き、どのイベントがカスケードを引き起こしたかなど、より詳細な情報を見ることができます。詳しくは、ログパターンをご覧ください。

ログパターン

その他の参考資料