サービス詳細画面

サービス詳細画面

概要

サービス詳細画面でサービスを選択すると、詳細なサービス詳細画面に移動します。サービスとは、ウェブフレームワークやデータベースなど、同じジョブを実行するプロセスのセットです(サービスの定義方法については APM を開始するをご覧ください)。

このページで参照できる内容

サービスモニター

Datadog は、サービスタイプに応じてモニターのリストを提案します。

サービスモニター

直接有効にするか、独自の APM モニターを作成します。

: モニターに service:<SERVICE_NAME> をタグ付けして、APM サービスにアタッチします。

Watchdog Insights

Watchdog Insights カルーセルでは、特定のタグで検出された異常と外れ値が表示され、問題の根本原因を調査することができます。インサイトは、サービスタグを含む APM、Continuous Profiler、ログ管理、インフラストラクチャーのデータから発見されます。これらのインサイトは、各製品ページに表示されるインサイトと同じです。たとえば、サービスページのログの外れ値と同じものが、ログエクスプローラーに表示されます。

Watchdog インサイト

インサイトをクリックすると、インサイトの時間枠、関連するログやトレース、次のステップの候補などの詳細が表示されます。

Watchdog インサイトの詳細

サマリーカード

サービス詳細画面には、サービスの健全性に関するハイライトを示すサマリーカードが表示されます。カード内をクリックすると、最新のデプロイメントの詳細やトレースを表示したり、このサービス上のすべてのデプロイメントを表示したりできます。エラー追跡とのインテグレーションにより、サービス上でフラグが立てられた新しい問題を見ることができます。ここで、エラーは自動的に問題に集約されます。

サマリーカード

サービスレベル目標 (SLO)インシデントのサマリーにより、SLO と進行中のインシデントの状態を監視し、パフォーマンス目標を常に念頭に置いておくことができます。カードをクリックすると、サービスに関する新しい SLO を作成したり、インシデントを宣言したりすることができます。セキュリティシグナルサマリーでは、アプリケーションの脅威に対してサービスがどのように対応しているかを確認できます。

依存関係

非公開ベータ版にオプトイン!

推測サービスと新しいサービス詳細画面のレイアウトは非公開ベータ版です。アクセスをリクエストするには、フォームにご記入ください。

Request Access

依存関係マップを使用して、サービス間通信を視覚化し、データベース、キュー、サードパーティ依存関係などのシステムコンポーネントを把握できます。依存関係をタイプ別にグループ化し、リクエスト、レイテンシー、エラーでフィルターをかけて、接続の遅延や接続の失敗を特定できます。

詳しくは、新しい Service ページと推測サービスを参照してください。

APM Services ページの依存関係セクション

すぐに使えるグラフ

Datadog は、特定のサービスに対してすぐに使用できるグラフを提供しています。

  • リクエスト - 選択して表示:

    • リクエストとエラーの合計量
    • 1 秒あたりのリクエストとエラーの量
  • レイテンシー - 選択して表示:

    • トレースされたリクエストの平均/p75/p90/p95/p99/最大レイテンシーと、レイテンシーによるマッチング上位 5 スパン
    • ** レイテンシー分布** 
    • ウェブサービスの Apdex スコアApdex の詳細
  • エラー - 選択して表示:

    • エラーの合計量
    • 1 秒あたりのエラーの量
    • % エラー率
  • 依存関係マップ:

    • アップストリームとダウンストリームのサービスを示した依存関係マップです。
  • サブサービス: 複数のサービスが関係している場合、(依存関係マップと同じトグルオプションにある) 4 番目のグラフが、サービスのリクエストあたりの合計消費時間/消費時間の割合/平均時間サービスごとまたはタイプごとに分類します。

    これは、現在のサービスから他のサービスまたはタイプへのダウンストリームサービスでトレースに費やされた合計、相対、平均時間を表します。

    : PostgresRedis などのサービスは、他のサービスを呼び出さない「最終的な」オペレーションであり、サブサービスのグラフはありません。 Watchdog は、リクエスト、レイテンシー、エラーのグラフで自動的な異常検出を実行します。異常が検出されると、グラフにオーバーレイが表示され、クリックするとサイドパネルに詳細が表示される Watchdog のアイコンが表示されます。

 すぐに使えるサービスグラフ

エクスポート

グラフを既存のダッシュボードにエクスポートするには、各グラフの右上隅にある矢印をクリックします。

ダッシュボードに保存

リソース

リソースごとに分類されたリクエスト、レイテンシー、エラーのグラフを参照し、問題のあるリソースを特定します。リソースとは、サービスに対する特定のアクション (通常は個々のエンドポイントやクエリ) です。詳しくは、APM を開始するをご覧ください。

下には、サービスに関連するリソースのリストがあります。このサービスのリソースをリクエスト、レイテンシー、エラー、時間でソートし、トラフィックの多いエリアや潜在的な問題を特定します。なお、これらのメトリクス列は構成することができます (下の画像を参照)。

リソース

リソースをクリックすると、サイドパネルが開き、リソースのすぐに使えるグラフ (リクエスト、エラー、レイテンシーについて)、リソース依存マップ、スパン要約表が表示されます。キーボードのナビゲーションキーを使用して、Resources リスト上のリソースを切り替えたり、サービス内のリソースを比較したりできます。完全なリソースページを表示するには、Open Full Page をクリックします。

詳細については、専用のリソースドキュメントを参照してください

リソースリストに表示するものを選択します。

  • Requests: トレースされたリクエストの絶対量 (1 秒あたり)
  • Requests per second: 1 秒あたりのトレースされたリクエストの絶対量
  • Total time: このリソースで費やしたすべての時間の合計
  • Avg/p75/p90/p95/p99/Max Latency: トレースされたリクエストの平均/p75/p90/p95/p99/最大レイテンシー
  • Errors: 特定のリソースのエラーの絶対量
  • Error Rate: 特定のリソースのエラーの割合
リソース列

その他のタブ

デプロイ

バージョンタグで構成されたサービスは、Deployment タブにバージョンが表示されます。バージョンセクションには、選択した時間間隔にアクティブだったサービスの全バージョンが表示され、アクティブなバージョンが一番上に表示されます。

デフォルトで、以下が表示されます。

  • タイムフレーム中にこのサービスにデプロイされたバージョン名。

  • このバージョンに対応するトレースが確認された最初および最後の時間。

  • 各バージョンに出現した、直前バージョンでは出現しなかったエラータイプの回数を表示するエラータイプインジケーター。

    : ここには、前バージョンのトレースでは見られなかったエラーが表示されますが、必ずしもこのバージョンになってこのようなエラーが発生するようになったことを意味するものではありません。新しいエラータイプを確認することは、エラー調査を始める良い方法です。

  • 1 秒あたりのリクエスト数。

  • 合計リクエスト数のパーセンテージとしてのエラー率。

この概要テーブルに列を追加またはテーブルから列を削除することができます。選択はすべて保存されます。利用可能な列は以下のとおりです。

  • 前バージョンに存在しなかったバージョンでアクティブなエンドポイント。
  • アクティブな時間。このバージョンで Datadog に送信された最初のトレースから最後のトレースまでの時間を表示。
  • リクエスト総数。
  • エラー総数。
  • p50、p75、p90、p95、p99、または最大で計測されたレイテンシー。
デプロイメント

サービス詳細画面のデプロイメントについてご覧ください。

エラー追跡

類似のエラーを集約して表示することで、ノイズの多いエラーの流れを管理しやすい問題に変え、サービスのエラーの影響を評価するのに役立ちます。エラー追跡で問題の詳細をお読みください。

このタブには、どのリソースに最も多くの問題があるかを示す概要グラフと、サービスで発生する最も一般的な問題のリストがあります。リスト内の問題をクリックすると、サイドパネルにそのスタックトレース、関連するコードのバージョン、開始以来のエラーの総発生数などの詳細が表示されます。

Error Tracking タブ

セキュリティ

サービスのライブラリに存在する既知の脆弱性や、サービス上のセキュリティシグナルなど、サービスのセキュリティポスチャを理解できます。セキュリティシグナルは、Datadog がサービスに影響を与えるアプリケーション攻撃を検知した際に自動的に生成されます。これらのシグナルは、個々の攻撃の試みをそれぞれ評価する代わりに、ユーザーが確認すべき重要な脅威を特定します。アプリケーションセキュリティの詳細を参照してください。

セキュリティタブのトップセクションには、脆弱性の数と重大性、攻撃の時期、攻撃の種類、攻撃者情報 (クライアント IP または認証済みユーザー) を示す概要グラフが表示されます。

パネルの次のセクションには、サービスに関係するすべての脆弱性とシグナルが一覧表示されます。任意のセキュリティ脆弱性をクリックすると、関連情報が記されたサイドパネルが開き、脆弱性に関するさらなる調査と修復を実行できます。セキュリティシグナルをクリックすると、どのような脅威が検出されたか、そして修復のためにどのような対応が可能かについての情報を入手できます。

セキュリティ

インフラストラクチャー

サービスが Kubernetes 上で実行されている場合、サービス詳細画面に Infrastructure タブが表示されます。ライブ Kubernetes Pods テーブルには、メモリ使用量が限界に近づいているかどうかなど、ポッドの詳細情報が表示されます。これにより、プロビジョニングされたコンピュートリソースが最適なアプリケーションパフォーマンスに必要なものを超えているかを明確に確認することによって、リソース割り当てを改善することが可能です。

Kubernetes ポッド

Kubernetes Metrics セクションは、選択した期間のインフラストラクチャーの健全性の要約を示し、CPU、メモリ、ネットワーク、およびディスクメトリクスを含みます。

Kubernetes メトリクス

Kubernetes 以外の環境 (ホストベースのインストールなど) については、統合サービスタグ付けのドキュメントをご覧ください。

ランタイムメトリクス

トレースクライアントでランタイムメトリクスが有効になっている場合、サービスのランタイム言語に対応する Runtime metrics タブが表示されます。詳しくは、ランタイムメトリクスをご覧ください。

ランタイムメトリクス

プロファイリング

サービスに Continuous Profiler が設定されている場合、Profiling タブが表示されます。利用可能なバージョンやランタイム言語などの概要が上部に表示されます。以下は、バージョン、エンドポイント、メソッド別のすぐに使えるプロファイリングメトリクスで、リソースを大量に消費するメソッドの特定とデバッグを支援します。グラフをクリックすると、関連するトレース、ログ、およびその他のデータが表示されます。APM と Continuous Profiler の詳細についてご確認ください

プロファイリング

トレース

トレースタブで、サービスに関連するトレースのリストを表示します。トレースは、サービス、環境、および操作名ですでにフィルタリングされています。ステータス、リソース、エラータイプなどのコアファセットを使用して、問題のあるスパンをドリルダウンします。詳細については、スパンをクリックすると、そのトレースのフレームグラフや詳細が表示されます。

トレース

ログ

サービスのログによくあるパターンを表示し、検索バーのステータスなどのファセットを使用して、パターンのリストをフィルタリングします。パターンをクリックすると、サイドパネルが開き、どのイベントがカスケードを引き起こしたかなど、より詳細な情報を見ることができます。詳しくは、ログパターンをご覧ください。

ログパターン

その他の参考資料