- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
サービス詳細画面でサービスを選択すると、詳細なサービス詳細画面に移動します。サービスとは、ウェブフレームワークやデータベースなど、同じジョブを実行するプロセスのセットです(サービスの定義方法については APM を開始するをご覧ください)。
このページで参照できる内容
Datadog は、サービスタイプに応じてモニターのリストを提案します。
直接有効にするか、独自の APM モニターを作成します。
注: モニターに service:<SERVICE_NAME>
をタグ付けして、APM サービスにアタッチします。
Watchdog Insights カルーセルでは、特定のタグで検出された異常と外れ値が表示され、問題の根本原因を調査することができます。インサイトは、サービスタグを含む APM、Continuous Profiler、ログ管理、インフラストラクチャーのデータから発見されます。これらのインサイトは、各製品ページに表示されるインサイトと同じです。たとえば、サービスページのログの外れ値と同じものが、ログエクスプローラーに表示されます。
インサイトをクリックすると、インサイトの時間枠、関連するログやトレース、次のステップの候補などの詳細が表示されます。
サービス詳細画面には、サービスの健全性に関するハイライトを示すサマリーカードが表示されます。カード内をクリックすると、最新のデプロイメントの詳細やトレースを表示したり、このサービス上のすべてのデプロイメントを表示したりできます。エラー追跡とのインテグレーションにより、サービス上でフラグが立てられた新しい問題を見ることができます。ここで、エラーは自動的に問題に集約されます。
サービスレベル目標 (SLO) とインシデントのサマリーにより、SLO と進行中のインシデントの状態を監視し、パフォーマンス目標を常に念頭に置いておくことができます。カードをクリックすると、サービスに関する新しい SLO を作成したり、インシデントを宣言したりすることができます。セキュリティシグナルサマリーでは、アプリケーションの脅威に対してサービスがどのように対応しているかを確認できます。
依存関係マップを使用して、サービス間通信を視覚化し、データベース、キュー、サードパーティ依存関係などのシステムコンポーネントを把握できます。依存関係をタイプ別にグループ化し、リクエスト、レイテンシー、エラーでフィルターをかけて、接続の遅延や接続の失敗を特定できます。
詳しくは、新しい Service ページと推測サービスを参照してください。
Datadog は、特定のサービスに対してすぐに使用できるグラフを提供しています。
リクエスト - 選択して表示:
レイテンシー - 選択して表示:
エラー - 選択して表示:
依存関係マップ:
サブサービス: 複数のサービスが関係している場合、(依存関係マップと同じトグルオプションにある) 4 番目のグラフが、サービスのリクエストあたりの合計消費時間/消費時間の割合/平均時間をサービスごとまたはタイプごとに分類します。
これは、現在のサービスから他のサービスまたはタイプへのダウンストリームサービスでトレースに費やされた合計、相対、平均時間を表します。
注: Postgres や Redis などのサービスは、他のサービスを呼び出さない「最終的な」オペレーションであり、サブサービスのグラフはありません。 Watchdog は、リクエスト、レイテンシー、エラーのグラフで自動的な異常検出を実行します。異常が検出されると、グラフにオーバーレイが表示され、クリックするとサイドパネルに詳細が表示される Watchdog のアイコンが表示されます。
グラフを既存のダッシュボードにエクスポートするには、各グラフの右上隅にある矢印をクリックします。
リソースごとに分類されたリクエスト、レイテンシー、エラーのグラフを参照し、問題のあるリソースを特定します。リソースとは、サービスに対する特定のアクション (通常は個々のエンドポイントやクエリ) です。詳しくは、APM を開始するをご覧ください。
下には、サービスに関連するリソースのリストがあります。このサービスのリソースをリクエスト、レイテンシー、エラー、時間でソートし、トラフィックの多いエリアや潜在的な問題を特定します。なお、これらのメトリクス列は構成することができます (下の画像を参照)。
リソースをクリックすると、サイドパネルが開き、リソースのすぐに使えるグラフ (リクエスト、エラー、レイテンシーについて)、リソース依存マップ、スパン要約表が表示されます。キーボードのナビゲーションキーを使用して、Resources リスト上のリソースを切り替えたり、サービス内のリソースを比較したりできます。完全なリソースページを表示するには、Open Full Page をクリックします。
詳細については、専用のリソースドキュメントを参照してください。
リソースリストに表示するものを選択します。
バージョンタグで構成されたサービスは、Deployment タブにバージョンが表示されます。バージョンセクションには、選択した時間間隔にアクティブだったサービスの全バージョンが表示され、アクティブなバージョンが一番上に表示されます。
デフォルトで、以下が表示されます。
タイムフレーム中にこのサービスにデプロイされたバージョン名。
このバージョンに対応するトレースが確認された最初および最後の時間。
各バージョンに出現した、直前バージョンでは出現しなかったエラータイプの回数を表示するエラータイプインジケーター。
注: ここには、前バージョンのトレースでは見られなかったエラーが表示されますが、必ずしもこのバージョンになってこのようなエラーが発生するようになったことを意味するものではありません。新しいエラータイプを確認することは、エラー調査を始める良い方法です。
1 秒あたりのリクエスト数。
合計リクエスト数のパーセンテージとしてのエラー率。
この概要テーブルに列を追加またはテーブルから列を削除することができます。選択はすべて保存されます。利用可能な列は以下のとおりです。
サービス詳細画面のデプロイメントについてご覧ください。
類似のエラーを集約して表示することで、ノイズの多いエラーの流れを管理しやすい問題に変え、サービスのエラーの影響を評価するのに役立ちます。エラー追跡で問題の詳細をお読みください。
このタブには、どのリソースに最も多くの問題があるかを示す概要グラフと、サービスで発生する最も一般的な問題のリストがあります。リスト内の問題をクリックすると、サイドパネルにそのスタックトレース、関連するコードのバージョン、開始以来のエラーの総発生数などの詳細が表示されます。
サービスのライブラリに存在する既知の脆弱性や、サービス上のセキュリティシグナルなど、サービスのセキュリティポスチャを理解できます。セキュリティシグナルは、Datadog がサービスに影響を与えるアプリケーション攻撃を検知した際に自動的に生成されます。これらのシグナルは、個々の攻撃の試みをそれぞれ評価する代わりに、ユーザーが確認すべき重要な脅威を特定します。アプリケーションセキュリティの詳細を参照してください。
セキュリティタブのトップセクションには、脆弱性の数と重大性、攻撃の時期、攻撃の種類、攻撃者情報 (クライアント IP または認証済みユーザー) を示す概要グラフが表示されます。
パネルの次のセクションには、サービスに関係するすべての脆弱性とシグナルが一覧表示されます。任意のセキュリティ脆弱性をクリックすると、関連情報が記されたサイドパネルが開き、脆弱性に関するさらなる調査と修復を実行できます。セキュリティシグナルをクリックすると、どのような脅威が検出されたか、そして修復のためにどのような対応が可能かについての情報を入手できます。
サービスが Kubernetes 上で実行されている場合、サービス詳細画面に Infrastructure タブが表示されます。ライブ Kubernetes Pods テーブルには、メモリ使用量が限界に近づいているかどうかなど、ポッドの詳細情報が表示されます。これにより、プロビジョニングされたコンピュートリソースが最適なアプリケーションパフォーマンスに必要なものを超えているかを明確に確認することによって、リソース割り当てを改善することが可能です。
Kubernetes Metrics セクションは、選択した期間のインフラストラクチャーの健全性の要約を示し、CPU、メモリ、ネットワーク、およびディスクメトリクスを含みます。
Kubernetes 以外の環境 (ホストベースのインストールなど) については、統合サービスタグ付けのドキュメントをご覧ください。
トレースクライアントでランタイムメトリクスが有効になっている場合、サービスのランタイム言語に対応する Runtime metrics タブが表示されます。詳しくは、ランタイムメトリクスをご覧ください。
サービスに Continuous Profiler が設定されている場合、Profiling タブが表示されます。利用可能なバージョンやランタイム言語などの概要が上部に表示されます。以下は、バージョン、エンドポイント、メソッド別のすぐに使えるプロファイリングメトリクスで、リソースを大量に消費するメソッドの特定とデバッグを支援します。グラフをクリックすると、関連するトレース、ログ、およびその他のデータが表示されます。APM と Continuous Profiler の詳細についてご確認ください。
トレースタブで、サービスに関連するトレースのリストを表示します。トレースは、サービス、環境、および操作名ですでにフィルタリングされています。ステータス、リソース、エラータイプなどのコアファセットを使用して、問題のあるスパンをドリルダウンします。詳細については、スパンをクリックすると、そのトレースのフレームグラフや詳細が表示されます。
サービスのログによくあるパターンを表示し、検索バーのステータスなどのファセットを使用して、パターンのリストをフィルタリングします。パターンをクリックすると、サイドパネルが開き、どのイベントがカスケードを引き起こしたかなど、より詳細な情報を見ることができます。詳しくは、ログパターンをご覧ください。