Watchdog Insights

概要

Datadog Watchdog は常にバックグラウンドで動作し、組織全体のデータセットに異常がないかスキャンします。Datadog UI をナビゲートすると、Watchdog Insights がアクティブな検索クエリにマッチした異常のリストをフィルターし、優先度別にソートして表示します。

インシデントの調査には、試行錯誤が必要です。特定の分野に精通したエンジニアは、その経験をもとに、まずどこに潜在的な問題があるのかを知っています。Watchdog Insights を使うことで、経験の浅いエンジニアも含め、すべてのエンジニアが最も重要なデータに注意を払い、インシデント調査を加速させることができます。

異常の種類

各インサイトは、ユーザーのサブセットに影響を与える 1 つの外れ値または異常値を強調表示します。製品分野によって、Watchdog Insights は異なるタイプの異常を表示します。例としては、以下のようなものがあります (ただし、これらに限定されるものではありません)。

  • ログ、トレース、RUM ビューにおけるエラーとレイテンシーの外れ値
  • エラーログの急増
  • 新しいエラーログ
  • デッドロックされたスレッド
  • 未対応の Kubernetes ポッドの割合が高い

優先順位付け

Watchdog は、最も重要なインサイトをリストの先頭に置くために、様々な要因に基づきインサイトをソートします。Watchdog が考慮する要素には以下のようなものがあります。

  • 状態 (進行中と解決済み)
  • ステータス (警告、エラー、重大)
  • 開始時間
  • 異常の種類

使用方法

ログエクスプローラーの Watchdog Insights バナーには、Web ストアサービスの新しいエラーログ、商品レコメンドサービスのエラーログの急増、商品レコメンドサービスのエラーログの別の急増の 3 つの異常が表示されています

Watchdog Insights のバナーは、各ページの上部付近にあります。バナーを展開すると、概要が表示されます。最も優先度の高いインサイトが左側に表示されます。Watchdog が問題を発見できない場合、バナーは灰色で表示されます。

インサイトのフィルター

現在のビューを Watchdog Insight に合わせて絞り込むには、インサイトサマリーカードの右上隅にカーソルを合わせます。2 つのアイコンが表示されます。ツールチップ Filter on Insight が表示された逆三角形のアイコンをクリックします。ページが更新され、そのインサイトに対応するエントリーのリストが表示されます。

サイドパネル

View all をクリックするとパネルが展開されます。右側からサイドパネルが開き、Watchdog Insights の垂直リストが表示されます。各エントリには詳細表示があり、サマリーカードより多くの情報が表示されます。

ログエクスプローラー内の Watchdog Insights のサイドパネル表示。上部のエリアには、時間の経過に伴うエラーステータスの棒グラフが表示されます。「新しいエラーログが service:web-store で検出されました」というタイトルの Log Anomaly カードが1枚表示されています

詳細ビュー

インサイトの詳細を表示するには、個々のカードをクリックします。右からフルサイドパネルが開きます。

Watchdog Insights のフルサイドパネルビュー、タイトルは「service:product-recommendation でロック圧が高くなっています」

ワンクリックでインサイトを共有するには、フルサイドパネルの Copy Link ボタンをクリックします。クリップボードにインサイトを生成したクエリが入力されます。

Watchdog Insights の確認

Watchdog Insights は、インフラストラクチャーAPMログ管理RUM の 4 つの製品領域でご覧いただけます。

インフラストラクチャー

ライブコンテナ

Watchdog Insights は、Live Containers の Kubernetes Explorer タブに表示されます。

  1. 左側のナビゲーションで、Infrastructure にカーソルを合わせます。
  2. Kubernetes をクリックします。
  3. ページ上部の Explorer タブを選択します。
  4. Select Resources ボックスで、Kubernetes リソースタイプのいずれかを選択します。
  5. Kubernetes リソースのリストが表示され、Watchdog Insights パネルが上部に表示されます。

ライブプロセス

Watchdog Insights はライブプロセスに表示されます。

  1. 左側のナビゲーションで、Infrastructure にカーソルを合わせます。
  2. Processes をクリックします。

プロセスおよび関連データのリストが表示され、Watchdog Insights パネルが上部に表示されます。

サーバーレス

サーバーレスインフラストラクチャーに対して、Watchdog は以下のようなインサイトを提示します。

  • Cold Start Ratio Up/Down
  • Error Invocation Ratio Up/Down
  • Memory Usage Up/Down
  • OOM Ratio Up/Down
  • Estimated Cost Up/Down
  • Init Duration Up/Down
  • Runtime Duration Up/Down

APM

Watchdog Insights は APM 内のいくつかのページに表示されます。

ログ管理

ログ管理 UI で Watchdog Insights を見つけるには、次の手順を実行します。

  1. 左側のナビゲーションで、Logs にカーソルを合わせます。
  2. Search をクリックします。

画面の真ん中、ログの上にピンクの Watchdog Insights バナーが表示されます。

詳しくは、Watchdog Insights for Logs を参照してください。

RUM

RUM UI で Watchdog Insights を見つけるには、次の手順を実行します。

  1. 左側のナビゲーションで、UX Monitoring にカーソルを合わせます。
  2. Sessions & Replays をクリックします。
  3. ページの上部にある In ドロップダウンには、Sessions レベルにいることが表示されています。ドロップダウンオプションを Views に変更します。

画面の真ん中、ビューの上にピンクの Watchdog Insights バナーが表示されます。

詳しくは、Watchdog Insights for RUM を参照してください。

その他の参考資料