Datadog WatchdogTM

Watchdog Alerts ページには、エラーログの進行中のログ異常アラートが 1 つ、エラーログの解決済みログ異常アラートが 1 つ、根本原因分析によって解決されたエラーレートアラートが 1 つ表示されています

概要

Watchdog は、アプリケーションやインフラストラクチャーの潜在的な問題を自動的に検出する APM パファーマンス、インフラストラクチャーメトリクス、およびログのアルゴリズム機能です。Watchdog は以下の傾向やパターンを監視します。異常検知やダッシュボードを起動するのと同様の季節アルゴリズムを活用します。Watchdog は以下の傾向やパターンを監視します。

Watchdog は、ヒット率が突然急上昇するなど、メトリクスに不規則性がないかを調べます。各不規則性に対して、Watchdog ページは Watchdog アラートを表示します。各アラートには、検出されたメトリクスの不規則性のグラフが含まれ、関連する時間枠とエンドポイントまたはエンドポイントに関する詳細な情報を提供します。Watchdog は、Datadog Agent またはインテグレーションによって送信されたデータを自動的に監視します。

メトリクス、ログ、その他のデータの新しいソースに対して、Watchdog は予想される動作のベースラインを確立するために 2 週間のデータを要求します。2 週間未満のデータに基づいて Watchdog が検出した異常には、不正確なものが含まれている可能性があります。

サービスカタログの Watchdog

Watchdog が APM メトリクスに異常を検出すると、APM サービスカタログの影響を受けるサービスの横にピンクの Watchdog 双眼鏡アイコンが表示されます。

サービスカタログの画面、5 つのサービスが表示されています。Web ストアのサービス名の後にピンクの双眼鏡のアイコンがついています。

サービスページに移動して、メトリクス異常の詳細を見ることができます。ページの上部には、Watchdog Insights ボックスがあります。Watchdog Insights を使用すると、エラー率やレイテンシーの上昇など、異常な動作に関連するタグ値を発見することができます。

Watchdog のアイコンは、メトリクスグラフにも表示されます。

サービスのレイテンシー (秒) をY軸に、時間帯を X 軸にとったグラフ。グラフ全体がピンク色で表示され、上部に「May 2: 13:31 Ongoing」と表示されている

双眼鏡のアイコンをクリックすると、詳細が書かれた Watchdog アラートのカードが表示されます。

トラブルシューティング

ご不明な点は Datadog サポートまでお問い合わせください。

その他の参考資料