インシデント管理分析

概要

Incident Management Analytics は、インシデントの統計情報を集計したクエリ可能なデータソースです。ダッシュボードノートブックの両方で、さまざまなグラフウィジェットでこれらの分析結果をクエリし、インシデント対応の履歴を時系列で分析することができます。Datadog では、インシデント管理の概要を示す Dashboard テンプレートNotebook テンプレートを提供しており、必要に応じて複製してカスタマイズすることができます。

以下のウィジェットは、Incident Management Analytics をサポートしています。

  • Timeseries
  • トップリスト
  • クエリ値

メジャー

Datadog は、分析クエリを形成するために、以下のすぐに使える集計メジャーを提供します。

  1. カウント (*)
  2. 顧客への影響期間
  3. ステータスアクティブ期間 (インシデントが Active ステータスであった時間)
  4. ステータス安定期間 (インシデントが Stable ステータスであった時間)
  5. 修復までの時間 (顧客影響終了タイムスタンプ - インシデント作成タイムスタンプ)
  6. 解決までの時間 (解決されたタイムスタンプ - 作成されたタイムスタンプ)

これらのデフォルトに加えて、インシデント設定でカスタムの Number プロパティフィールドを追加することで、新しいメジャーを作成することができます。

グラフコンフィギュレーション

Incident Management Analytics のデータを使用してグラフを構成するには、次の手順に従います。

  1. 視覚化に使用するウィジェットを選択します
  2. データソースのドロップダウンメニューから Incidents を選択します。
  3. 黄色のドロップダウンメニューからメジャーを選択します。
    • Default Statistic: インシデントの数を数えます。
  4. メジャーの集計を選択します。
  5. (オプション) メジャーのロールアップを選択します。
  6. (オプション) 検索バーを使用して、インシデントの特定のサブセットに統計をフィルタリングします。
  7. (オプション) ピンクのドロップダウンメニューでファセットを選択してメジャーをグループごとに分割し、表示するグループの数を制限します。
  8. グラフのタイトルを決めます
  9. ウィジェットを保存します。

例: サービスごとの毎週の停止の顧客への影響期間

  1. ウィジェット: 時系列折れ線グラフ
  2. データソース: Incidents
  3. メジャー: Customer Impact Duration
  4. 集計: avg
  5. ロールアップ: 1w
  6. フィルター: severity:("SEV-1" OR "SEV-2")
  7. グループ: Services, limit to top 5
インシデント分析のクエリ例