インシデント詳細ページ

Datadog サイトでは、Incident Management はご利用いただけません。

Datadogのすべてのインシデントには、インシデントのプロパティフィールド、シグナル、タスク、ドキュメント、レスポンダー、および通知を管理できる、独自のインシデント詳細ページがあります。インシデント詳細ページは、新しいインシデントを作成した後に利用できます。インシデント詳細ページには、主要なアクションにすばやくアクセスできるグローバルヘッダーがあり、ページの残りの部分は、タブを使用して関連するインシデントデータをグループ化する異なるセクションに分かれています。これらのセクションの最初は概要です。

グローバルヘッダー

インシデントグローバルヘッダー

グローバルヘッダーは、Status and Severity セレクターへのアクセス、および Incident Integrations へのリンクを提供します。インシデントを解決済ステータスに移動すると、ヘッダーにポストモーテムテンプレートを使用してポストモーテムノートブックを生成するオプションが表示されます。インシデント設定でポストモーテムテンプレートを構成し、ポストモーテムの構造とコンテンツを事前に定義します。

概要セクション

インシデント概要セクション

インシデントのプロパティを指定し、顧客への影響を定義するには、概要セクションを使用します。

デフォルトでは、すべてのインシデントが以下のプロパティを持ちます。

  • 根本原因
  • サービス
  • チーム
  • 検出方法
  • サマリー

プロパティは以下の 3 つのセクションに分かれています。

  • 何が起こったのか
  • なぜそうなったのか
  • 属性

インシデント設定では、Datadog のメトリクスタグから <KEY>:<VALUE> のペアを使用して追加のプロパティフィールドを追加したり、カスタムフィールドを作成したりします。インシデントのプロパティに値を割り当てると、インシデントホームページでインシデントのサブセットを簡単に検索したり、インシデント管理分析を使用してクエリを形成することができます。また、プロパティフィールドを並べ替えたり、異なる見出しに移動したりすることで、最も重要なプロパティを目立つ場所に配置することができます。

インシデントが顧客向けである場合、影響セクションで詳細を指定します。

  1. Add をクリックします。
  2. 影響の開始日時を指定します。
  3. 影響の終了日時を指定するか、影響がまだ進行中の場合は空白にします。
  4. 顧客への影響の性質を Scope of impact (影響の範囲) に記述します。
  5. Save をクリックします。

プロパティフィールドを収容するだけでなく、概要セクションには、以下のような一目でわかるサマリーモジュールが用意されています。

  1. Condensed Timeline: インシデントの状態が変化した時間、影響が開始された時間、影響が終了した時間を表示し、インシデントのライフサイクルの概要を表示します。
  2. Latest Notifications: インシデントに対して送信された最新の通知が表示され、通知セクションの通知の全リストに素早くアクセスできます。
  3. Pending Tasks: 直近の未完了タスクを表示し、修復セクションのタスクの全リストに素早くアクセスできます。
  4. Responders: 現在のインシデントコマンダーと、インシデントに割り当てられた残りのレスポンダーのアバターが表示されます。
  5. Recent timeline entries: インシデントタイムラインの最新の 5 つのエントリを表示し、タイムラインセクション全体を見るためのクイックアクセスを提供します。

タイムラインセクション

インシデントタイムライン

インシデントタイムラインは、インシデント中に行われた作業に関する主要な情報源です。アクションが実行されると、新しいセルが時系列にタイムラインに追加され、変更内容、変更者、変更時刻が記録されます。

コンテンツタイプ

各セルには、そのセルが含む情報の種類を示すコンテンツタイプがあります。

コンテンツタイプ説明
レスポンダーノートインシデント対応者が手書きしたメモ。レスポンダーノートには次のサブタイプがあります。:
- グラフ: レスポンダーノートには、1 つ以上の Datadog のグラフが含まれます
- リンク: レスポンダーノートにはハイパーリンクが含まれています
- コード: レスポンダーノートには、コードブロックのための Markdown 構文でラップされたテキストが含まれています
インシデントアップデートインシデントのプロパティ (ステータスや深刻度を含む) またはその影響に加えられたすべての変更。
インテグレーションアップデートインシデント管理製品のインテグレーションを通して行われたすべての変更。
タスクインシデントの詳細ページの修復セクションにあるインシデントタスクに加えられたすべての変更。
通知送信インシデントレスポンダーから手動で通知が送信された場合のアップデート。

インシデント詳細ページの異なるセクションを切り替えるためのタブのすぐ下にあるテキストボックスを使って、タイムラインに直接レスポンダーノートを追加します。作成時にレスポンダーノートのタイムスタンプをカスタマイズして、タイムラインの時系列で以前の時点に関連した重要な情報を取り込むことができます。自分が作成したレスポンダーノートについては、内容やタイムスタンプを編集したり、ノートを完全に削除したりすることができます。また、リンクを特定のセルにコピーして、チームメイトと共有することもできます。レスポンダーノートは、Slack からタイムラインに追加することができます。

グラフセルについては、組織設定でグラフの共有 URL を有効にすると、グラフの定義が保存されます。グラフセルがタイムラインに追加されると、ダッシュボード、ノートブック、その他のページで見られるような完全なインタラクティブホーバーの状態が表示されます。タイムラインに追加されてから 24 時間経過すると、グラフは、グラフが表示していたものをキャプチャした静止画像に置き換えられます。これは、短いリテンションデータを表示しているグラフが、グラフ内のライブデータの有効期限が切れた後でも、バックアップ画像をキャプチャできるようにするためのものです。

デフォルトでは、タイムラインのセルは「古い順」にソートされますが、タイムラインの上部にあるボタンを使って「新しい順」に変更することができます。

修復セクション

インシデント修復セクション

修復セクションは、インシデントの修復プロセスに関連するドキュメントやリソースを保存し、修復プロセスの主要なタスクを追跡するために使用します。

ドキュメントは、ドキュメントの URL を貼り付けて追加することができ、リンクには素早くアクセスできるように人間が読みやすい名前を付けることができます。

インシデントタスクは、修復セクションで直接作成されるほか、Datadog の Slack インテグレーションを通して作成されます。

修復セクションから、作成テキストボックスにタスクの説明を入力します。Datadog ユーザーにタスクを割り当てるには、説明テキストボックスに @ と入力するか、タスクの作成後に Assignees 列を使用します。インシデントタスクは、複数の担当者を持つことができます。タスクを作成した後、期限を割り当てることもできます。

異なるタスクの作業が終了すると、タスクの説明の左側にあるチェックボックスをクリックして、個々のタスクに完了の印をつけることができます。タスクの数が多い場合は、キーワード検索で絞り込んだり、完了したタスクを非表示にしたりすることも可能です。

レスポンダーセクション

本機能は公開ベータ版です。
インシデントレスポンダー

レスポンダーセクションでは、他のユーザーを追加し、インシデントの解決プロセスで実行するロールを割り当てることで、対応チームを編成することができます。Datadog が提供するデフォルトのロールは以下の 3 つです。

  1. Incident Commander - 対応チームのリーダーを務める責任者
  2. Communications Lead - インシデントのライフサイクルを通じてステークホルダーとのコミュニケーションを管理する責任者
  3. Responder - インシデントの調査やその根本的な問題の解決に積極的に貢献している人

注: インシデント発生中、Incident Commander は常に一人でなければなりません。もしインシデントの対応者が一人しかいない場合、この人物に自動的に Incident Commander のロールが割り当てられます。インシデントで Communications Lead または Responder のロールを割り当てられた個人の数に制限はありません。

他の個人を対応者として追加すると、その人の Datadog アカウントに関連付けられたメールを通じて通知されます。対応者のロールは誰でも変更できますが、インシデントの対応者リストから個人を削除できるのは、その個人が一般的な Responder のロールを持ち、インシデントで何の活動も行っていない場合のみです。インシデントにすでに Incident Commander が割り当てられている場合、Incident Commander ロールを別の個人に割り当てると、そのロールはその個人に引き継がれます。以前の Incident CommanderResponder のロールに再割り当てされます。

対応者リストには、インシデントの対応チームに追加された日付と時間、およびインシデントタイムラインに最後に何かを投稿した日付と時間が保存されます。

通知セクション

インシデント通知

インシデントに対するすべてのステークホルダーからの通知は、通知セクションに集約されます。 このページから直接、通知を手動で作成、下書きとして保存、送信することができます。当該インシデントの通知ルールによって送信された自動通知も、このセクションにリストされます。

手動で通知を作成するには

  1. セクションの右上にある + New Notification ボタンをクリックします。
  2. 希望する受信者を入力します。メール、Slack チャンネル、PagerDuty ハンドル、Webhook など、Datadog がサポートする通知ハンドルであれば、どれでもかまいません。
  3. メッセージテンプレートを選択します。
  4. Markdown とサポートされているインシデントテンプレート変数を使用して、必要に応じて通知のタイトルとメッセージを編集し、{{ と入力します。
    • テンプレート変数は、インシデントのプロパティに基づきます。メッセージが送信される前に、すべてのテンプレート変数は、メッセージが送信されたときに利用可能な参照プロパティの対応する値で置き換えられます。
  5. 通知を送信するか、下書きとして保存します。

通知セクションは、下書きリストと送信済みリストに分かれています。

両方のリストに以下が表示されます。

  1. 通知の (意図された) 受信者
  2. 通知のメッセージの内容、および送信された再通知メッセージ
  3. 通知が最後にいつ更新されたか
  4. 通知の元の作成者

送信済みリストには、通知が通知ルールによって手動で送信されたのか、自動的に送信されたのかも表示されます。通知が自動送信された場合、通知のトリガーとなったルールが表示されます。

はじめに

Incident Management 入門ガイドのワークフロー例を実行してください。

その他の参考資料

お役に立つドキュメント、リンクや記事: