- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
Datadog のすべてのインシデントには、インシデントのプロパティフィールド、シグナル、タスク、ドキュメント、対応者、および通知を管理できる、独自のインシデント詳細ページがあります。インシデント詳細ページは、新しいインシデントを作成した後に利用できます。インシデント詳細ページには、主要なアクションにすばやくアクセスできるグローバルヘッダーがあり、ページの残りの部分は、タブを使用して関連するインシデントデータをグループ化する異なるセクションに分かれています。これらのセクションの最初は概要です。
グローバルヘッダーは、Status and Severity セレクターへのアクセス、および Incident Integrations へのリンクを提供します。インシデントを解決済ステータスに移動すると、ヘッダーにポストモーテムテンプレートを使用してポストモーテムノートブックを生成するオプションが表示されます。インシデント設定でポストモーテムテンプレートを構成し、ポストモーテムの構造とコンテンツを事前に定義します。
インシデントのプロパティを指定し、顧客への影響を定義するには、概要セクションを使用します。
デフォルトでは、すべてのインシデントが以下のプロパティを持ちます。
プロパティは以下の 3 つのセクションに分かれています。
インシデント設定では、Datadog のメトリクスタグから <KEY>:<VALUE>
のペアを使用して追加のプロパティフィールドを追加したり、カスタムフィールドを作成したりします。インシデントのプロパティに値を割り当てると、インシデントホームページでインシデントのサブセットを簡単に検索したり、インシデント管理分析を使用してクエリを形成することができます。また、プロパティフィールドを並べ替えたり、異なる見出しに移動したりすることで、最も重要なプロパティを目立つ場所に配置することができます。
インシデントが顧客向けである場合、影響セクションで詳細を指定します。
Scope of impact
(影響の範囲) に記述します。プロパティフィールドを収容するだけでなく、概要セクションには、以下のような一目でわかるサマリーモジュールが用意されています。
インシデントタイムラインは、インシデント中に行われた作業に関する主要な情報源です。アクションが実行されると、新しいセルが時系列にタイムラインに追加され、変更内容、変更者、変更時刻が記録されます。
各セルには、そのセルが含む情報の種類を示すコンテンツタイプがあります。
コンテンツタイプ | 説明 |
---|---|
対応者ノート | インシデント対応者が手書きしたメモ。対応者ノートには次のサブタイプがあります。: - グラフ: 対応者ノートには、1 つ以上の Datadog のグラフが含まれます - リンク: 対応者ノートにはハイパーリンクが含まれています - コード: 対応者ノートには、コードブロックのための Markdown 構文でラップされたテキストが含まれています |
インシデントアップデート | インシデントのプロパティ (ステータスや深刻度を含む) またはその影響に加えられたすべての変更。 |
インテグレーションアップデート | インシデント管理製品のインテグレーションを通して行われたすべての変更。 |
タスク | インシデントの詳細ページの修復セクションにあるインシデントタスクに加えられたすべての変更。 |
通知送信 | インシデント対応者から手動で通知が送信された場合のアップデート。 |
インシデント詳細ページの異なるセクションを切り替えるためのタブのすぐ下にあるテキストボックスを使って、タイムラインに直接対応者ノートを追加します。作成時に対応者ノートのタイムスタンプをカスタマイズして、タイムラインの時系列で以前の時点に関連した重要な情報を取り込むことができます。自分が作成した対応者ノートについては、内容やタイムスタンプを編集したり、ノートを完全に削除したりすることができます。また、リンクを特定のセルにコピーして、チームメイトと共有することもできます。対応者ノートは、Slack からタイムラインに追加することができます。
グラフセルについては、組織設定でグラフの共有 URL を有効にすると、グラフの定義が保存されます。グラフセルがタイムラインに追加されると、ダッシュボード、ノートブック、その他のページで見られるような完全なインタラクティブホーバーの状態が表示されます。タイムラインに追加されてから 24 時間経過すると、グラフは、グラフが表示していたものをキャプチャした静止画像に置き換えられます。これは、短いリテンションデータを表示しているグラフが、グラフ内のライブデータの有効期限が切れた後でも、バックアップ画像をキャプチャできるようにするためのものです。
デフォルトでは、タイムラインのセルは「古い順」にソートされますが、タイムラインの上部にあるボタンを使って「新しい順」に変更することができます。
修復セクションは、インシデントの修復プロセスに関連するドキュメントやリソースを保存し、修復プロセスの主要なタスクを追跡するために使用します。
ドキュメントは、ドキュメントの URL を貼り付けて追加することができ、リンクには素早くアクセスできるように人間が読みやすい名前を付けることができます。
インシデントタスクは、修復セクションで直接作成されるほか、Datadog の Slack インテグレーションを通して作成されます。
修復セクションから、作成テキストボックスにタスクの説明を入力します。Datadog ユーザーにタスクを割り当てるには、説明テキストボックスに @
と入力するか、タスクの作成後に Assignees
列を使用します。インシデントタスクは、複数の担当者を持つことができます。タスクを作成した後、期限を割り当てることもできます。
異なるタスクの作業が終了すると、タスクの説明の左側にあるチェックボックスをクリックして、個々のタスクに完了の印をつけることができます。タスクの数が多い場合は、キーワード検索で絞り込んだり、完了したタスクを非表示にしたりすることも可能です。
対応チームセクションでは、他のユーザーを追加し、インシデントの解決プロセスで実行するロールを割り当てることで、対応チームを編成することができます。Datadog が提供するデフォルトの対応者タイプは以下の 2 つです。
Incident Commander
- 対応チームのリーダーを務める責任者Responder
- インシデントの調査やその根本的な問題の解決に積極的に貢献している人カスタムの対応者ロールを作成したい場合は、Incident Settings の Responder Types で行うことができます。これにより、カスタムの名前と説明で新しい対応者タイプを作成できます。また、対応者タイプが one person role か multi person role かを選択することも可能です。
注: これらのロールは、ロールベースのアクセス制御 (RBAC) システムにおけるロールとは無関係です。RBAC のロールは、Datadog の特定の機能に対するユーザーのアクセス許可を制御します。インシデント管理における対応者タイプシステムは、いかなる点においてもユーザーのアクセス許可を変更するものではありません。それよりも、対応者をインシデントに招待し、対応プロセスにおいて文書化されたロールを付与することで可視性を高めることが目的です。
個人を対応者として追加すると、その人の Datadog アカウントに関連付けられたメールを通じて通知されます。対応者のロールは誰でも変更できますが、インシデントの対応チームから個人を削除できるのは、その個人が一般的な Responder
のロールを持ち、インシデントで何の活動も行っていない場合のみです。インシデントにすでに Incident Commander
が割り当てられている場合、別の個人を Incident Commander
に指定すると、そのロールはその個人に引き継がれます。以前の Incident Commander
には Responder
のロールが再割り当てされます。カスタムの one person role を再割り当てした場合も、必ず同様の再割り当てが発生します。
対応チームリストには、個人が最初にインシデントの対応チームに追加された日付と時間、およびその個人がインシデントタイムラインに最後に何かを投稿した日付と時間も保存されます。
インシデントに対するすべてのステークホルダーからの通知は、通知セクションに集約されます。 このページから直接、通知を手動で作成、下書きとして保存、送信することができます。当該インシデントの通知ルールによって送信された自動通知も、このセクションにリストされます。
手動で通知を作成するには
{{
と入力します。通知セクションは、下書きリストと送信済みリストに分かれています。
両方のリストに以下が表示されます。
送信済みリストには、通知が通知ルールによって手動で送信されたのか、自動的に送信されたのかも表示されます。通知が自動送信された場合、通知のトリガーとなったルールが表示されます。
Incident Management 入門ガイドのワークフロー例を実行してください。
お役に立つドキュメント、リンクや記事: