- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
インシデント設定を使用して、組織全体のインシデント管理エクスペリエンスのさまざまな面をカスタマイズすることができます。個々の設定は、さまざまなサブセクションに分類され、分割されています。主なカテゴリは、General、Notifications、Remediation です。
インシデント設定の General サブセクションは、組織の深刻度レベルとステータスレベルを定義し、インシデントヘルパーテキストを宣言するために使用します。
重大度レベルの設定を使用して次のことを行います。
SEV-0
または SEV-1
として定義します (デフォルトは SEV-1
です)。注: 通知ルールで参照されている重大度を削除しようとすると、その決定を確認するプロンプトが表示されます。続行を選択すると、影響を受ける通知ルールは無効となります。重大度の削除または開始重大度の変更によって、Incident Management Analytics のクエリが自動的に更新されることはありません。
ステータスレベルの設定を使用して次のことを行います。
Completed
ステータスを有効にするかどうかを選択します。注: Completed
ステータスを削除しても、すでに Completed
ステータスになっているインシデントは自動的に更新されず、またそれを明示的に参照している Incident Management Analytics クエリも自動的に更新されません。また、Completed
ステータスを参照している通知ルールは、そのルールが無効となるため、無効になります。
Declare Incident Helper Text 設定では、インシデント作成モーダルで重大度とステータスレベルの説明と一緒に表示されるヘルパーテキストをカスタマイズできます。ヘルパー テキストは Markdown をサポートしており、インデント リスト、テキスト フォーマット、およびインシデント対応者のための他の指示リソースへのハイパーリンクを使用できます。
プロパティフィールドは、インシデントにタグを付けることができるメタデータの主要な部分です。これにより、Homepage でインシデントの特定のサブセットを検索したり、Incident Management Analytics でより堅牢なクエリを作成したりすることが容易になります。デフォルトのプロパティフィールドは 5 つあります。
Root Cause
Services
Teams
Detection Method
Summary
Datadog APM を設定している場合、Services
プロパティフィールドは自動的に APM サービス名を利用します。Services
の値を編集するには、それぞれのフィールドに関連付けたい値を CSV でアップロードしてください。CSV ファイルの先頭行にはフィールド名を、そのすぐ下には希望する値をリストアップしてください。
Teams
プロパティフィールドは、組織で定義されたチームから自動的に入力されます。
既存の key:value
ペアメトリクスタグのいずれかを選択することで、設定にプロパティフィールドを追加することができます。このとき、プロパティフィールドのキーは、メトリクスタグのキーの開始ケース (各単語は大文字で、スペースで区切られます) となり、プロパティフィールドの値は、メトリクスタグが報告する値と同じになります。
プロパティフィールドは、インシデント詳細ページの概要セクションに表示されるフィールドに対応する 3 つのテーブルに整理されています。
What Happened
Why It Happened
Attributes
ドラッグハンドルのアイコンを使ってフィールドをドラッグアンドドロップすることで、任意のプロパティフィールドを別のテーブルに移動したり、同じテーブル内で並び替えたりすることができます。右上の Preview ボタンをクリックすると、プロパティフィールドがどのように見えるかをプレビューできます。
5 つのデフォルトフィールドとメトリクスタグに基づくフィールドに加えて、カスタムプロパティフィールドを作成し、インシデントの作成時に必須としてマークすることができます。作成できるカスタムフィールドは 4 種類あります。
Single-Select、Multi-Select、Number カスタムフィールドは、インシデントを簡単にフィルタリングするために、Incident Homepage と Incident Management Analytics で検索できるファセットとなります。Number フィールドは、ダッシュボードとノートブックでグラフ化および可視化できる Incident Management Analytics のメジャーです。
対応者タイプの設定では、インシデント対応者に割り当てるカスタムロールを作成し、そのロールがインシデントごとに 1 人または複数人によって保持されることを意図しているかどうかを指定する機能を提供します。このロールは、ロールベースアクセス制御 (RBAC) システムとは無関係です。対応者タイプは、対応者が、独自のインシデント対応プロセスの定義に基づいて、インシデントでどのような責任を負うかを理解することを可能にします。デフォルトでは、2 つのロールがあります。
Incident Commander
- 対応チームのリーダーを務める責任者Responder
- インシデントの調査やその根本的な問題の解決に積極的に貢献している人注: Incident Commander
対応者タイプは、インシデント設定に表示され、その説明をカスタマイズすることができます。Incident Commander
は対応者タイプとして削除することはできませんし、One person role
としての名前やステータスを変更することもできません。Responder
のロールは、対応者に別のロールが割り当てられていない場合の一般的な予備的ロールであり、インシデント設定に表示されるものではありません。
カスタム対応者タイプを作成するには
One person role
か Multi person role
かを選択します。One person role
はインシデントごとに 1 人が持つことができ、Multi person role
はインシデントごとに無制限に持つことができます。インテグレーション設定は、Datadog Slack アプリのインシデント管理機能を設定するための追加設定を提供します。構成するための設定は 2 つあります。
いずれの設定も、組織の Slack インテグレーションタイルで設定した任意の Slack ワークスペースを使用するように設定できます。
デフォルトでは、インシデント専用チャンネルは incident-{public_id}
を名前テンプレートとして使用します。
incident
のプレフィックスは、小文字のアルファベット、数字、ダッシュからなる任意の文字列に変更することができます。Datadog では、Slack のチャンネル名には 80 文字の制限があるため、プレフィックスを短くすることを推奨しています。{public_id}
以外に、 {date_created}
と {title}
をチャンネル名のテンプレートに変数として追加することができます。
注:
{public_id}
のチェックを外した場合、2 つのインシデントでチャンネル名が重複する可能性があります。この場合、Datadog Slack アプリは自動的にチャンネル名の末尾にランダムな小文字または数字を付加し、チャンネル作成プロセスが失敗することを防ぎます。{title}
をチェックすると、インシデントのタイトルが変更された場合、Datadog Slack アプリが自動的にチャンネル名を変更します。インシデント更新チャンネルは、インシデントが宣言されたり、ステータス、重大度、インシデントコマンダーが変更されるたびに、メッセージを送信します。
メッセージテンプレートは、動的で再利用可能なメッセージであり、手動インシデント通知や自動通知ルールで使用することができます。メッセージテンプレートは {{incident.severity}}
のようなテンプレート変数を利用して、通知が送信されるインシデントから対応する値を動的に注入します。メッセージテンプレートは Markdown をサポートしており、インシデント通知にはテキストフォーマット、テーブル、インデントリスト、ハイパーリンクを含めることができます。多数のメッセージテンプレートをよりよく整理するために、各テンプレートは、作成プロセスでカテゴリを必要とします。
メッセージテンプレートを作成するには
注: メッセージのタイトルと本文の両方でテンプレート変数がサポートされています。
通知ルールを使用すると、インシデントについて特定のステークホルダーが自動的に通知されるシナリオを構成することができます。通知ルールにより、重要なステークホルダーに優先度の高いインシデントを知らせたり、新規インシデントが宣言または更新されたことを外部システムに知らせたり、特定のサービスやチームがインシデントを経験した場合、特定のレスポンダに通知したりすることが可能になります。
例: service:web-store
および application:purchasing
に対して SEV-1 または SEV-2 のインシデントが宣言されたとき、およびそのインシデントが別のステータスに移行したときにチームのステークホルダーに自動通知する通知ルールを設定します。
新しい通知ルールを構成するには
key:value
のペアを選択します。デフォルトでは、これらのフィルターは空であり、通知ルールはあらゆるインシデントに対してトリガーされます。通知ルールを管理するために、次の操作を行うことができます。
Postmortem テンプレートは、動的で再利用可能なテンプレートで、インシデントが解決された後にインシデント情報が自動的に入力される Datadog ノートブックを作成するために使用されます。Postmortem テンプレートは、{{incident.severity}}
のようなテンプレート変数を利用して、Postmortem が作成されているインシデントから対応する値を動的に注入します。Postmortem テンプレートは Markdown をサポートしており、結果のノートブックにテキストフォーマット、テーブル、インデントされたリスト、ハイパーリンクが含まれます。
Postmortem テンプレートを作成するには