トリアージと通知

イベントのサイドパネルが表示されたケース詳細ページ。ケースから相関されたイベントを調査し、関連メトリクスを分析する

Event Management は、関連するイベントを相関付けして自動的に単一のケースにまとめます。関連ログ、関連メトリクス、アラートモニターなど、関連情報をすべて取り込み、1 つの場所でインシデントをトリアージ (振り分けと優先度付け) し、トラブルシュートを行うことができます。

Correlation ページから、分析したいパターンを探し、同じ行の末尾にある Triage Cases をクリックします。あるいは、ページ上部の Case Management をクリックすると、Case Management で相関されたイベントが含まれるすべてのケースを表示できます。Datadog は関連するメトリクスやログを取り込み、関連データを一元的に利用しながら問題をトラブルシュートできるようにします。

Event Management Case

ケースの詳細ページ - 概要
機能説明
優先度相関されたアラートの中で最も高い優先度
属性相関されたイベントからのタグ。ユーザーによる更新はエンジンにより上書きされません
ステータスシステムによって自動的に管理されます。ユーザーによるステータス更新はシステムによって上書きされます。すべての元となるアラートが復旧するとケースは自動的に解決され、最大アライブ時間 (生存期間) 内にアラートが再度トリガーされると自動的に再オープンされます。
Deletionアラートのチェックボックスを選択して、不要なアラートを削除できます。削除されたアラートは再度相関されることはありません
Enriched Alerts一部のケースでは、Datadog がインフラストラクチャー情報に基づき関連していると判断したインテリジェントアラートが自動的に追加されます。これらのアラートはケースの属性、優先度、ステータスには影響しません

ケース管理における操作の詳細については、Case Management のドキュメントを参照してください。

調査

  1. ケースの Overview (概要) 画面で、Investigation をクリックします。
  2. Correlations セクションでは、アラートとイベントの一覧を確認できます。
  3. 任意のアラートまたはイベントをクリックすると、アラートの文脈で関連するメトリクスやログをすべて参照できます。
  4. (オプション) ケースに関連しないアラートやイベントを削除したい場合は選択して除外します。
  5. Related Metrics セクションでは、すべての関連メトリクスを比較したり、タグでグループ化したりできます。

通知またはチケットの作成

相関されたイベントを利用すると、グループごとに 1 つの通知を設定できます。そのため、20 件の通知と 20 件の潜在的なインシデントを調査する代わりに、単一のケースと 1 件の通知ですべてをまとめて管理できます。Case Management のプロジェクトページでアラートを一括して扱うことが可能です。Case Management で通知をグルーピングする方法はいくつかあります。

チケット発行

Project Settings ページで、プロジェクトが通知を送信する先のインテグレーションを設定します。Datadog は以下のインテグレーションをサポートしており、手動・自動でのチケット作成と双方向同期が可能です。

  • ServiceNow
  • Jira

設定方法の詳細については、Case Management Settings のドキュメントを参照してください。

通知

ケース管理では、views (ビュー) を使って構成されたクエリに基づきケースをグループ化できます。特定のクエリにマッチするケースが作成された際に通知を行うよう設定できます。Datadog は PagerdutyEmailWebhookMicrosoft TeamsSlack に対応しています。ビューの作成方法については Case Management Views のドキュメントを参照してください。

: 重複する通知を削除するには、ベースとなるモニターを再設定する必要があります。モニターイベントをグルーピングしても、個別の通知がミュート (抑制) されるわけではありません。