モニターステータス

概要

モニターの作成後、モニターのステータスページを使用して、経時的なステータスを表示します。

モニターステータスページ

ヘッダー

ヘッダーには、モニターのステータス、ステータスの時間、モニターのタイトルが含まれます。右側には、MuteResolve、設定歯車ボタンがあります。

ミュート

ミュートボタンを使用してモニター全体をミュートするか、スコープ を設定して部分的にミュートします。使用できるスコープは、モニターのグループタグに基づきます。複数のスコープまたはモニターを同時にミュートする方法の詳細については、ダウンタイムを参照してください。

: UI を使用してモニターをミュートまたはミュート解除すると、そのモニターに関連付けられているすべてのスケジュールされたダウンタイムが削除されます。

解決

モニターがアラート状態の場合、Resolve ボタンが表示されます。このボタンを使用して、モニターを手動で解決します。

モニターの resolve 機能を使用すると、次回のモニター評価に備えて、モニターのステータスを意図的に OK に切り替えることができます。通常は、モニターの元データに基づいて、次のモニター評価が実行されます。

現在のデータが ALERT 状態であるためにモニターでアラートが発生した場合は、resolve によってモニターの状態が ALERT -> OK -> ALERT の順に切り替わります。このため、アラートを確認したり、Datadog にアラートを無視させたりするために resolve を使用するのは不適切です。

データが断続的に報告される場合は、手動でモニターを解決しても問題ありません。たとえば、アラートがトリガーされると、モニターはデータを受信しなくなります。このため、モニターはアラートの条件を評価することや、OK の状態に回復することができなくなります。このような場合は、resolve 機能、またはタイマーにより自動的に解決する Automatically resolve monitor after X hours 機能を使用することで、モニターを OK の状態に戻すことができます。

一般的な使用例: エラーがない場合には生成されないエラーメトリクスに基づいたモニター (aws.elb.httpcode_elb_5xx、コード内に置かれて_エラーがある場合にのみ_エラーを報告する DogStatsD カウンター)

インシデントを作成

Declare incident を選択して、モニターからインシデントを作成します。重大度レベル、通知、および追加のメモを含む Declare Incident ポップアップモーダル を構成します。詳細については、インシデント管理のドキュメントを参照してください。

設定

設定歯車をクリックして、使用可能なオプションを表示します。

オプション説明
編集現在のモニターを編集します。モニターの構成セクションの詳細を参照してください。
Clone現在のモニターのコピーを作成します。
エクスポート現在のモニターの JSON 構成をエクスポートします。このオプションは、モニターの作成時でも使用できます。プログラムでモニターを管理する場合は、UI でモニターを定義し、JSON をエクスポートします。
削除現在のモニターを削除します。削除の確認を求められます。

プロパティ

プロパティセクションは、モニターの概要です。

プロパティ説明
ステータスアラート、警告、データなし、または OK
タイプモニターの種類の詳細をご覧ください。
IDモニター API に使用されます。
Date createdモニターが作成された日付。
Authorモニターを作成した人。
タグモニターレベルでアタッチされたタグ。鉛筆アイコンをクリックしてタグを編集します。
クエリクエリの詳細をご覧ください。
メッセージモニターの通知セクションで指定されたメッセージ。

ステータスと履歴

ステータスと履歴セクションには、モニターのクエリと状態の経時的な変化が表示されます。情報をフィルタリングするには、セクションの上の検索ボックス、ステータス、および時間セレクターを使用します。

ステータス

ステータスグラフは、時間の経過に伴うモニターのステータスをグループごとに示します。: None または no groups found と表示される場合、次のいずれかの状況が当てはまる可能性があります。

  • 新しく作成されたモニターがまだ評価されていない。
  • モニターのクエリが最近変更された。
  • モニターのタイムフレームがメトリクスに対して短すぎるため、データの供給頻度が低くなっています。
  • 以前にクエリに含まれていたホストの名前が変更されました。ホスト名の変更は、2 時間以内に UI から期限切れになります。

ステータスグラフには、モニタークエリのディメンションではなく、アラート用に構成したディメンションが表示されます。例: モニタークエリは servicehost でグループ化されているが、service のアラートのみを受信したい。ステータスグラフは、モニターのステータスを service でグループ化して表示します。host サブグループは、View all をクリックすると、各サブグループのステータスグラフを表示するパネルが表示されます。アラートのグループ化の詳細については、モニターの構成を参照してください。

モニターステータスをサービス別にグループ化し、サブグループを表示するオプションをハイライトしています

ノートブックのモニターを調査する

メトリクスの進化をさらに詳しく調べるには、ステータスグラフの横にある Open in a notebook をクリックします。これにより、モニタークエリのフォーマットされたグラフを含む調査用ノートブックが生成されます。

Open in notebook ボタン

ノートブックはモニターの評価期間と一致し、関連する場合は関連するログを含んでいます。

履歴

履歴グラフは、収集されたデータをステータスグラフと並べて表示します。これは、モニターのメトリクスクエリに送信される生のデータポイントを表示します。モニターステータスページでは、ノートブックやダッシュボードで使用されているのと同じ時系列グラフウィジェットを使用します。

評価グラフ

評価グラフは、モニターに固有のものです。履歴グラフと同じクエリロジックを使用しますが、履歴グラフの時間枠ブラケットにスコープされます。表示されたポイントが正しく集計されるように、モニターの評価ウィンドウに対応する固定でズームされたウィンドウを持ちます。たとえば、過去 15 分間のクエリの平均を評価するようにモニターが構成されている場合、評価グラフの各データポイントは、前の 15 分間の評価ウィンドウのメトリクスの集計値を表示します。

このグラフは、モニターで構成した評価条件に対して適用した、あるメトリクスの生データポイントからの結果を示しています。この視覚化は、モニタークエリを通過した後のデータの値を表示しているため、履歴グラフとは異なります。

イベント

モニターから生成されたイベント (アラート、警告、回復など) は、Status & History セクションの上の時間セレクターに基づいてこのセクションに表示されます。イベントはイベントエクスプローラーにも表示されます。

監査イベント

すべてのモニターの種類で、モニターを変更 (たとえばモニターを編集) するとイベントエクスプローラーにイベントが作成され、変更内容と変更を行ったユーザーが表示されます。詳しくは、イベントのドキュメントをご覧ください。

モニターを変更した場合、イベント検索を実行すると以下の例のように表示されます。

https://app.datadoghq.com/event/stream?per_page=30&query=tags%3Aaudit%20status%3Aall%20priority%3Aall%20monitor%20modified

Datadog は、作成したモニターへの変更に対する通知オプションも提供しています。モニターエディターの下部にある、Define permissions and audit notifications の下にある If this monitor is modified, notify monitor creator and alert recipients. (このモニターが変更された場合、モニターの作成者とアラート受信者に通知する) の隣のドロップダウンで、Notify を選択します。

この設定により、モニター監査イベントに関する電子メールが、特定のモニターの全アラート受信者とモニター作成者に送信されます。モニター監査イベントはイベントエクスプローラーにも表示されます。

エクスポートとインポート

モニターのステータスページから、任意のモニターのエクスポートを JSON で取得できます。右上にある歯車アイコン(設定)をクリックし、メニューから Export を選択します。

メインナビゲーションで、Monitors –> New Monitor –> Import の順に選択し、Datadog に JSON でモニターをインポートします。

その他の参考資料