ダウンタイム

ダウンタイム

ダウンタイムをスケジューリングすると、システムシャットダウンやオフラインメンテナンス、アップグレードを、モニターをトリガーせずに行うことができます。

スケジュール

Datadog でモニターのダウンタイムのスケジューリングを行うには、メインナビゲーションで Monitors –> Manage Downtime の順に移動します。その後、画面右上の Schedule Downtime ボタンをクリックしてください。

サイレントにする対象を選択

検索するか、ドロップダウンを利用してサイレントにしたいモニターを選択します。フィールドを空欄にすると、すべてのモニターがデフォルトでサイレント状態に設定されます。スコープを選択して、特定のホストやデバイス、任意のタグに限定したダウンタイムを設定することもできます。選択されたすべてのスコープに紐付くモニターのみがサイレントに設定されます。

一つないし複数のモニタータグに基づくダウンタイムのスケジューリングが可能です。少なくとも 1 つのタグを選択する必要があります。タグは最大 32 個まで選択でき、各タグの長さは最大 256 文字までとなります。選択されたすべてのタグに紐付くモニターのみがサイレントに設定されます。スコープを選択すれば、対象をさらに制限することもできます。

モニターのサイレント設定にスコープを追加する場合は、Preview affected monitors をクリックして該当するモニターを表示します。ダウンタイムのスケジューリング後に作成または編集されたモニターは、スコープに合致した場合に自動でダウンタイムに組み込まれます。

: 1 台のモニターから複数のアラートを送信している場合は、スコープに含まれるグループだけがサイレントに設定されます。たとえば、host:X がダウンタイムのスコープに含まれており、host:Xhost:Y の両方に対してアラートがトリガーされる場合、Datadog は host:Y に対してのみモニター通知を生成します。host:X に対する通知は行われません。

スケジュール

開始日時とタイムゾーンを指定して 1 回のみのダウンタイムを設定します。オプションで終了日時を設定することもできます。

定期的なメンテナンスなどには繰り返しのダウンタイム設定が便利です。

開始日時、タイムゾーン、繰り返し条件、期間を指定して定期のダウンタイムを設定します。オプションで終了日や繰り返し回数を設定することもできます。

毎回の定期ダウンタイムが終了すると、そのダウンタイムをキャンセルし、同じ条件(開始時間と終了時間が異なる)の新しいダウンタイムを作成するというパターンが繰り返されます。: このように新しく作成されたダウンタイムはすべて、元の作成者に関連付けられます。

メッセージの追加

このダウンタイムについてチームに通知するメッセージをフィールドに入力します。標準のマークダウン形式および Datadog の @-notification 構文での入力が可能です。

チームへの通知

対象のチームメンバーを指定して通知するか、サービスインテグレーションにメッセージを送信します。

管理

Manage Downtime ページには、アクティブなダウンタイムとスケジューリングされたダウンタイムの一覧が表示されます。任意の行を選択して詳細の確認、編集、削除を行うことができます。ダウンタイムを検索する場合は Filter downtimes テキストボックスを使用します。

履歴

ダウンタイム履歴は、Monitor Status ページにグループ遷移履歴のオーバーレイとして表示されます。または、イベントストリーム内で tags:audit,downtime を検索するか、tags:audit,downtime_id:<ダウンタイム_ID> を使用して特定のダウンタイムを ID で検索できます。

ミュート設定

モニターは、ALERTWARNINGRESOLVEDNO DATA 間でステータスが切り替わる際にイベントをトリガーします。モニターがミュートまたはダウンタイムによってサイレント状態になっている時は、RESOLVED から別の状態に変わっても、イベントや通知はトリガーされません

: UI を使用してモニターをミュートまたはミュート解除しても、そのモニターに関してスケジュールされたダウンタイムは削除されません。ダウンタイムを編集または削除するには、Manage Downtimes ページから設定を変更するか、API を使用する必要があります。

ダウンタイムの期限が切れたときにモニターのステータスがアラート対象(ALERTWARNINGNO DATA)の場合、モニターは強制リカバリされ、アラートの条件が満たさされればすぐに再トリガーされます。これは、ダウンタイム中にモニターのステータスが(たとえば OK から ALERTWARNING、または NO DATA に)変わったモニターや、ダウンタイムの開始時にすでにアラート対象のステータスであったモニターも同様です。

例 1: モニターがダウンタイムの開始前にアラートの状態で、ダウンタイム中も継続した場合:

  1. ダウンタイム中、このアラートの通知は停止されます。
  2. モニターはアラートの状態です(依然として条件が満たされているため)。
  3. ダウンタイムが終了します。
  4. モニターが強制リカバリされます。
  5. アラート条件が満たされるため、通知が送信されます。

例 2: モニターがダウンタイムの開始前にアラートの状態で、ダウンタイム中にリカバリした場合:

  1. アラート状態から OK に移行します。
  2. ダウンタイム中にリカバリ通知が送信されます(ダウンタイム中最初のリカバリのみ)。

モニターレポート

週間モニターレポートには、ダウンタイム時を含むすべてのアラートのステータスが含まれます。

その他の参考資料