ダウンタイム

概要

モニターをトリガーせずに、システムのシャットダウン、オフラインメンテナンス、またはアップグレードのダウンタイムをスケジュールします。ダウンタイムはすべてのモニターのアラートと通知を無音にしますが、モニターの状態遷移を妨げることはありません。

ダウンタイムスケジュールの新規作成

Datadog でモニターのダウンタイムのスケジューリングを行うには、メインナビゲーションで Monitors –> Manage Downtime の順に移動します。その後、画面右上の Schedule Downtime ボタンをクリックしてください。

個々のモニターをミュートするには、モニターのステータスページの上部にある Mute ボタンをクリックします。これにより、そのモニターにダウンタイムスケジュールが作成されます。

サイレントにする対象を選択

モニター名で特定のモニターに、またはモニタータグで広範囲のモニターに、ダウンタイムスケジュールを適用します。グループスコープを使用して、さらにフィルターを適用します。Preview affected monitors をクリックすると、含まれるモニターが表示されます。ダウンタイムがスケジュールされた後に作成または編集されたモニターは、スコープに一致する場合、ダウンタイムに自動的に含まれます。

モニター名で

検索するか、ドロップダウンメニューを利用してどのモニターをサイレントにするかを選択します。フィールドを空欄にすると、すべてのモニターがデフォルトでサイレント状態に設定されます。スコープを選択して、特定のホストやデバイス、任意のタグに限定したダウンタイムを設定することもできます。選択されたすべてのスコープに紐付くモニターのみがサイレントに設定されます。

モニタータグで

1 つ以上のモニタータグに基づいて、ダウンタイムをスケジュールします。1 つのダウンタイムに選択できるタグの最大数は 32 です。各タグの長さは最大 256 文字です。選択したすべてのタグがあるモニターだけが消音されます。また、追加の制約のためにスコープを選択することができます。

ダウンタイムスコープ

ダウンタイムが単純なアラートモニターにスケジュールされている場合、単純なアラートモニターはすべてのレポートソースを集約して単一のアラートを送信するため、Group scope フィールドは無視できます。

1 台のモニターから複数のアラートを送信している場合は、スコープに含まれるグループだけがサイレントに設定されます。たとえば、host:X がダウンタイムのスコープに含まれており、host:Xhost:Y の両方に対してアラートがトリガーされる場合、Datadog は host:Y に対してのみモニター通知を生成します。host:X に対する通知は行われません。

マルチアラートモニターに適用されるダウンタイムのスコープにすべてのグループを含めるには、Group scopeAll を選択します。

グループスコープをマルチアラートモニターに適用する使用例については、ダウンタイムスケジュールのスコープのガイドを参照してください。

ダウンタイムスケジュールの設定

1 回限り

開始日時とタイムゾーンを指定して 1 回のみのダウンタイムを設定します。オプションで終了日時を設定することもできます。

1 回限りのダウンタイムをスケジュールするためのフィールド

繰り返し

定期的なダウンタイムは、定期的なメンテナンスウィンドウに便利です。開始日、時間、タイムゾーン、リピート、期間を入力して、定期的なダウンタイムを設定します。オプションで、終了日や発生回数を指定することもできます。

定期的なダウンタイムの 1 つのダウンタイムが終了すると、1 つのダウンタイムはキャンセルされ、同じ制約と更新された開始・終了時刻で新しいダウンタイムが作成されます。
: 元の作成者は、新しく作成されたすべてのダウンタイムに関連付けられます。

RRULEで定期的なダウンタイムをスケジュールするためのフィールド

ダウンタイムのスケジュールを定義するには、繰り返しルール (RRULE) を使用します。繰り返しルールを生成するツールとしては、公式の RRULE ジェネレーターを使用します。一般的な使用例としては、RRULES を使用して、毎月の特定の日 (例えば、毎月第 3 月曜日) にダウンタイムを定義することが挙げられます。

: RRULE で期間を指定する属性はサポートされません(例: DTSTARTDTENDDURATION)。

通知

メッセージの追加

このダウンタイムについてチームに通知するためのメッセージを入力します。メッセージフィールドでは、標準的なマークダウンフォーマットと Datadog の @-notification 構文が使用できます。フォーマットオプションの詳細については、通知ページ を参照してください。

チームへの通知

チームメンバーを指定して通知したり、サービスインテグレーションにメッセージを送信します。Datadog は、ダウンタイムがスケジュール、開始、キャンセル、期限切れになるたびに、指定した宛先に通知を送信します。これらの監査通知により、あなたのチームはシステムのダウンタイムを認識することができます。

最初の回復通知を無効にする

デフォルトでは、Datadog はダウンタイム前にトリガーし、ダウンタイム中に回復するモニターに対して回復通知を送信します。これは、サードパーティのインテグレーションを使用して、開いたインシデントを自動的にクローズする場合に便利です。チェックボックスを選択すると、これらの通知がミュートされます。

最初の回復通知をミュートする

最初の回復通知を無効にするオプションは、複数のダウンタイム間で加算されます。例えば、複数のダウンタイムが重なって同じモニターをミュートする場合、少なくとも 1 つのダウンタイムが無効化オプションをチェックすると、最初の回復通知がミュートされます。

: このオプションは、最初の回復通知をミュートします。ダウンタイム中にモニターがトリガーして再び回復する場合、このオプションの設定に関係なく、対応する通知は常にミュートされます。

管理

Manage Downtime ページには、アクティブなダウンタイムとスケジュールされたダウンタイムのリストが表示されます。ダウンタイムを選択して、詳細を表示、編集、または削除します。詳細には、作成者、スコープ、適用されるモニターのリストが含まれます。 ファセットパネルと検索バーを使用して、CreatorScopeMonitor Tags、または ActiveAutomutedRecurring パラメーターのリストをフィルタリングします。

Manage Downtime ページ

履歴

ダウンタイム履歴は、Monitor Status ページにグループ遷移履歴のオーバーレイとして表示されます。または、イベントエクスプローラー内で tags:audit downtime を検索するか、tags:audit downtime_id:<DOWNTIME_ID> を使用して特定のダウンタイムを ID で検索できます。

ミュート設定

モニターは、ALERTWARNINGRESOLVEDNO DATA 間でステータスが切り替わる際にイベントをトリガーします。モニターがミュートまたはダウンタイムによってサイレント状態になっている時は、RESOLVED から別の状態に変わっても、イベントや通知はトリガーされません

ダウンタイム中にアラートへの状態遷移を示すモニターのステータスグラフ、アラートイベントは作成されません

: モニターのステータスページからモニターをミュートまたはミュート解除しても、そのモニターに関してスケジュールされたダウンタイムは削除されません。ダウンタイムを編集または削除するには、Manage Downtimes ページから設定を変更するか、API を使用する必要があります。

有効期限

デフォルトでは、ダウンタイムの期限が切れたときにモニターのステータスがアラート対象 (ALERTWARNINGNO DATA) の場合、モニターは新しい通知をトリガーします。これは、ダウンタイム中にモニターのステータスが (たとえば OK から ALERTWARNING、または NO DATA に) 変わったモニターや、ダウンタイムの開始時にすでにアラート対象のステータスであったモニターも同様です。ダウンタイムを手動でキャンセルした場合、モニターがアラート対象のステータスになったとしても、通知は送信されません。

デフォルトの動作をオーバーライドするには、“Notify Your Team” セクションのオプションを使用して、ダウンタイムの終了時に送信する通知を指定します。API で作成されたダウンタイムの場合、デフォルトの動作で is_cancelled オプションが除外されます。

特定のダウンタイム条件を持つモニターの Notify your team section セクションを構成する

例 1: モニターがダウンタイムの開始前にアラートの状態で、ダウンタイム中も継続した場合:

  1. ダウンタイム中、このアラートの通知は停止されます。
  2. モニターはアラートの状態です(依然として条件が満たされているため)。
  3. ダウンタイムが終了します。
  4. アラート条件が依然として満たされるため、通知が送信されます。

例 2: モニターがダウンタイムの開始前にアラートの状態で、ダウンタイム中にリカバリした場合:

  1. ALERT 状態から OK に移行します。
  2. ダウンタイム中にリカバリ通知が送信されます(ダウンタイム中最初のリカバリのみ)。

モニターレポート

週間モニターレポートには、ダウンタイム時を含むすべてのアラートのステータスが含まれます。

オートミュート

Datadog は、特定のクラウドワークロードの手動シャットダウンに関連するモニターをプロアクティブにミュートすることができます。シャットダウンのための自動ミュートのシナリオは、次のようにサポートされています。

  • **AWS EC2 インスタンス**と、CloudWatch API からのホストステータスに基づく AWS オートスケールによるインスタンス終了。
  • Google Compute Engine (GCE) インスタンスと、GCE API からのホストステータスに基づく GCE オートスケールをトリガーとしたインスタンス終了。
  • シャットダウンが手動または Azure オートスケーリングによってトリガーされたかにかかわらず、Azure Resource Health API を通じて利用できるヘルスステータスに基づく、Azure VM

その他の参考資料