Error Budget Alerts

概要

SLO エラーバジェットアラートは閾値に基づき、SLO のエラーバジェットの一定の割合が消費されなかったときに通知します。たとえば、対象とする 7 日間でエラーバジェットの 75% が消費されたらアラート、50% が消費されたら警告(オプション)のように設定します。

注: エラーバジェットアラートは、メトリクスモニターの種類(メトリクス、インテグレーション、APM メトリクス、異常検知、予測値、外れ値モニター)のみで構成されたメトリクスベースの SLO またはモニターベースの SLO でのみ利用可能です。

エラーバジェットを含む SLO に関する主要な用語の説明については、サービスレベル目標を参照してください。

エラーバジェットアラートのコンフィギュレーション

モニターの作成

  1. SLO ステータスページに移動します。
  2. 新しい SLO を作成、または既存のものを編集し、Save and Set Alert ボタンをクリックします。既存の SLO の場合は、SLO 詳細のサイドパネルの Set up Alerts ボタンをクリックすると、アラートのコンフィギュレーションに直接アクセスできます。
  3. Step 1: Setting alerting conditionsError Budget タブを選択
  4. 過去の target 日数において、エラーバジェットの消費割合が threshold を超えるとアラートをトリガーするタイミングを設定します。 。
  5. Say what’s happening セクションと Notify your team セクションに、通知情報を追加します。
  6. SLO コンフィギュレーションページで ‘Save and Set Alert’ ボタンをクリックします。
SLO を保存してエラーバジェットアラートをセットアップ

API および Terraform

create-monitor API エンドポイントを使用して、SLO エラーバジェットアラートを作成することができます。以下は、SLO のエラーバジェットの 75% 以上が消費されたときに警告を発する SLO モニターのクエリ例です。slo_id をバーンレートアラートを構成する SLO の英数字 ID に置き換え、time_window を 7d、30d、または 90d のいずれかに置き換えます (SLO の構成に使用するターゲットによって異なります)。

error_budget("slo_id").over("time_window") > 75

また、Terraform の datadog_monitor リソースを使用して SLO エラーバジェットアラートを作成することも可能です。以下は、上記と同じクエリ例を使用して、メトリクスベースの SLO にエラーバジェットアラートを構成する .tf の例です。

プロバイダーバージョン v2.7.0 以前と v2.13.0 以降の場合

注: SLO エラーバジェットアラートは、Terraform プロバイダー v2.7.0 以前および v2.13.0 以降のみでサポートされています。v2.7.0 から v2.13.0 の間のバージョンはサポートされていません。

resource "datadog_monitor" "metric-based-slo" {
    name = "SLO Error Budget Alert Example"
    type  = "slo alert"

    query = <<EOT
    error_budget("slo_id").over("time_window") > 75 
    EOT

    message = "Example monitor message"
    monitor_thresholds {
      critical = 75
    }
    tags = ["foo:bar", "baz"]
}

その他の参考資料

お役に立つドキュメント、リンクや記事: