概要

メトリクスベースの SLO は、計数ベースのデータストリームでイベントの良し悪しを判断する場合に有用です。メトリクスクエリは良質なイベントの合計を同様の時間軸におけるイベント総数で割り、サービスレベル指標 (SLI) を算出します。SLO の作成には、APM スパンRUM イベントログから生成されるカスタムメトリクスを含め、あらゆるメトリクスを使用することができます。SLO の構成と計算方法については、サービスレベル目標のページを参照してください。

メトリクス ベース SLO の例

セットアップ

SLO ステータス ページ+ New SLO をクリックします。次に By Count を選択します。

クエリの定義

  1. 定義するクエリは 2 つあります。分子クエリは正常イベントの合計を定義し、分母クエリは総イベントの合計を定義します。SLO 計算を正しく行うため、クエリでは COUNT、RATE、またはパーセンタイル対応 DISTRIBUTION メトリクスを使用する必要があります。詳細は クエリ方法 ドキュメントを参照してください。
  2. タグを使用して特定のグループを含めるか除外するには、FROM フィールドを使用します。
  3. パーセンタイル対応の DISTRIBUTION メトリクスでは、count values... アグリゲーターを使用して、メトリクスがカウントする数値のしきい値を指定する必要があります。この機能はしきい値クエリと呼ばれ、数値のしきい値に一致する生の値の数をカウントして、分子と分母のカウントを生成することができます。詳しくは、しきい値クエリを参照してください。
  4. オプションとして、パーセンタイル対応の DISTRIBUTION メトリクススでは、count values... アグリゲーターのすぐ右にあるドロップダウンを使用して、SLI を特定のグループごとに分割することができます。
  5. オプションとして、COUNT または RATE のメトリクスでは、sum by アグリゲーターを使用して、SLI を特定のグループごとに分割することができます。

例: HTTP 返却コードをトラッキングしていて、メトリクスに code:2xx OR code:3xx OR code:4xx のようなタグが含まれている場合、正常イベントの合計は sum:httpservice.hits{code:2xx} + sum:httpservice.hits{code:4xx}total イベントは sum:httpservice.hits{!code:3xx} となります。

HTTP 3xx を省いた理由は、これらは一般的にリダイレクトされるもので、SLI として、または SLl に対してカウントされるべきではないためです。一方、3xx ベースでないエラーコードは合計に含める必要があります。total には HTTP 3xx を除いたすべてのタイプのデータを、また numerator には OK タイプのステータスコードのみを充当します。

メトリクスベース SLI のマルチグループ

メトリクス ベース SLI を使用すると、SLI の最も重要な属性にフォーカスできます。エディタで datacenterenvavailability-zoneresource などのタグを使って、メトリクス ベース SLI にグループを追加できます:

グループ化された メトリクス ベース SLO エディタ

これらの SLI をグループ化すると、個々のグループのステータス、適切なリクエスト数、残りのエラーバジェットを詳細パネルで視覚化できます。

メトリクス ベース SLO グループ結果

デフォルトで、棒グラフは SLO 全体の正しい/正しくない要求すべての全体数を表示します。テーブルの該当する行をクリックすると、個別のグループの正しい/正しくない要求の棒グラフを詳しく確認できます。さらに、棒グラフの下にある凡例でオプションを選択し、正しいまたは正しくない要求の数を表示/非表示にすることも可能です。

SLO ターゲットの設定

SLO ターゲットは、ターゲットパーセンテージとタイムウィンドウで構成されます。メトリクスベース SLO のターゲットを設定する場合、ターゲットパーセンテージは SLO の分母で示されたイベント合計のうち良質なイベントであるべき部分を指定し、タイムウィンドウは、ターゲットが追跡される必要があるローリング期間を指定します。

例: リクエストの 99% は、過去 7 日間でエラーが生じていないこと

SLO が目標パーセンテージ以上のあいだは、SLO ステータスが緑色フォントで表示されます。目標パーセンテージを下回ると、SLO ステータスは赤色フォントで表示されます。また、SLO 違反が近いことを示すために、目標パーセンテージより低い警告パーセンテージをオプションで設定できます。警告パーセンテージを下回り、目標パーセンテージを下回っていない場合、SLO ステータスは黄色フォントで表示されます。

注: メトリクスベースの SLO ターゲットには小数第 3 位まで使用できます。SLO の詳細 UI に表示される精度は num_target_decimal_places + 1 = 小数第 4 位 までです。正確な精度は、分母クエリ内の値の大きさにより異なります。分母が大きいほど、小数第 4 位の上限まで精度を表示できます。

その他の参考資料