サービスレベル目標
Datadog の調査レポート: サーバーレスの状態 レポート: サーバーレスの状態

サービスレベル目標

概要

サービスレベル目標 (SLO) は、サイト信頼性エンジニアリングツールキットの重要な要素です。SLO を使用し、アプリケーションのパフォーマンスに明確なターゲットを定義するためのフレームワークを整えることで、一貫したカスタマーエクスペリエンを提供したり、プラットフォームの安定性を保ちつつ機能を開発したり、内部および外部ユーザーとのコミュニケーションを改善するために役立てることができます。

セットアップ

SLO とアップタイムウィジェットを使用すると、SLO (サービスレベル目標) およびアップタイムをスクリーンボードやタイムボードで追跡できます。SLO を使用するには、ウィジェットをダッシュボードに追加するか、または Datadog のサービスレベル目標ページに移動して、新しい SLO を作成し、既存の SLO をすべて表示します。ドロップダウンから SLO を選択し、任意のダッシュボードに SLO を表示させます。

*アップタイム*とは、モニターがアップ (OK) の状態であった時間を、ダウン (OK ではない)*の時間と比較した割合を言います。ステータスはバーにグリーン (アップ) とレッド (ダウン) で表示されます。例: 遅延の 99 % が 200 ミリ秒未満

また、成功率やイベントベースの SLI (サービスレベル指標) も追跡できます。例: リクエストの 99% が成功。

コンフィグレーション

  1. SLO ページNew SLO + を選択します。
  2. モニターのソースを定義します。モニターの種類には、イベントベースモニターベースがあります。
  3. ターゲットのアップタイムを設定します。タイムウィンドウは 7 日、当月内、30 日 (ローリング)、前月、90 日 (ローリング) から選択できます。7 日の場合、ウィジェットの精度は小数点以下 2 桁に制限されます。30 日以上では、2 ~ 3 桁の精度に制限されます。
  4. 最後に、SLO にタイトルを付け、詳しい説明を入力し、タグを追加して保存します。

モニターを設定すると、メインのサービスレベル目標ページに、全体のアップタイム率を表示できます。また、全体のアップタイム率とモニター別のアップタイム率の両方を表示させることもできます。

SLO の変更

SLO を変更するには、右側の SLO にカーソルを合わせて鉛筆アイコンをクリックします。

SLO の検索

サービスレベル目標がリストされたページでは、すべての SLO に対し高度な検索を実行して、選択された SLO を一括で表示、削除、あるいはサービスタグを編集することができます。検索結果に含まれる SLO を個別に複製したり、完全に編集することもできます。

高度な検索を使用し、SLO の属性をどれでも組み合わせて SLO をクエリできます。

  • name および description - テキスト検索
  • time window - *、7日、30日、90日
  • type - メトリック、モニター
  • creator
  • tags - データセンター、環境、サービス、チーム、その他

検索を実行するには、左側のチェックボックスと検索バーを使用します。ボックスをチェックすると、それに合わせて検索バーのクエリが更新されます。同様に、検索バーのクエリを変更 (あるいは一から入力) すると、ボックスのチェックが更新されます。クエリ結果はクエリの変更に合わせてリアルタイムで更新されます。’検索’ボタンはありません。

個々の SLO を変更するには、SLO の上にカーソルを置き、その行の右端にある EditCloneDelete ボタンを使用します。SLO の内容を詳しく確認したい場合は、その行をクリックしてステータスページを表示します。

SLO タグ

SLO の作成時や変更時に、SLO のリストのページでフィルタリングに必要なタグを追加することができます。

全体のアップタイムの計算

全体のアップタイムとは、すべてのモニターが OK の状態である時間の割合のことです。モニターを集計した平均値ではありません。

次の 3 か月の例で考えてみましょう。

モニターt1t2t3t4t5t6t7t8t9t10アップタイム
モニター 1OKOKOKOKアラートOKOKOKOKOK90%
モニター 2OKOKOKOKOKOKOKOKアラートOK90%
モニター 3OKOKアラートOKアラートOKOKOKOKOK80%
全体のアップタイムOKOKアラートOKアラートOKOKOKアラートOK70%

この場合は、全体のアップタイムが個々のアップタイムの平均よりも低いという結果になります。

SLO の表示

SLO ステータスページでは、SLO とそのプロパティを表示、編集したり、SLO の長期的なステータスや履歴を確認したりできます。

SLO ウィジェット

SLO を作成した後に、SLO ダッシュボードウィジェットを使用して、SLO のステータスをダッシュボードメトリクス、ログ、APM データと合わせて表示させることが可能です。SLO ウィジェットについて詳しくは、SLO ウィジェットのドキュメントページを参照してください。

その他の参考資料