- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
メトリクスモニターは連続的なデータのストリームに役立ちます。Datadog に送信されるメトリクスのいずれかが、一定の期間にしきい値から外れると、アラートを送信します。
Datadog でメトリクスモニターを作成するには、メインナビゲーションを使用して Monitors –> New Monitor –> Metric に移動します:。
しきい値アラートは、メトリクス値を静的なしきい値と比較します。
アラートの評価では、Datadog が選択された期間の平均、最小、最大、合計の値を計算し、しきい値を上回って (または下回って) いるかどうかをチェックします。予期値がわかっている場合に使用される標準的なアラート向けです。ディストリビューションメトリクスは、選択期間におけるパーセンタイル計算の追加しきい値オプションを提供します。
変化アラートは、N
分前の値と現在の値との絶対変化量または相対変化量を指定のしきい値と比較します。比較されるデータポイントは、単一ポイントではなく、define the metric セクションのパラメーターを使用して計算された値です。
アラートの評価には、現在の系列と N
分前の系列の差分 (正または負の値) を計算し、その値の選択された期間における平均、最小、最大、合計を計算します。その結果、系列がしきい値から外れる場合にアラートがトリガーされます。
このタイプのアラートは、しきい値を常に予測できる場合に、メトリクスのスパイク、ドロップ、あるいは緩やかな変化を追跡するのに役立ちます。
異常検出アラートは、過去の動作を使用して、メトリクスの異常な動作を検出します。
異常検出アラートは、過去の値を基に、系列に対して予期される値の範囲を計算します。異常検出アルゴリズムには、予期される範囲を時刻や曜日を使用して判断し、シンプルなしきい値アラートでは検出できない異常の検出を行うものがあります。たとえば、午前 10 時なら正常であっても、午前 5 時なら異常に高いと判断される系列を検出できます。
アラートの評価には、予期される範囲の内、外、上、下にある系列の割合を計算します。この割合がしきい値から外れる場合にアラートがトリガーされます。
詳細については、異常検出モニターのページを参照してください。
外れ値モニターは、グループの他のメンバー (ホスト、アベイラビリティーゾーン、パーティションなど) と比較して動作が異常であるメンバーを検出します。
アラートの評価では、すべてのグループが一緒にクラスター化され、同じ動作を示しているかをチェックします。1 つ以上のグループの動作が他のグループと異なる場合にアラートがトリガーされます。
詳細については、外れ値モニターのページを参照してください。
予測値アラートは、メトリクスの今後の動作を予測し、それを静的なしきい値と比較します。強い傾向や繰り返しパターンがあるメトリクスに適しています。
アラートの評価では、偏差の範囲を考慮してメトリクスの今後の値を予測します。この範囲のいずれかの部分がしきい値から外れる場合にアラートがトリガーされます。
詳細については、予測値モニターのページを参照してください。
Datadog に報告する任意のメトリクスは、モニターに利用できます。エディタと以下のステップを使用して、メトリクスを定義します。クエリパラメーターは、選択した検出方法に基づいて若干変化します。
手順 | 必須 | デフォルト | 例 |
---|---|---|---|
メトリクスの選択 | はい | なし | system.cpu.user |
from を定義する | いいえ | すべての場所 | env:prod |
メトリクス集計を指定する | はい | avg by | sum by |
グループ化 | いいえ | すべての条件 | host |
モニタークエリの集計を指定する | いいえ | average | sum |
評価ウィンドウ | いいえ | 5 minutes | 1 day |
定義
オプション | 説明 |
---|---|
平均 | 系列の平均値が算出され、単一の値が生成されます。この値がしきい値と比較されます。このオプションは、モニタークエリに avg() 関数を追加します。 |
最大 | 生成された系列で、どれか一つの値がしきい値を超えたら、アラートがトリガーされます。これは、max() 関数をモニタークエリに追加します。しきい値のその他の挙動については、「注」セクションを参照してください。 |
最小 | クエリの評価ウィンドウ内のすべてのポイントがしきい値を超えたら、アラートがトリガーされます。これは、min() 関数をモニタークエリに追加します。しきい値のその他の挙動については、「注」セクションを参照してください。 |
合計 | 系列内のすべてのポイントの合計値がしきい値から外れている場合に、アラートがトリガーされます。このオプションは、モニタークエリに sum() 関数を追加します。 |
percentile(pXX) | クエリの評価ウィンドウ内のポイントの pXX パーセンテージがしきい値から外れている場合に、アラートがトリガーされます。このオプションは、比較方法の選択に基づいて、モニタークエリに percentile 関数を追加します。ディストリビューションメトリクスタイプにのみ利用可能です。 |
評価ウィンドウ | モニターが評価する時間帯を指定します。5 minutes 、15 minutes 、1 hour 、custom といったプリセットされた時間枠を使用して、1 分~730 時間 (1 ヶ月) の間で設定します。 |
手順 | 必須 | デフォルト | 例 |
---|---|---|---|
メトリクスの選択 | はい | なし | system.cpu.user |
from を定義する | いいえ | すべての場所 | env:prod |
メトリクス集計を指定する | いいえ | avg by | sum by |
グループ化 | いいえ | すべての条件 | host |
モニタークエリの集計を指定する | いいえ | average | sum |
変更タイプを選択する | いいえ | change | % change |
評価ウィンドウ | いいえ | 5 minutes | 1 day |
比較ウィンドウ | いいえ | 5 minutes | 1 month |
定義
オプション | 説明 |
---|---|
変化 | 値の絶対変化量です。 |
% change | 過去の値と比較した値の変化率です。たとえば、過去の値が 2 で現在の値が 4 の場合、% change は 100% になります。 |
平均 | 系列の平均値が算出され、単一の値が生成されます。この値がしきい値と比較されます。このオプションは、モニタークエリに avg() 関数を追加します。 |
最大 | 生成された系列で、どれか一つの値がしきい値を超えたら、アラートがトリガーされます。これは、max() 関数をモニタークエリに追加します。しきい値のその他の挙動については、「注」セクションを参照してください。 |
最小 | クエリの評価ウィンドウ内のすべてのポイントがしきい値を超えたら、アラートがトリガーされます。これは、min() 関数をモニタークエリに追加します。しきい値のその他の挙動については、「注」セクションを参照してください。 |
合計 | 系列内のすべてのポイントの合計値がしきい値から外れている場合に、アラートがトリガーされます。このオプションは、モニタークエリに sum() 関数を追加します。 |
percentile(pXX) | クエリの評価ウィンドウ内のポイントの pXX パーセンテージがしきい値から外れている場合に、アラートがトリガーされます。このオプションは、比較方法の選択に基づいて、モニタークエリに percentile 関数を追加します。ディストリビューションメトリクスタイプにのみ利用可能です。 |
評価ウィンドウ | モニターが評価する時間帯を指定します。5 minutes 、15 minutes 、1 hour 、custom といったプリセットされた時間枠を使用して、1 分~730 時間 (1 ヶ月) の間で設定します。 |
注:
Advanced...
オプションの使用について詳しくは、高度なグラフの作成を参照してください。as_count()
を使用する場合は動作が異なります。詳しくは、モニター評価での as_count() を参照してください。メトリクスが above
(上)、above or equal to
(上または等しい)、below
(下)、または below or equal to
(下または等しい) の場合にトリガーします。値が 0 から 1 の間の場合、先行ゼロが必要です。例: 0.3
評価の際に、データウィンドウが一杯であることを判断するかどうかを Require
または Do not require
で指定できます。
この設定では、モニターを評価するタイミングをアラートエンジンが判断する方法を変更できます。
Do not require (デフォルト): モニターは認識されるとすぐに評価されます。データポイントがまばらである可能性がある場合は、この値の使用を検討します。この構成では、評価タイムフレームに単一のデータポイントがある場合でも、モニターが評価されます。
Require: 評価ウィンドウがデータで filled
(満たされている) と見なされるまで、モニターは評価されません。評価期間全体にわたってデータがある場合に通知を受けるには、このオプションを使用します。
評価タイムフレームがデータで filled
(満たされている) かどうかを定義するために、タイムフレームはより小さなバケットに分割されます。
次のロジックがバケットサイズを決定します。
「フルウィンドウ」と見なされるには、モニターに次のものが必要です。
条件が満たされると、モニターが評価されます。それ以外の場合、評価はキャンセルされ、モニターの状態は変更されません。
たとえば、過去 2 時間
の評価を行うモニターは、10 分単位の 12 個のバケットに分割されます。最初のバケットにデータがあり、空のバケットが合計で 3 つまでの場合、モニターはフルであるみなされます。
データ | B0 | B1 | B2 | B3 | B4 | B5 | B6 | B7 | B8 | B9 | B10 | B11 | フルウィンドウ? |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ケース 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | はい |
ケース 2 | x | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | いいえ |
ケース 3 | 1 | 1 | x | x | x | 1 | 1 | 1 | 1 | 1 | 1 | 1 | はい |
ケース 4 | 1 | x | x | x | 1 | 1 | 1 | 1 | x | x | 1 | 1 | いいえ |
評価ウィンドウについて、詳しくはモニターの構成ページを参照してください。
高度なアラートオプション (データなし、自動解決など) の詳細な手順については、モニター構成ページを参照してください。
Say what’s happening セクションと Notify your team セクションの詳細については、通知ページとモニターの構成ページをご確認ください。