APM モニター

概要

APM メトリクスモニターは、通常のメトリクスモニターと同様に機能しますが、APM 専用に作られたコントロールを備えています。このモニターを使用して、サービスレベルのヒット数、エラー数、そしてさまざまなレイテンシー測定値についてアラートを受信します。

Analytics モニターを使用すると、APM データを経時的に視覚化し、Indexed Span に基づきアラート設定を行えます。たとえば、Analytics モニターを使用して、リクエストの遅延急増に関するアラートを受信できます。

モニターの作成

Datadog で APM モニターを作成するには、メインナビゲーションで Monitors –> New Monitor –> APM の順に進みます。

APM Metrics または Trace Analytics モニターのいずれかを選択します。

モニタースコープを選択

ドロップダウンメニューでプライマリタグサービスリソースを選択します。

アラートの条件を設定する

しきい値または異常検知アラートを選択します。

しきい値アラート

メトリクスがしきい値を超えるとアラートがトリガーされます。

  • Requests per secondErrors per secondApdexError rateAvg latencyp50 latencyp75 latencyp90 latency、または p99 latency
  • aboveabove or equal tobelow、または below or equal to の時にアラートを作成
  • アラートのしきい値 <数値>
  • 警告のしきい値 <数値>
  • 過去 5 minutes15 minutes1 hour など、または custom に 1 分~48 時間の値を設定します。

異常検知アラート

メトリクスが予想されるパターンから逸脱するとアラートがトリガーされます。

  • Requests per secondErrors per secondApdexError rateAvg latency, p50 latencyp75 latencyp90 latency、または p99 latency の場合
  • <ALERT_THRESHOLD>%, <WARNING_THRESHOLD>% の時にアラート
  • 値が<数値>偏差、above or belowabove、またはbelow
  • 過去 5 minutes15 minutes1 hour などの間の予測、または custom に 1 分~48 時間の値を設定します。

高度なアラート条件

高度なアラートオプション (データなし、評価遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。メトリクス固有のオプションのフルデータウィンドウについては、メトリクスモニターページを参照してください。

: デフォルトでは、1 アカウントあたり 1000 トレース分析モニターという制限があります。この制限に引っかかっている場合、マルチアラートの使用を検討するか、サポートにお問い合わせください。

検索クエリを定義する

  1. トレース検索と同じロジックを使用して検索クエリを構築します。
  2. トレース数、ファセット、または計測のモニタリングを選択します。
    • Monitor over a trace count: 検索バーを使用し(任意)、ファセットまたはメジャーを選択しません。選択されたタイムフレームで Datadog がログ数を評価し、それをしきい値の条件と比較します。
    • Monitor over a facet or measure: ファセットが選択されている場合、モニターはファセットの Unique value count でアラートを作成します。計測が選択されている場合は、メトリクスモニターと同様、集計を選択する必要があります(minavgsummedianpc75pc90pc95pc98pc99、または max)。
  3. 複数のディメンションでトレースをグループ化する (オプション): クエリに一致するすべてのトレースは、最大 4 つのファセットの値に基づいてグループに集約されます。
  4. アラート設定のグループ化方法を構成します(任意):
    • シンプルアラート: すべての報告元ソースを集計します。集計値が設定条件を満たすと、アラートを 1 件受信します。
      クエリに group by があり、シンプルアラートモードを選択した場合、1 つまたは複数のグループの値がしきい値に違反すると 1 つのアラートが表示されます。この戦略を選択すると、通知ノイズを減らすことができます。
    • Multi-Alert: グループパラメーターに従い、複数のアラートを各ソースに適用します。アラートイベントは、設定された条件を満たすと各グループに生成されます。たとえば、クエリを @resource.name でグループ化すると、スパンのエラー率が高い場合にリソースごとに個別のアラートを受信することができます。
検索クエリの定義

注:* Analytics モニターは、カスタム保持フィルターによって保持されたスパンに基づいてのみ作成できます (インテリジェント保持フィルターではありません)。

アラート条件を選択

  • クエリ結果が aboveabove or equal tobelowbelow or equal to の場合にトリガーします。
  • 過去 5 minutes15 minutes1 hour のしきい値、または custom に 5 分~48 時間の値を設定します。
  • アラートのしきい値: <数値>
  • 警告のしきい値: <数値>

データなしと下限のアラート

特定のクエリにマッチするグループがスパンの送信を停止したときに通知を受け取るには、条件を 1 より下に設定します。これは、グループに対して定義された評価期間内にモニタークエリに一致するスパンがない場合に通知されます。

高度なアラート条件

高度なアラートオプション (評価遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。

通知

Say what’s happeningNotify your team のセクションに関する詳しい説明は、通知のページを参照してください。

: サービスレベルモニターについてはサービスカタログおよびサービスマップで、リソースレベルモニターについては個々のリソースページで確認できます (サービス詳細ページに記載されている特定のリソースをクリックすると、アクセスできます)。

その他の参考資料