ログモニター
Datadog の調査レポート: サーバーレスの状態 レポート: サーバーレスの状態

ログモニター

概要

組織でログ管理を有効にすると、指定された種類のログが、ユーザー定義のしきい値を一定時間超えた場合にアラートするように、ログモニターを作成することができます。

モニターの作成

Datadog でログモニターを作成するには、メインナビゲーションで Monitors –> New Monitor –> Logs の順に進みます。

検索クエリを定義する

検索クエリを定義すると、検索フィールドの上にあるグラフが更新されます。

  1. ログインデックスが複数ある場合は、検索するインデックスを選択してください。
  2. ログエクスプローラーでの検索と同じロジックを使用して検索クエリを作成します。
  3. ログカウント、ファセット、またはメジャーに対するモニターを選択します。
    • Monitor over a log count: 検索バーを使用し(任意)、ファセットまたはメジャーを選択しません。選択されたタイムフレームで Datadog がログ数を評価し、それをしきい値の条件と比較します。
    • Monitor over a facet: ファセットが選択されていると、モニターはファセットの Unique value count に対してアラートを出します。
    • Monitor over measure: メジャーが選択されていると、モニターは (メトリクスモニターと同様に) ログファセットの数値に対してアラートを出します。また、集計を選択する必要があります(minavgsummedianpc75pc90pc95pc98pc99、または max)。
  4. アラートグループを定義します(任意)。: アラートグループが定義されているかどうかにかかわらず、集計値が設定された条件を満たしたときに、アラートを 1 つ受け取ります。クエリをホストで分割した場合でも、複数のホストが設定された条件を満たすと、通知が 1 つだけ送信されます。これは、通知ノイズを減らすためです。

アラートの条件を設定する

  • メトリクスが aboveabove or equal tobelowbelow or equal to の場合にトリガーされる
  • 最後の 5 minutes15 minutes1 hour などの間のしきい値
  • アラートのしきい値 <数値>
  • 警告のしきい値 <数値>

データなしと下限のアラート

サービス内のすべてのグループがログの送信を停止した場合に通知を受け取るには、条件を below 1 に設定します。これにより、すべての集計グループについて、指定のタイムフレームでモニタークエリと一致するログがない場合に通知が行われます。

モニターを何らかのディメンション (タグまたはファセット) で分割している場合に below 条件を使用すると、特定のグループのログが存在してカウントがしきい値未満である場合に限り、またはすべてのグループについてログが存在しない場合に、アラートがトリガーされます。

:

  • このモニターは、すべてのサービスについてログが存在しない場合にのみトリガーします。
  • このモニターは、サービス backend のログが存在しない場合にトリガーします。

Notifications

Say what’s happeningNotify your team のセクションに関する詳しい説明は、通知 のページを参照してください。

ログのサンプル

デフォルトでは、ログモニターをトリガーすると、サンプルまたは値が通知メッセージに追加されます。

モニターの対象通知メッセージに追加されるもの
ログ数グループ: 上位 10 個の違反値とそれぞれの数。
非グループ: 上位 10 個のログサンプル。
ファセットまたはメジャー上位 10 個のファセットまたはメジャーの値。

これらの通知の送信に、Slack、Jira、webhooks、Microsoft Teams、Pagerduty、電子メールを使用することができます。: サンプルはリカバリ通知には表示されません。

ログサンプルを無効にするには、Say what’s happening セクションの一番下にあるチェックボックスをオフにします。チェックボックスの隣に表示されるテキストは、モニターのグループ化によって変わります(上記を参照)。

上位 10 の違反値の表を含める:

10 のログのサンプルをアラート通知に含める:

その他の参考資料