ログの使用量の監視

このガイドでは、推定使用量メトリクスを利用してログ使用量を監視する方法を説明します。以下の各ステップについて解説していきます。

  • トラフィックの予期せぬスパイクにアラートを生成
  • インデックス化ログの予算しきい値に近づくとアラートを生成
  • すぐに使えるログ管理の使用量ダッシュボードをインポート

予期せぬスパイクにアラートを生成

ログ使用メトリクス

デフォルトで、ログの使用メトリクスは取り込まれたログ、取り込まれたバイト数、インデックス化されたログの追跡に利用できます。このメトリクスは無料で利用でき、15 か月間保存できます。

推奨使用量メトリクス

異常検知モニターでメトリクスを活用する方法については、下記を参照してください。

: メトリクスの概要ページdatadog.estimated_usage.logs.ingested_bytes の単位は Byte に設定することを推奨しています。

Metric 単位の定義

異常検知モニター

インデックス化ログの予期せぬスパイクに対してアラートを受け取れるように異常検知モニターを設定するには、以下の手順に従います。

  1. 新規の異常検知モニターを作成します
  2. datadog.estimated_usage.logs.ingested_events メトリクスを選択します。
  3. from セクションに datadog_is_excluded:false を追加します (取得したログではなく、インデックス化されたログを監視するため)
  4. count byservice タグと datadog_index タグを追加します (インデックスで特定のサービスがスパイクした場合、またはログの送信が停止した場合に通知を受け取るため)
  5. 使用状況に一致するアラート条件を設定します (例: 評価ウィンドウ、予測範囲外の回数)
  6. 実行可能な指示を記述した通知メッセージを設定します。
 異常検知通知の例

コンテキストリンクを含む通知の例

インデックスで予期せぬ数のログがインデックス化されています {{datadog_index.name}}

1. [このサービスのログパターンをチェックします](https://app.datadoghq.com/logs/patterns?from_ts=1582549794112&live=true&to_ts=1582550694112&query=service%3A{{service.name}})
2. [ノイズの多いパターンに除外フィルターを追加します](https://app.datadoghq.com/logs/pipelines/indexes)

推定使用量ダッシュボード

ログの取り込みを開始すると、ログ使用量メトリクスをまとめたすぐに使えるダッシュボードが自動的にアカウントにインストールされます。

ログ推定使用量ダッシュボード

: このダッシュボードで使用されるメトリクスは推定であるため、正式な請求対象の数値とは異なる場合があります。

このダッシュボードにアクセスするには、Dashboards > Dashboards List に移動し、Log Management - Estimated Usage を検索します。

インデックス化されたログを固定しきい値で監視

インフラストラクチャーのスコープ (serviceavailability-zone など) でインデックス化されたログが予期せず増大している場合に通知を受け取ります。

  1. Datadog Log Explorer ビューに移動します。
  2. 監視する量を示す検索クエリを作成します。そのインデックスのすべてのログを監視するには、クエリを空白のままにします。
  3. Export to monitor をクリックします。
  4. 警告またはエラーとするレートを定義します。
  5. わかりやすい通知を定義します。例: このサービスのボリュームが大きすぎます。追加の除外フィルターを定義するか、サンプリングレートを上げて制御下に戻してください。
 通知例

1 日の割り当て数に達したインデックスへのアラート

また、インデックスに 1 日の割り当てを設定して、ログが 1 日の規定数よりも多くインデックス化されることを防ぐことも可能です。この場合、Datadog では上記のモニターを過去 24 時間以内にこの割り当ての 80% に達したらアラートが発信されるようセットアップすることを推奨しています。 1 日の割り当て数に達すると、イベントが生成されます。この際に通知を受信するよう、モニターをセットアップします。

イベントモニターの構成ページ。クエリに Source:datadog、group by セクションに datadog_index が選択されている

1 日のクォータに達したときに生成されるイベントは、デフォルトで datadog_index タグを持ち、インデックス名が表示されます。オプションでdatadog_indexタグにファセットを作成すると、上のスクリーンショットに示すように、マルチアラートgroup by ステップでそのタグを使用できるようにすることが可能です。

Slack で受信する通知の例:

datadog_index:retention-7 の 1 日のクォータの通知

その他の参考資料

お役に立つドキュメント、リンクや記事: