モニターの概要
Dash が新機能を発表!インシデントマネジメント、Continuous Profiler など多数の機能が追加されました! Dash イベントで発表された新機能!

モニターの概要

概要

メトリクスモニターは、メトリクスがしきい値を超えた、あるいは下回ったときにアラートと通知を行います。このページでは、ディスク容量不足のアラートが発生するようにメトリクスモニターをセットアップする手順を説明します。

前提条件

作業を開始する前に、Datadog Agent がインストールされているホストに Datadog アカウントをリンクする必要があります。検証するには、Datadog のインフラストラクチャーリストを確認してください。

セットアップ

Datadog でメトリクスモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Metric。

検出方法を選択します。

メトリクスモニターを作成すると、検出方法として Threshold Alert (しきい値アラート) が自動的に選択されます。しきい値アラートは、メトリクス値をユーザー定義のしきい値と比較します。このモニターの目的は静的なしきい値に基づいてアラートを生成することなので、変更は必要ありません。

メトリクスの定義

ディスク容量不足のアラートを取得するには、Disk インテグレーションから system.disk.in_use メトリクスを使用して、hostdevice のメトリクスの平均を計算します。

これを設定すると、メトリクスを報告している hostdevice ごとに個別のアラートをトリガーする Multi Alert がモニターによって自動的に更新されます。

アラート条件の設定

Disk インテグレーションのドキュメントによると、system.disk.in_use は、使用中のディスク容量が全体に占める割合を示します。したがって、このメトリクスが報告している値が 0.7 ならば、デバイスは 70% 使用されています。

ディスク容量不足のアラートを発生させるには、メトリクスがしきい値を超えたときにモニターをトリガーする必要があります。しきい値はオプションで設定します。このメトリクスの場合、適切な値の範囲は 0 から 1 です。

この例では、このセクションの他の設定はデフォルトのままになっています。詳細については、メトリクスモニターのドキュメントを参照してください。

Say what’s happening

モニターを保存するには、タイトルとメッセージが必要です。

タイトル

タイトルはモニターごとに一意である必要があります。これはマルチアラートモニターなので、メッセージテンプレート変数を使用してグループ要素 (hostdevice) ごとに名前を付けることができます。

Disk space is low on {{device.name}} / {{host.name}}

メッセージ

次の例のように、メッセージを使用して問題の解決方法をチームに伝達します。

Steps to free up disk space:
1. Remove unused packages
2. Clear APT cache
3. Uninstall unnecessary applications
4. Remove duplicate files

アラートや警告しきい値に基づくさまざまなメッセージについては、通知に関するドキュメントを参照してください。

チームへの通知

電子メール、Slack、PagerDuty などを使用してチームに通知を送信するには、このセクションを使用してください。ドロップダウンボックスから、チームメンバーおよび接続済みアカウントを検索できます。このボックスに @notification が追加されている場合、通知は自動的にメッセージボックスに追加されます。

片方のセクションから @notification を削除すると、両方のセクションから削除されます。

その他の参考資料