ホストモニター

概要

すべての Datadog Agent は、ステータスが OKdatadog.agent.up というサービスチェックを報告します。ホストモニターを使用して、1 つ以上のホストでこのチェックを監視できます。

モニターの作成

Datadog でホストモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Host

ホストを名前またはタグで選ぶ

ホスト名、タグ、または All Monitored Hosts を選択して、監視するホストを決定します。特定のホストを除外する必要がある場合は、2 番目のフィールドに名前やタグをリストアップします。

  • インクルードフィールドでは AND ロジックを使用します。ホストに存在するリストアップされたすべての名前とタグはスコープに含まれます。
  • エクスクルードフィールドでは OR ロジックを使用します。リストアップされた名前やタグを持つホストはスコープから除外されます。

モニター含める除外する
タグ env:prod を持つすべてのホストを含めますenv:prod空のままにする
タグ env:test を持つホストを除くすべてのホストを含めますAll Monitored Hostsenv:test

アラートの条件を設定する

このセクションで、Check Alert または Cluster Alert を選択します。

チェックアラートは、ホストが一定時間レポートを停止したかどうかを追跡します。チェック実行後の時間が長すぎると、ホストからのデータ送信に関する問題の兆候になります。

欠落データを確認する分数を入力します。デフォルト値は 2 分です。

datadog.agent.up が指定された分数以上 OK ステータスのレポートを停止すると、アラートがトリガーされます。

クラスターアラートは、一定時間、ホストの一部がレポートを停止したかどうかを追跡します。

クラスターアラートをセットアップするには

  1. タグによりホストをグループ化するかどうか決定します。Ungrouped は含まれるすべてのホストでステータスのパーセンテージを計算します。Grouped は各グループごとのステータスのパーセンテージを計算します。
  2. アラートと警告のしきい値の割合を選択します。1 つの設定(アラートまたは警告)のみ必須です。
  3. 欠落データを確認する分数を入力します。デフォルト値は 2 分です。

datadog.agent.up が指定された分数以上 OK ステータスのレポートを停止し、パーセンテージのしきい値に達すると、アラートがトリガーされます。

高度なアラート条件

高度なアラートオプション (自動解決、新しいグループ遅延など) の詳細な手順については、モニターコンフィギュレーションページを参照してください。

通知

Say what’s happeningNotify your team のセクションに関する詳しい説明は、通知のページを参照してください。

その他の参考資料