プロセスチェックモニター
Dash が新機能を発表!インシデントマネジメント、Continuous Profiler など多数の機能が追加されました! Dash イベントで発表された新機能!

プロセスチェックモニター

概要

プロセスチェックモニターは、Agent チェック process.up が生成するステータスを監視します。Agent レベルで、一致するプロセスの数に基づいてチェックしきい値を構成できます。

モニターの作成

Datadog でプロセスチェックモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Process Check。

プロセスを選択する

ドロップダウンリストから、監視するプロセスを選択します。検索条件を入力してリストをフィルターします。

モニターの対象範囲を選択

ホスト名、タグ、または All Monitored Hosts を選択して、監視するホストを決定します。選択したプロセスのステータスを報告するホストまたはタグのみが表示されます。特定のホストを除外する必要がある場合は、2 番目のフィールドに名前やタグをリストアップします。

  • インクルードフィールドでは AND ロジックを使用します。ホストに存在するリストアップされたすべてのホスト名とタグはスコープに含まれます。
  • エクスクルードフィールドでは OR ロジックを使用します。リストアップされた名前やタグを持つホストはスコープから除外されます。

アラートの条件を設定する

チェックアラートは、チェックグループごとに送信されたステータスを連続的にトラックし、しきい値と比較します。プロセスチェックモニターの場合、グループは静的です(hostprocess)。

チェックアラートをセットアップする

  1. 連続して <NUMBER> 回失敗したらアラートをトリガーするか、回数を選択します。

    各チェックは OKWARNCRITICAL のいずれか 1 つのステータスを送信します。WARNCRITICAL ステータスが連続して何回送信されたら通知をトリガーするか選択します。たとえば、プロセスで接続に失敗する異常が 1 回発生したとします。値を > 1 に設定した場合、この異常は無視されますが、2 回以上連続で失敗した場合は通知をトリガーします。

  2. 連続して成功したらアラートを解決する回数を選択します <NUMBER>

    何回連続して OK ステータスが送信されたらアラートを解決するか、回数を選択します。

クラスターアラートは、既定のステータスでプロセスチェックの割合を計算し、しきい値と比較します。

クラスターアラートをセットアップする

  1. タグによりプロセスチェックをグループ化するかどうか決定します。Ungrouped はすべてのソースでステータスのパーセンテージを計算します。Grouped は各グループごとのステータスのパーセンテージを計算します。

  2. アラートと警告のしきい値の割合を選択します。1 つの設定(アラートまたは警告)のみ必須です。

No dataAuto resolveEvaluation delayの各オプションに関する情報は、メトリクスモニタードキュメントを参照してください。

Notifications

Say what’s happeningNotify your team のセクションに関する詳しい説明は、通知 のページを参照してください。

その他の参考資料