プロセスチェックモニター

概要

プロセスチェックモニターは、Agent チェック process.up が生成するステータスを監視します。Agent レベルで、一致するプロセスの数に基づいてチェックしきい値を構成できます。

モニターの作成

Datadog でプロセスチェックモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Process Check。

プロセスを選択する

ドロップダウンリストから、監視するプロセスを選択します。検索条件を入力してリストをフィルターします。

モニターのスコープを選択

ホスト名、タグ、または All Monitored Hosts を選択して、監視するホストを決定します。選択したプロセスのステータスを報告するホストまたはタグのみが表示されます。特定のホストを除外する必要がある場合は、2 番目のフィールドに名前やタグをリストアップします。

  • インクルードフィールドでは AND ロジックを使用します。リストアップされたすべてのホスト名とタグが存在するホストがスコープに含まれます。
  • エクスクルードフィールドでは OR ロジックを使用します。リストアップされた名前やタグを持つホストはスコープから除外されます。

アラートの条件を設定する

チェックアラートは、チェックグループごとに送信されたステータスを連続的にトラックし、しきい値と比較します。プロセスチェックモニターの場合、グループは静的です(hostprocess)。

チェックアラートをセットアップする

  1. 何回連続して失敗したらアラートをトリガーするか、回数 <数値> を選択します。

    各チェックは OKWARNCRITICAL のいずれか 1 つのステータスを送信します。WARNCRITICAL ステータスが連続して何回送信されたら通知をトリガーするか選択します。たとえば、プロセスで接続に失敗する異常が 1 回発生したとします。値を > 1 に設定した場合、この異常は無視されますが、2 回以上連続で失敗した場合は通知をトリガーします。

  2. 何回連続して成功したらアラートを解決するか、回数 <数値> を選択します。

    何回連続して OK ステータスが送信されたらアラートを解決するか、回数を選択します。

クラスターアラートは、既定のステータスでプロセスチェックの割合を計算し、しきい値と比較します。

クラスターアラートをセットアップする

  1. タグによりプロセスチェックをグループ化するかどうか決定します。Ungrouped はすべてのソースでステータスのパーセンテージを計算します。Grouped は各グループごとのステータスのパーセンテージを計算します。

  2. アラートと警告のしきい値の割合を選択します。1 つの設定(アラートまたは警告)のみ必須です。

タグの個別の組み合わせでタグ付けされた各チェックは、クラスター内の個別のチェックと見なされます。タグの各組み合わせの最後のチェックのステータスのみが、クラスターのパーセンテージの計算で考慮されます。

クラスターチェックのしきい値

たとえば、環境ごとにグループ化されたクラスターチェックモニターは、いずれかの環境のチェックの 70% 以上が CRITICAL ステータスを送信した場合にアラートし、いずれかの環境のチェックの70% 以上が WARN ステータスを送信した場合に警告できます。

高度なアラート条件

データなし自動解決新しいグループ遅延の各オプションに関する情報は、モニターコンフィギュレーションドキュメントを参照してください。

通知

Say what’s happeningNotify your team のセクションに関する詳しい説明は、通知 のページを参照してください。

その他の参考資料