プロセスチェックモニターは、Agent チェック process.up
が生成するステータスを監視します。Agent レベルで、一致するプロセスの数に基づいてチェックしきい値を構成できます。
Datadog でプロセスチェックモニターを作成するには、メインナビゲーションを使用して次のように移動します: Monitors –> New Monitor –> Process Check。
ドロップダウンリストから、監視するプロセスを選択します。検索条件を入力してリストをフィルターします。
ホスト名、タグ、または All Monitored Hosts
を選択して、監視するホストを決定します。選択したプロセスのステータスを報告するホストまたはタグのみが表示されます。特定のホストを除外する必要がある場合は、2 番目のフィールドに名前やタグをリストアップします。
AND
ロジックを使用します。ホストに存在するリストアップされたすべてのホスト名とタグはスコープに含まれます。OR
ロジックを使用します。リストアップされた名前やタグを持つホストはスコープから除外されます。チェックアラートは、チェックグループごとに送信されたステータスを連続的にトラックし、しきい値と比較します。プロセスチェックモニターの場合、グループは静的です(host
と process
)。
チェックアラートをセットアップする
連続して <NUMBER>
回失敗したらアラートをトリガーするか、回数を選択します。
各チェックは OK
、WARN
、CRITICAL
のいずれか 1 つのステータスを送信します。WARN
と CRITICAL
ステータスが連続して何回送信されたら通知をトリガーするか選択します。たとえば、プロセスで接続に失敗する異常が 1 回発生したとします。値を > 1
に設定した場合、この異常は無視されますが、2 回以上連続で失敗した場合は通知をトリガーします。
連続して成功したらアラートを解決する回数を選択します <NUMBER>
何回連続して OK
ステータスが送信されたらアラートを解決するか、回数を選択します。
クラスターアラートは、既定のステータスでプロセスチェックの割合を計算し、しきい値と比較します。
クラスターアラートをセットアップする
タグによりプロセスチェックをグループ化するかどうか決定します。Ungrouped
はすべてのソースでステータスのパーセンテージを計算します。Grouped
は各グループごとのステータスのパーセンテージを計算します。
アラートと警告のしきい値の割合を選択します。1 つの設定(アラートまたは警告)のみ必須です。
No data、Auto resolve、Evaluation delayの各オプションに関する情報は、メトリクスモニタードキュメントを参照してください。
Say what’s happening と Notify your team のセクションに関する詳しい説明は、通知 のページを参照してください。
お役に立つドキュメント、リンクや記事:
このページ