Service Check

Service Check

概要

サービスチェックを使用すると、サービスのステータスを特徴付けて、Datadog 内でサービスを監視できます。サービスチェックは、特定のサービスのアップまたはダウンステータスを監視します。指定された回数の連続したチェックでモニタリング Agent がそのサービスに接続できなかった場合は常に警告が表示されます。たとえば、Redis ホスト上のモニタリング Agent が Redis への接続とメトリクスの収集に 3 回連続して失敗したことを報告した場合に、アラートを受け取ることができます。

クラスターレベルでのサービスチェックは、いくつかの障害に耐えることができる分散型システムまたは冗長システムを監視するための効果的な代替手段になります。これらのアラートは、個々のホストが複数のサービスを実行しているアーキテクチャに使用します。これは、そのサービスを実行しているホストが引き続き使用可能である (ホストレベルのヘルスチェックに成功する) 場合でも、サービスの低下を表面化できるためです。

重要な非冗長サービスが失われた場合、または広範囲にわたるノードの損失のためにクラスターが障害の危機に瀕している場合に備えて、モニタリングとアラートを設定できます。その他の重要なアラートとしては、リクエストスループットの低下またはリクエストレイテンシーの増加が挙げられます。

サービスチェックを設定する必要があるのは、インテグレーションにネイティブのサービスチェックがない場合や、アップまたはダウンステータスを監視したい内部サービスがある場合などです。

サービスチェックを使用するには、最初にチェックを設定します。


サービスチェックがデータを送信したら、チェック内容のサマリーを確認し、ダッシュボード、モニター、アラートを設定します。

Datadog UI でのサービスチェックの視覚化

サービスチェックを視覚化して、Datadog の以下の 3 つのセクションで使用できます。

チェック内容のサマリー

Monitors タブをクリックし、Check Summary をクリックして、チェック内容のサマリーページを表示します。

これは、インフラストラクチャー全体の前日のチェックとステータス報告のリストです。チェックの 1 つを選択すると、関連付けられたタグごとに個別チェックの数が表示されます。

スクリーンボード

スクリーンボードの_チェックステータス_ウィジェットを使用して、サービスチェックを視覚化できます。

_チェックステータス_ウィジェットアイコンをクリックすると、次のポップアップが表示されます。

このフォームで、以下の設定を行うことができます。

  • Check Name: サービスチェック名を選択します。
  • Reporting Timeframe: ステータスを集計するタイムフレームを選択します。
  • Scoping: 1 つのチェックを選択するか、1 つのタグ値またはタグキーに基づいて報告されるチェックステータスのクラスターを選択します。
  • Widget Title: ウィジェットのタイトルを設定します。

カスタムチェックモニター

メトリクスのように経時的にカスタムチェックをグラフ化できなくても、監視することはできます。 Monitors タブ > new monitor に移動し、Custom Check セクションを選択します。

カスタムチェックモニターを構成します。

このフォームで、以下の設定を行うことができます。

  • Pick a custom check: 監視するチェックステータス名を選択します。
  • Pick monitor scope: モニターのコンテキストを選択します (タグの選択/除外)。
  • Set alert conditions: シンプルチェックアラートまたはクラスターアラートを選択します。
  • Say what’s happening: 送信する通知を編集します (詳細は Datadog 通知を参照)。
  • Notify your team: このモニターを誰に通知するかを選択します。

すぐに使用できる Datadog インテグレーションのサービスチェックモニターは、左側の Monitors タブ > Integration > Integration status タブで設定できます。以下は、HAProxy インテグレーションの例です。

インテグレーションの書き方について、詳しくは Agent ベースのインテグレーション入門をご参照ください。