品質の監視

概要

Datadog の Monitor Quality 機能は、60 日以上ミュートされているアラートや、指定された受信者がいないモニターなど、モニタリング設定の一般的な誤構成を特定します。これにより、チームはアラートの基準を維持し、重要なアラートを見逃さないようにします。Monitor Quality を使用して、誤構成されたモニターを一つのページで特定し、解決します。

誤構成モニターの表示

Manage Monitors ページから Monitor Quality タブをクリックして、改善が必要なモニターのリストにアクセスします。Datadog は、最初のモニターを作成すると、自動的にこの機能を有効にします。

チーム、クリエーター、サービス、環境に基づいて Monitor Quality ページをフィルタリングして表示し、リストを整理して管理します。

Monitor Quality ページで利用できるクリエーター、チーム、サービス、環境のフィルタリングドロップダウンオプション

モニターを改善してベストプラクティスに従う

Monitor Quality には、以下の品質問題があるモニターが表示されます。

60 日以上ミュートされている

Downtimes は、計画メンテナンスや予定された停止、システム シャットダウン中にアラートを抑制したり、週末や夜間にアラートを停止したりするのに便利です。ただし、60 日超にわたってミュート (または部分的にミュート) されたままのモニターは、見落としの可能性を示しています。これらのモニターのミュートを解除してアラートを再開し、モニタリング範囲を万全にしましょう。

ダウンタイムの誤構成によりアラートが出ていないモニターを確認し、ミュートを解除します。

モニターに受信者がいない

モニターがアラートや通知を発信する場合、解決してアクションを実行できるチームや担当者に送信する必要があります。モニター通知に受信者が追加されていない場合、サービスの積極性が低下します。受信者がいないモニターを確認するには、Monitor Quality ページを使用します。

遅延が発生していない

クラウドインテグレーション (AWS、Azure、Google Cloud など) からのデータは、各 API からクローラーで取得されます。これらのメトリクスには遅延が発生しますが、モニターの構成で考慮できます。評価遅延がないクラウドデータのモニターは、誤検出でアラートする可能性があります。

クラウドデータをクロールしているが、推奨される遅延がないすべてのモニターを確認してください。クロールされたデータの詳細については、クラウドメトリクスの遅延ページを参照してください。

通知チャンネルの誤構成

@notifications を使用すると、アラートをインテグレーション、ワークフロー、Datadog ケースに転送するようにモニターをカスタマイズできます。@notifications が誤構成されていると、期待したアラートが適切なチャンネルに送信されません。

通知チャンネルが誤構成されているモニターを確認し、必要に応じて編集してください。

複合条件モニターに構成要素がない

複合条件モニターは、ユーザー定義のロジックに従って、複数のサブモニター (構成要素) の複合状態を評価します。削除された構成要素を参照する複合条件モニターは、評価も通知も行いません。非アクティブな複合条件モニターを特定し、削除してください。

アラート状態が続いている

ALERT 状態のモニターは、サービス内に問題があり、注意が必要であることを示しています。複数のモニターが常に ALERT 状態にあると、実際に注意を払う必要がある問題から焦点が離れてしまいます。これらのモニターがアラート状態が続いている理由を調査し、それに応じて構成を編集してください。

参考資料

お役に立つドキュメント、リンクや記事: