概要
Datadog の Monitor Quality 機能は、60 日以上ミュートされているアラートや、指定された受信者がいないモニターなど、モニタリング設定の一般的な誤構成を特定します。これにより、チームはアラートの基準を維持し、重要なアラートを見逃さないようにします。Monitor Quality を使用して、誤構成されたモニターを一つのページで特定し、解決します。
誤構成モニターの表示
Manage Monitors ページから Monitor Quality タブをクリックして、改善が必要なモニターのリストにアクセスします。Datadog は、最初のモニターを作成すると、自動的にこの機能を有効にします。
チーム、クリエーター、サービス、環境に基づいて Monitor Quality ページをフィルタリングして表示し、リストを整理して管理します。
モニターを改善してベストプラクティスに従う
Monitor Quality には、以下の品質問題があるモニターが表示されます。
60 日以上ミュートされている
Downtimes は、計画メンテナンスや予定された停止、システム シャットダウン中にアラートを抑制したり、週末や夜間にアラートを停止したりするのに便利です。ただし、60 日超にわたってミュート (または部分的にミュート) されたままのモニターは、見落としの可能性を示しています。これらのモニターのミュートを解除してアラートを再開し、モニタリング範囲を万全にしましょう。
ダウンタイムの誤構成によりアラートが出ていないモニターを確認し、ミュートを解除します。
モニターに受信者がいない
モニターがアラートや通知を発信する場合、解決してアクションを実行できるチームや担当者に送信する必要があります。モニター通知に受信者が追加されていない場合、サービスの積極性が低下します。受信者がいないモニターを確認するには、Monitor Quality ページを使用します。
遅延が発生していない
クラウドインテグレーション (AWS、Azure、Google Cloud など) からのデータは、各 API からクローラーで取得されます。これらのメトリクスには遅延が発生しますが、モニターの構成で考慮できます。評価遅延がないクラウドデータのモニターは、誤検出でアラートする可能性があります。
クラウドデータをクロールしているが、推奨される遅延がないすべてのモニターを確認してください。クロールされたデータの詳細については、クラウドメトリクスの遅延ページを参照してください。
通知チャンネルの誤構成
@notifications
を使用すると、アラートをインテグレーション、ワークフロー、Datadog ケースに転送するようにモニターをカスタマイズできます。@notifications
が誤構成されていると、期待したアラートが適切なチャンネルに送信されません。
通知チャンネルが誤構成されているモニターを確認し、必要に応じて編集してください。
複合条件モニターに構成要素がない
複合条件モニターは、ユーザー定義のロジックに従って、複数のサブモニター (構成要素) の複合状態を評価します。削除された構成要素を参照する複合条件モニターは、評価も通知も行いません。非アクティブな複合条件モニターを特定し、削除してください。
アラート状態が続いている
ALERT
状態のモニターは、サービス内に問題があり、注意が必要であることを示しています。複数のモニターが常に ALERT
状態にあると、実際に注意を払う必要がある問題から焦点が離れてしまいます。これらのモニターがアラート状態が続いている理由を調査し、それに応じて構成を編集してください。
参考資料