概要
Datadog Cloud Network Monitoring (CNM) は、サービス、コンテナ、アベイラビリティ ゾーン、および Datadog の任意のタグ間のネットワーク トラフィックに対する可視性を提供します。CNM を有効にすると、CNM モニターを作成し、設定したしきい値を TCP ネットワーク メトリクスが超えた場合にアラートを受け取れます。たとえば、特定のクライアント / サーバー 間のネットワーク スループットを監視し、そのスループットがしきい値を超えたときにアラートを受け取れるようにできます。
モニターの作成
Datadog で CNM モニターを作成するには、メイン ナビゲーション: Monitors –> New Monitor –> Cloud Network を使用します。
検索クエリを定義する
- CNM アナリティクス の検索バーと同じロジックで検索クエリを構築します。
- クライアントとサーバーをグループ化するためのタグを選択します。
- N/A トラフィックを表示するか非表示にするかを選択します。
- ドロップダウン リストから測定したいメトリクスを選択します。既定では、モニターは選択したメトリクスの合計を測定します。CNM モニターで利用可能なメトリクスは メトリクス定義 を参照してください。
- クエリに含める結果の上限を設定します。
数式と関数の使用
CNM モニターは数式と関数を使って作成できます。たとえば、クライアントとサーバー間のスループットに基づくモニターを作成できます。
次の例は、クライアントからサーバーへの再送信率を計算するための数式の使用例です。
詳細は Functions ドキュメントを参照してください。
メトリクス定義
以下の表は、CNM で作成できるさまざまなメトリクスを示します。
Volume
| メトリクス名 | 定義 |
|---|
| Bytes Received | クライアントから受信したバイト数。 |
| Bytes Sent | クライアントから送信したバイト数。 |
| Packets Sent | クライアントから送信したパケット数。 |
TCP
| メトリクス名 | 定義 |
|---|
| 再送回数 | クライアント / サーバー 間の再送信数。 |
| レイテンシー | 接続を確立するまでの平均時間。 |
| RTT (Round-Trip Time) | 応答を受信するまでの平均時間。 |
| ジッター | RTT の平均ばらつき。 |
| TCP タイムアウト | オペレーティング システムの観点でタイムアウトした TCP 接続の数。これは一般的な接続性やレイテンシの問題を示す可能性があります。 |
| TCP 拒否 | サーバーにより拒否された TCP 接続の数。通常これは、接続を受け付けていない IP/ ポート への接続試行、またはファイアウォール / セキュリティ の設定ミスを示します。 |
| TCP リセット | サーバーによりリセットされた TCP 接続の数。 |
| Established Connections | クライアント / サーバー 間で確立された接続数。 |
| クローズされた接続の数 | クライアント / サーバー 間でクローズされた接続数。 |
DNS
| メトリクス名 | 定義 |
|---|
| DNS Requests | DNS リクエストの合計数。 |
| DNS 失敗 | DNS 失敗の合計数。 |
| DNS Timeouts | DNS タイムアウトの合計数。 |
| DNS Failed Responses | DNS 失敗応答の合計数。 |
| DNS Successful Responses | DNS 成功応答の合計数。 |
| DNS Failure Latency | 平均 DNS 失敗レイテンシ。 |
| DNS Success Latency | 平均 DNS 成功レイテンシ。 |
| NXDOMAIN Errors | NXDOMAIN エラーの合計数。 |
| SERVFAIL Errors | SERVFAIL エラーの合計数。 |
| Other Errors | その他のエラーの合計数。 |
アラートの条件を設定する
クエリ値がしきい値を超えたときにトリガーするようモニターを構成し、復旧しきい値や評価の遅延などの高度なアラート オプションをカスタマイズします。詳細は Monitors の設定 を参照してください。
通知
Configure notifications and automations (通知と自動化の構成) セクションの詳しい説明は、通知のページをご覧ください。
一般的なモニター
以下は、CNM で作成を開始できる一般的なモニターです。これらはネットワークを追跡し、異常なトラフィックや予期しないネットワーク動作が発生している可能性がある場合にアラートを受けるための良い出発点となります。
スループット モニター
このモニターは、クエリで指定した 2 つのエンドポイント間のスループットがしきい値を超えた場合にアラートします。スループットを監視することで、ネットワーク帯域幅を踏まえてネットワークが容量の限界に近づいているかどうかを判断できます。これを把握しておくと、ボトルネックや下流へのその他の影響を回避するためにネットワークを調整する時間を確保できます。
再送信率
再送信はパケットが破損または損失した際に発生し、信頼性の低いネットワークを示します。再送信率モニターは、送信パケット総数に対する再送信の割合がしきい値を超えた場合にアラートします。
DNS 失敗
DNS 失敗モニターは DNS サーバーのパフォーマンスを追跡し、サーバー側およびクライアント側の DNS 問題の特定に役立ちます。このモニターを使用して、DNS 失敗の合計がしきい値を超えた場合にアラートします。
その他の参考資料