- 重要な情報
- アプリ内
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
検索結果を調整して特定のエンドポイント間を追跡するには、ネットワーク集約接続を集計してタグでフィルタリングを行います。ページ上部の検索バーから、source および destination に対するタグを選択できます。
以下のスクリーンショットは、source と destination を service
タグで集計した場合のデフォルト表示です。テーブル内の各行が、1 時間の範囲内で集計されたサービス間集約接続に相当します。
次の例は、us-east-1
リージョン内のサービスを表す IP アドレスからアベイラビリティーゾーンまでのすべての集約接続を示しています。
ページの右上にあるタイムセレクターから、集計対象となるトラフィックに応じたタイムフレームを設定できます。
ファセットパネルには検索バーのクエリ内にあるタグが反映されます。画面上の Source と Destination タブでファセットパネルの切り替えが可能です。
Datadog ネットワークページでは、タグを使用してトラフィックデータを集計およびフィルタリングできます。タグのリストは、検索バーのドロップダウンメニューからデフォルトで利用可能です。
リスト済みのタグには service
、availability zone
、env
、environment
、pod
、host
、ip
、port
などがあります。メニューに含まれていないタグで集計またはフィルタリングを行う場合は、該当のタグをカスタムファセットとして追加してください。
+
を選択します。Create
をクリックします。カスタムファセットが作成されたら、このタグを使ってネットワークページとマップ内トラフィックのフィルタリングおよび集計を行います。すべてのカスタムファセットはファセットパネル下部の Custom
セクションに表示されます。
複数文字のワイルドカード検索を実行するには、*
記号を次のように使用します。
service:web*
は、web で始まるすべてのサービスに一致しますservice:*web
は web で終わるすべてのサービスに一致しますservice:*web*
は web という文字列を含むすべてのサービスに一致しますワイルドカード検索は、この構文を使用してファセット内で機能します。次のクエリは、文字列 mongo で終わるすべてのサービスを返します。
service:*mongo
詳しくは、検索構文のドキュメントを参照してください。
ネットワークメトリクスはグラフと関連するテーブルを用いて表示されます。送受信されたメトリクスの表示はすべて、ソース側から見た場合のデータとなります。
パケットが大量にドロップされた場合は、sent_metric
(ソースから宛先へ) と received_metric
(宛先からソースへ) の表示値が異なることがあります。destination
から source
に送られた大量のバイトは、destination
由来の集約接続に含まれます。しかし、この場合に source
由来の集約接続がこのバイトを「受信した」とみなすことはありません。
注: デフォルトの収集インターバルは 5 分で、保存期間は 7 日です。
以下のネットワークロードメトリクスが利用可能です。
メトリクス | 説明 |
---|---|
ボリューム | ある期間中に送受信されたバイト数。バイトを単位として (またはその大きさ順で) 双方向に測定されます。 |
スループット | ある期間中に送受信されたバイトのレート。バイトを単位として毎秒、双方向に測定されます。 |
TCP は順序通りのパケット配信を実施するためのコネクション型プロトコルです。以下の TCP メトリクスが利用可能です。
メトリクス | 説明 |
---|---|
TCP Retransmits | TCP 再送回数は検出された失敗回数 (配信確認のため再送が行われます) を示すものです。source からの再送回数で測定されます。 |
TCP Latency | TCP のスムージングされたラウンドトリップ時間として、つまり送信される TCP フレームと確認されたフレーム間の時間で測定されます。 |
TCP Jitter | TCP のスムージングされたラウンドトリップ時間の変動として測定されます。 |
Established Connections | 確立された状態の TCP 接続の数。source からの接続/秒で測定されます。 |
Closed Connections | 閉じた状態の TCP 接続の数。source からの接続/秒で測定されます。 |
S3 や Kinesis などのマネージドクラウドサービスに依存している場合は、内部アプリケーションからこれらのサービスへのトラフィックのパフォーマンスを監視できます。ビューを特定の AWS または GCP の依存関係にスコープして、レイテンシーを特定し、データベースのパフォーマンスを評価し、ネットワークをより完全に視覚化します。
たとえば、次のことができます。
service:aws.s3
へのデータフローを視覚化する。NPM は自動的に、
s3_bucket
で分類できる)、RDS (rds_instance_type
で分類できる)、Kinesis、ELB、Elasticache、その他の AWS サービスにマッピングします。Agent をインストールできない他のエンドポイント (パブリック API など) を監視するには、domain
タグでネットワーク概要の宛先をグループ化します。
Agent 7.17+ 以降において、Agent は IP を解決して外部および内部トラフィックで判読可能なドメイン名に転換できるようになりました。ドメインは、S3 バケット、アプリケーションロードバランサー、API など、Datadog Agent のインストールができないクラウドプロバイダーのエンドポイントを監視する場合に役立ちます。C&C サーバーの DGA ドメインなど、認識不能なドメイン名はネットワークのセキュリティ脅威につながる恐れがあります。domain
は Datadog 内のタグとしてエンコードされているため、検索バーのクエリやファセットパネルでそれを使用してトラフィックの集計とフィルタリングを行うことができます。
注: DNS 解決は、システムプローブがルートネットワークのネームスペースで稼働しているホストでサポートされています。通常、ホストネットワークを使用せずにコンテナ内でシステムプローブを稼働させているケースがよくみられます。
NAT は、Kubernetes とその他のシステムでコンテナ間のトラフィックをルートするために使用されるツールです。(サービス間などの) 特定の依存関係を調査する場合は、pre-NAT IP の存在可否によってそのサービスが Kubernetes ネイティブのサービス (独自のルーティングを使用) か、外部クライアントに依存してルーティングを行っているサービスか否かを判断できます。この機能では現在、NAT ゲートウェイの解決を行うことはできません。
pre-NAT および post-NAT IP を確認するには、テーブル設定から Show pre-NAT IPs トグルを使用します。この設定のトグルを外した場合に、Source IP および Dest IP 列にデフォルトで表示されている IP はすべて post-NAT IP となります。ひとつの post-NAT IP に対して複数の pre-NAT IP が存在する場合は、最も一般的な pre-NAT IP のトップ 5 が表示されます。その他の製品と同様、pre_nat.ip
タグを使用してトラフィックの集計とフィルタリングを行うことができます。
NPM ユーザーは、IP スペースが重複するようにネットワークを構築できます。たとえば、アドレス範囲が重複する複数の VPC(仮想プライベートクラウド)にデプロイし、ロードバランサーまたはクラウドゲートウェイを介してのみ通信したい場合があります。
トラフィックの宛先を正しく分類するため、NPM はタグとして表されるネットワーク ID の概念を使用します。ネットワーク ID とは、相互通信が可能な一連の IP アドレスを表す英数字の識別子です。異なるネットワーク ID を持つ複数のホストにマッピングされた IP アドレスが検出されると、この識別子を使用して特定のホストのネットワークトラフィックの送信先や送信元を判断します。
AWS や GCP では、ネットワーク ID は自動的に VPC ID に設定されます。他の環境でネットワーク ID を設定するには、次のように datadog.yaml
で手動で設定するか、プロセスおよびコア Agent コンテナに DD_NETWORK_ID
を追加します。
network:
Id: <your-network-id>
トラフィックデータのビューを整理し共有します。保存済みビューを使用すると、デバッグをすばやく行いコラボレーションを強化できます。たとえば、作成したビューを、今後の共通クエリのために保存し、リンクをコピーしてチームメイトとネットワークデータを共有できます。
詳しくは、保存済みビューのドキュメントを参照してください。
ネットワークテーブルには、クエリで定義された各 source と destination の ボリューム、スループット、TCP 再送回数、ラウンドトリップ時間 (RTT)、_RTT 変動_メトリクスの詳細が表示されます。
表の右上にある Customize
ボタンを使い、表中の列を設定できます。
Filter Traffic
ボタンで、表示するトラフィックを設定します。
外部トラフィック (公開 IP へ) と Datadog Agent トラフィックはデフォルトで表示されます。表示を絞り込むには、Show Datadog Traffic
および Show External Traffic
をオフにします。
未解決のソースおよび宛先タグは N/A
とマークされます。トラフィックソースまたは宛先エンドポイントは、以下の理由で未解決となることがあります。
データテーブル右上の Show N/A (Unresolved Traffic) トグルを使用して、未解決の (N/A
) ソースまたは宛先に紐付く集約接続をフィルタリングすることができます。
データテーブルの任意の行を選択すると、対象の source <=> destination 集約接続に関連するログ、トレース、プロセスが表示されます。
サイドパネルは、ネットワーク依存関係のデバッグに役立つコンテキストテレメトリを提供します。Flows、Logs、Traces、Processes タブを使用して、2 つのエンドポイント間のトラフィックの再送信数またはレイテンシーの増加の原因が次であるかどうかを判別します。
サイドパネルの上部には、検査された依存関係の最新の接続で共有されている一般的なソースタグと宛先タグが表示されます。一般的なタグを使用して、障害のあるエンドポイントに関する追加のコンテキストを取得します。たとえば、特定のサービスへの潜在的な通信をトラブルシューティングする場合、一般的な宛先タグによって次が浮上します。