- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
Data Streams Monitoring は、大規模なパイプラインを理解し管理するための標準的な方法を提供し、以下を容易にします。
まずは、インストールの説明に従って、Data Streams Monitoring でサービスを構成してください。
ランタイム | 対応テクノロジー |
---|---|
Java | Kafka (セルフホスティング、Amazon MSK、Confluent Cloud / Platform)、RabbitMQ、HTTP、gRPC |
.NET | Kafka (セルフホスティング、Amazon MSK、Confluent Cloud / Platform)、RabbitMQ |
Python | Kafka (セルフホスティング、Amazon MSK、Confluent Cloud / Platform)、Amazon SQS |
Go | 全て (手動インスツルメンテーションで) |
Data Streams Monitoring を構成すると、非同期システム内の任意の 2 点間をイベントが通過するのにかかる時間を測定することができます。
メトリクス名 | 注目タグ | 説明 |
---|---|---|
data_streams.latency | start 、end 、env | 指定された送信元から宛先までの経路のエンドツーエンドのレイテンシー |
data_streams.kafka.lag_seconds | consumer_group 、partition 、topic 、env | プロデューサーとコンシューマーとの間のラグ (秒単位)。Java Agent v1.9.0 以降が必要。 |
また、これらのメトリクスを任意のダッシュボードやノートブックでグラフ化し、視覚化することができます。
イベントがシステム内をどのように通過するかによって、異なる経路でレイテンシーが増加する可能性があります。Pathways タブでは、キュー、プロデューサー、コンシューマーを含むパイプラインの任意の 2 点間のレイテンシーを表示し、ボトルネックの特定とパフォーマンスの最適化を行うことができます。経路のモニターを簡単に作成したり、ダッシュボードにエクスポートすることができます。
消費型サービスでの遅延の増加、Kafka ブローカーでのリソース使用の増加、RabbitMQ または Amazon SQS のキューサイズの増加は、隣接するサービスがこれらのエンティティに生成またはエンティティから消費する方法の変更によって、頻繁に説明されます。
Data Streams Monitoring の任意のサービスやキューで Throughput タブをクリックすると、スループットの変化と、その変化がどの上流または下流のサービスに起因するものかを迅速に検出できます。サービスカタログを構成すると、対応するチームの Slack チャンネルやオンコールエンジニアにすぐにピボットすることができます。
単一の Kafka、RabbitMQ または Amazon SQS のクラスターにフィルターをかけることで、そのクラスター上で動作するすべての検出されたトピックまたはキューについて、送受信トラフィックの変化を検出することができます。
Datadog は、統合サービスタグ付けを通して、サービスを駆動するインフラストラクチャーと関連するログを自動的にリンクするので、ボトルネックを簡単に特定することができます。経路のレイテンシーやコンシューマーの遅延が増加した理由をさらにトラブルシューティングするには、Infra または Logs タブをクリックします。経路内のトレースを表示するには、Processing Latency タブをクリックします。