- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
ネットワーキングで説明したように、Datadog では、1 つのリージョンにつき 1 つの Observability Pipelines Worker アグリゲーターで始めることを推奨しています。これは、Observability Pipelines Worker の最初のデプロイを複雑にしすぎないためですが、複数のデプロイで開始することが理想的な場合もあります。
**公衆インターネット上でのデータ送信を防止する。**複数のクラウドやリージョンがある場合、インターネット上に大量のデータを送信しないように、それぞれのクラウドやリージョンに Observability Pipelines Worker アグリゲーターをデプロイしてください。Observability Pipelines Worker アグリゲーターは、内部データを受け取り、そして、ネットワークの単一の出口点として機能する必要があります。
**独立した管理。**それぞれのユースケースに対して Observability Pipelines Worker アグリゲーターを独立して運用・管理できるチームがある場合です。例えば、データサイエンスチームは、独自のインフラストラクチャーを運用する責任があり、独自の Observability Pipelines Worker アグリゲーターを独立して運用する手段を持っている場合があります。
多くのユーザーは、VPC とクラスターを内部に持つ複数のクラウドアカウントを持っています。Datadog はこのような場合でも、1 つのリージョンに 1 つの Observability Pipelines Worker アグリゲーターを導入することを推奨しています。Observability Pipelines Worker をユーティリティやツールのクラスターにデプロイし、すべてのクラウドアカウントがこのクラスターにデータを送信するように構成します。詳細については、ネットワーキングを参照してください。
Kafka のようなパブリッシュ・サブスクライブ (Pub-Sub) システムを使用することは、アーキテクチャを高可用性または高耐久性にするために必須ではありませんが (高可用性と災害復旧を参照)、次のような利点があります。
**信頼性の向上。**Pub-Sub システムは、高い信頼性と耐久性を持ち、頻繁に変更されることのないシステムとして設計されています。マネージドオプションを使用している場合は特に信頼性が高くなります。Observability Pipelines Worker は、その目的から頻繁に変更される可能性があります。Observability Pipelines Worker のダウンタイムを Pub-Sub システムの背後に分離することで、クライアントの認識から可用性を高め、復旧をよりシンプルにすることができます。
**ロードバランサーが不要。**Pub-Sub システムは、ロードバランサーを必要としません。Pub-Sub システムがコンシューマーの調整を行うため、Observability Pipelines Worker を簡単に水平にスケールすることができます。
パーティショニング (Kafka 用語では「トピック」) とは、Pub-Sub システム内のデータを分離することを指します。データを生成したサービスやホストなど、データの起点に沿ったパーティショニングを行う必要があります。
Pub-Sub システムを使用する場合、Datadog は、Observability Pipelines Worker の以下の構成変更を推奨しています。
このセクションでは、レガシーの宛先に対してグローバル計算を実行するための推奨事項を説明します。最新の宛先は、すでにグローバル計算をサポートしています。例えば、Datadog は、メトリクスデータのグローバルな観測を解決するディストリビューション (DDSketch など) をサポートしています。
グローバル集計とは、リージョン全体のデータを集計する機能です。例えば、CPU 負荷平均のグローバル分位を計算することができます。これを実現するには、1 つの Observability Pipelines Worker インスタンスが、すべてのノードの CPU 負荷平均統計にアクセスできる必要があります。これは水平スケーリングでは不可能です。個々の Observability Pipelines Worker インスタンスは、全体のデータのスライスにしかアクセスすることができません。したがって、集計は階層化する必要があります。
上の図では、第 2 層のアグリゲーターは、第 1 層のアグリゲーターから全体データの集計されたサブストリームを受け取っています。これにより、単一のインスタンスが、ストリーム全体を処理することなく、また単一障害点を導入することなく、グローバルビューを取得することができます。