Datadog サービスカタログ

概要

Datadog サービスカタログは、所有権メタデータ、パフォーマンスインサイト、セキュリティ分析、コスト配分などを統合し、サービス全体を一つのビューで提供します。これにより、組織はスケールに応じたエンドツーエンドのサービス所有権を簡単に実現し、リアルタイムのパフォーマンスインサイトを取得し、信頼性やセキュリティリスクを検出・対応し、アプリケーションの依存関係を一元的に管理することができます。

ユースケース

サービスの発見

  • Datadog サービスカタログには、APM、USM、RUM から発見されたすべてのサービスがデフォルトで含まれています。これらの製品を使用している場合、カタログは事前にエントリで満たされています。
  • 環境内のさまざまなアプリケーションをインスツルメントすると、それらは自動的にサービスカタログに追加されます。

依存関係のマッピングと管理

  • APM、USM、RUM によって収集されたアプリケーションのテレメトリーにより、アップストリームとダウンストリームのすべての依存関係を自動的に文書化し、追跡する。
  • コンポーネント間の依存関係を手動で宣言する (メタデータスキーマ v3.0で利用可能)。
  • チーム間およびサービス間のパフォーマンス影響を理解し、評価する。

ガバナンスと最適化

  • サービススコアカードを通じて、エンジニアリング担当の幹部社員に、チームやサービス全体のベストプラクティスの概要を提供する。
  • サービスの依存関係の中に存在する既知のセキュリティ脆弱性を見つけて修正することで、アプリケーションのリスクを低減する。
  • サービスに関連するコストの傾向を把握し、非効率性を特定する。

知識の共有

  • 数多くのリポジトリ、チャンネル、ドキュメントページを探し回ることなく、情報を見つける。
  • 新しいチームメンバーのオンボーディング時にランブックや wiki ページの検索時間を短縮する。
  • リアルタイムで自動生成されるトポロジーマップを活用して、システムのアーキテクチャを理解する。

モニタリングカバー範囲を評価

インシデント発生中のコラボレーションをスムーズに

  • 正しい所有者情報とコミュニケーションチャンネルを確立し、モニタリングとトラブルシューティングの詳細へのアクセスを合理化することで、すべての人のオンコール経験を向上させる。
  • エンジニアが既に使用している可観測性ツールに、ランブックやドキュメントなどのソリューションやトラブルシューティングツールへのリンクを直接埋め込む。
  • 信頼性を高め、上流と下流のサービスや依存関係の所有者を簡単に特定することで、インシデントの復旧をスピードアップする。

はじめに

サービスカタログの提供内容をご確認ください。


ロールベースアクセスおよび権限

一般的な情報は、ロールベースアクセスコントロールおよびロール権限を参照してください。

読み取り権限

サービスカタログの読み取り権限により、サービスカタログのデータを読み取ることができ、以下の機能が有効になります。

  • サービスカタログ一覧
  • Discover UI
  • サービス定義エンドポイント: /api/v2/services/definition/<service_name>

この権限は、Datadog Read Only Role および Datadog Standard Role でデフォルトで有効になっています。

書き込み権限

サービスカタログの書き込み権限は、ユーザーがサービスカタログのデータを変更することを許可します。書き込み権限は、以下の機能に対して必要です。

  • POST /api/v2/services/definitions エンドポイントを使ったサービス定義の挿入または更新
  • DELETE /api/v2/services/definition/<service_name> エンドポイントを使ったサービス定義の削除
  • Discover Services UI でオンボーディングプロセスを完了する
  • UI でのサービスメタデータの更新

この権限は、Datadog Admin Role および Datadog Standard Role でデフォルトで有効になっています。

サービスタイプ

アプリケーションによって監視されるすべてのサービスは、タイプに関連付けられています。Datadog は、受信したスパンデータに付けられた span.type 属性に基づいて、このタイプを自動的に決定します。このタイプは、Datadog Agent が統合しているアプリケーションやフレームワークの名前を指定します。

たとえば、Flask の公式インテグレーションを使用している場合は、Type が “Web” にセットされ、カスタムアプリケーションを監視している場合は、Type が “Custom” にセットされます。

サービスのタイプは次のいずれかに設定されます。

  • Cache
  • Custom
  • DB
  • サーバーレス関数
  • Web

いくつかのインテグレーションは、タイプのエイリアスになります。例えば、Postgres、MySQL、Cassandraは “DB” というタイプに対応します。Redis と Memcache のインテグレーションは、“Cache” というタイプにマッピングされます。

データ保持

サービスリストサービスページのサービスとリソースの統計、およびスパンのサマリーは、最大で 30 日間保持されます。APM トレースメトリクスをカスタムクエリするには、メトリクスエクスプローラーを使用してください。APM のデータ保持の詳細はこちら

参考資料