Supported OS Linux

To find out if this integration is available in your organization, see your Datadog Integrations page or ask your organization administrator.

To initiate an exception request to enable this integration for your organization, email support@ddog-gov.com.

概要

高性能コンピューティング ワークロードの最適なパフォーマンスと信頼性を確保するには、Oracle Cloud Infrastructure (OCI) GPU インスタンスの監視が不可欠です。このインテグレーションは、gpu_infrastructure_health ネームスペースを通じて包括的な GPU メトリクスを提供し、GPU の健全性と利用状況のさまざまな側面を追跡できるようにします。

このインテグレーションを利用すると、GPU インスタンスの健全性、容量、スループット、状態、パフォーマンスを監視し、アラートを設定できます。

gpu_infrastructure_health ネームスペースからメトリクスとタグを収集します。

セットアップ

Oracle Cloud Infrastructure インテグレーションを設定した後、上記に記載のネームスペースが Connector Hub に含まれていることを確認してください。

収集データ

メトリクス

サービスチェック

OCI GPU にはサービス チェックは含まれません。

イベント

OCI GPU にはイベントは含まれません。

トラブルシューティング

ご不明な点は、Datadog のサポートチームまでお問合せください。