Supported OS
![Linux]()
概要
高性能コンピューティング ワークロードの最適なパフォーマンスと信頼性を確保するには、Oracle Cloud Infrastructure (OCI) GPU インスタンスの監視が不可欠です。このインテグレーションは、gpu_infrastructure_health ネームスペースを通じて包括的な GPU メトリクスを提供し、GPU の健全性と利用状況のさまざまな側面を追跡できるようにします。
このインテグレーションを利用すると、GPU インスタンスの健全性、容量、スループット、状態、パフォーマンスを監視し、アラートを設定できます。
gpu_infrastructure_health ネームスペースからメトリクスとタグを収集します。
セットアップ
Oracle Cloud Infrastructure インテグレーションを設定した後、上記に記載のネームスペースが Connector Hub に含まれていることを確認してください。
収集データ
メトリクス
サービスチェック
OCI GPU にはサービス チェックは含まれません。
イベント
OCI GPU にはイベントは含まれません。
トラブルシューティング
ご不明な点は、Datadog のサポートチームまでお問合せください。