Supported OS Linux

概要

高性能コンピューティング ワークロードの最適なパフォーマンスと信頼性を確保するには、Oracle Cloud Infrastructure (OCI) GPU インスタンスの監視が不可欠です。このインテグレーションは、gpu_infrastructure_health ネームスペースを通じて包括的な GPU メトリクスを提供し、GPU の健全性と利用状況のさまざまな側面を追跡できるようにします。

このインテグレーションを利用すると、GPU インスタンスの健全性、容量、スループット、状態、パフォーマンスを監視し、アラートを設定できます。

gpu_infrastructure_health ネームスペースからメトリクスとタグを収集します。

セットアップ

Oracle Cloud Infrastructure インテグレーションを設定した後、上記に記載のネームスペースが Connector Hub に含まれていることを確認してください。

収集データ

メトリクス

サービスチェック

OCI GPU にはサービス チェックは含まれません。

イベント

OCI GPU にはイベントは含まれません。

トラブルシューティング

ご不明な点は、Datadog のサポートチームまでお問合せください。