- 重要な情報
- はじめに
- 用語集
- ガイド
- エージェント
- インテグレーション
- OpenTelemetry
- 開発者
- API
- CoScreen
- アプリ内
- Service Management
- インフラストラクチャー
- アプリケーションパフォーマンス
- 継続的インテグレーション
- ログ管理
- セキュリティ
- UX モニタリング
- 管理
Datadog の Kubernetes Resource Utilization ビューは、Kubernetes ワークロードがインフラストラクチャー全体のコンピューティングリソースをどのように使用しているかの洞察を提供します。これにより、リソースの使用状況を把握し、サイジングやキャパシティプランニングについてより良い意思決定を行うことができるほか、CPU やメモリの無駄を削減することができます。
リソースのリクエストと制限がポッドの現在の使用量とどの程度一致しているかのステータスが常に更新されるため、Kubernetes クラスター内のビンパッキングを改善できます。
Datadog で、Infrastructure > Kubernetes に進み、Resource Utilization タブを選択します。
ページは Pods で開き、デフォルトでは kube_cluster_name
、kube_namespace
、kube_deployment
でグループ化されています。
CPU とメモリのサイジングの最適化は、通常別々に行われます。表のデータは、CPU と ** Memory** のトグルで分割されています。
右上の Customize ボタンを使用して、表示する他の列を選択します。色分けは、ポッドの過不足プロビジョニングの程度を反映します。
行をクリックするとサイドパネルが開き、各グループの CPU とメモリのデータの組み合わせ、各ポッドまたはコンテナの詳細グラフ、ポッドのトップリストが表示されます。
個々のポッドまたはコンテナのグラフは、負荷の不均衡が発生した場合にグループに影響を与える可能性のある外れ値を特定するのに役立ちます。デフォルトでは、グラフは pod_name
でグループ化され、個々のポッドが表示されます。これを kube_container_name
でグループ化するように変更すると、マルチコンテナポッドの場合にどのコンテナがプロビジョニングの過不足に最も貢献しているかを特定できます。
アイドル状態の CPU とメモリは、ポッドがすぐにスロットルされたり強制終了されたりすることなく、アプリケーションが拡張できる余地を確保するために必要です。
アイドル状態の CPU やメモリが多すぎると、不必要にコストが高くなる可能性がありますが、反対の場合、リソースの使用量が増えれば、パフォーマンスや信頼性が低下するリスクが生じます。
このバランスを見つけるために、グラフを調整してより長いタイムスパンを見ます。最新の使用量のみに基づいてリソースのサイジングを決定することは避けてください。これらのメトリクスは標準的な Kubernetes メトリクスであるため、他の Datadog メトリクスと同様にクエリすることができます (たとえば、過去 15 か月について、必要に応じて最大解像度で)。
リクエストや制限が設定されていないコンテナを含む少なくとも 1 つのポッドを含むグループのメトリクスは表示されません。これは、リクエストや制限がないと Datadog が使用率を推測できないためです。メトリクスのないこれらのグループは、並べ替え順序に関係なく最後に表示されます。
グループのリソースリクエストと制限の合計は、そのグループに属するリソースの状態とは無関係です。これらの値は、関連するメトリクスグラフに表示される値とは異なる場合があります。
お役に立つドキュメント、リンクや記事: