Supported OS
![Linux]()
To find out if this integration is available in your organization, see your Datadog Integrations page or ask your organization administrator.
To initiate an exception request to enable this integration for your organization, email support@ddog-gov.com.
概要
このチェックは、Datadog Agent およびシステムプローブを通じて、OOM(メモリ不足)の強制終了プロセスというカーネルを監視します。
セットアップ
インストール
OOM Killer チェックは Datadog Agent パッケージに含まれています。システムプローブに実装された eBPF プログラムに依存します。
システムプローブにより使用される eBPF プログラムはランタイムでコンパイルされ、適切なカーネルヘッダーへのアクセスを必要とします。
Debian 系のディストリビューションでは、以下のようにカーネルヘッダーをインストールします。
apt install -y linux-headers-$(uname -r)
RHEL 系のディストリビューションでは、以下のようにカーネルヘッダーをインストールします。
yum install -y kernel-headers-$(uname -r)
yum install -y kernel-devel-$(uname -r)
注: OOM Kill チェックが動作するためには カーネルバージョン 4.9 以降が必要です。
また、Windows およびバージョン 8 よりも前の CentOS/RHEL はサポートされません。
構成
Agent のコンフィギュレーションディレクトリのルートにある system-probe.yaml フォルダーで、以下のコンフィギュレーションを追加します。
system_probe_config:
enable_oom_kill: true
OOM Kill メトリクスの収集を開始するには、Agent のコンフィギュレーションディレクトリのルートにある conf.d/ フォルダーの oom_kill.d/conf.yaml ファイルを編集します。使用可能なすべてのコンフィギュレーションオプションについては、oom_kill.d/conf.yaml の例を参照してください。
Agent を再起動します。
Docker でのコンフィギュレーション
上記に従い system-probe.yaml および oom_kill.d/conf.yaml をマウントすることに加え、以下の構成を行います。
以下のボリュームを Agent コンテナにマウントします。
-v /sys/kernel/debug:/sys/kernel/debug
-v /lib/modules:/lib/modules
-v /usr/src:/usr/src
BPF の動作を有効にするために、以下の権限を追加します。
カーネルバージョン 5.8 からは、--privileged パラメーターを --cap-add CAP_BPF に置き換えることができます。
注*: Docker Swarm では --privileged モードはサポートされていません。
Helm のインテグレーション
Datadog Helm チャートを使用し、values.yaml ファイルで datadog.systemProbe と datadog.systemProbe.enableOOMKill のパラメータが有効であることを確認します。
Operator (v1.0.0+) による構成
DatadogAgent マニフェストで features.oomKill.enabled パラメーターを設定します。
apiVersion: datadoghq.com/v2alpha1
kind: DatadogAgent
metadata:
name: datadog
spec:
features:
oomKill:
enabled: true
注: COS (Container Optimized OS) を使用する場合は、ノード Agent で src ボリュームをオーバーライドしてください。
apiVersion: datadoghq.com/v2alpha1
kind: DatadogAgent
metadata:
name: datadog
spec:
features:
oomKill:
enabled: true
override:
nodeAgent:
volumes:
- emptyDir: {}
name: src
検証
Agent の status サブコマンドを実行し、Checks セクションで oom_kill を探します。
収集データ
メトリクス
| |
|---|
oom_kill.oom_process.count (count) | The count of processes OOM killed Shown as process |
サービスチェック
OOM Killer チェックには、サービスのチェック機能は含まれません。
イベント
OOM Killer チェックでは、強制終了されたプロセス ID とプロセス名、そしてトリガーしたプロセス ID とプロセス名を含む、各 OOM Killer のイベントが送信されます。
トラブルシューティング
ご不明な点は、Datadog のサポートチームまでお問い合わせください。