Ce check permet de surveiller les processus tués par le mécanisme OOM Killer (Out of Memory Killer) du kernel par l’intermédiaire de l’Agent Datadog et du system probe.
Configuration
Installation
Le check OOM Kill est inclus avec le package de l’Agent Datadog. Il repose sur un programme eBPF intégré au system probe.
Le programme eBPF utilisé par le system probe est compilé au runtime. Vous devez avoir accès aux en-têtes de kernel appropriés.
Sur les distributions dérivées de Debian, installez les en-têtes de kernel à l’aide de la commande suivante :
apt install -y linux-headers-$(uname -r)
Sur les distributions dérivées de RHEL, installez les en-têtes de kernel à l’aide de la commande suivante :
Remarque : pour que le check OOM Kill fonctionne, vous devez utiliser la version 4.11+ du kernel. De plus, seules les versions 8 et ultérieures de Windows, Container-Optimized OS et CenOS/RHEL sont prises en charge.
Configuration
Dans le fichier system-probe.yaml situé à la racine du répertoire de configuration de votre Agent, ajoutez la configuration suivante :
system_probe_config:enable_oom_kill:true
Vérifiez que le fichier oom_kill.d/conf.yaml figure bien dans le dossier conf.d/ à la racine du répertoire de configuration de votre Agent pour commencer à recueillir vos métriques OOM Kill. Consultez le fichier d’exemple oom_kill.d/conf.yaml découvrir toutes les options de configuration disponibles.
À l’aide du chart Helm Datadog, vérifiez que les paramètres datadog.systemProbe et datadog.systemProbe.enableOOMKill sont activés dans le fichier values.yaml.
The count of processes OOM killed Shown as process
Checks de service
Le check OOM Kill n’inclut aucun check de service.
Événements
Le check OOM Kill envoie un événement pour chaque OOM Kill. Celui-ci inclut l’ID et le nom du processus éliminé, ainsi que l’ID et le nom du processus à l’origine du déclenchement.