Kubernetes Metrics Server

Supported OS Linux Mac OS Windows

Présentation

Ce check surveille Kube_metrics_server v0.3.0+, qui fait partie du plan de contrôle de Kubernetes.

Configuration

Installation

Le check Kube_metrics_server est inclus dans le package de l’Agent Datadog. Vous n’avez donc rien d’autre à installer sur votre serveur.

Configuration

Host

Pour configurer ce check lorsque l’Agent est exécuté sur un host :

  1. Modifiez le fichier kube_metrics_server.d/conf.yaml dans le dossier conf.d/ à la racine du répertoire de configuration de votre Agent pour commencer à recueillir vos données de performance kube_metrics_server. Consultez le fichier d’exemple kube_metrics_server.d/conf.yaml pour découvrir toutes les options de configuration disponibles.

  2. Redémarrez l’Agent.

Environnement conteneurisé

Consultez la documentation relative aux modèles d’intégration Autodiscovery Kubernetes pour découvrir comment appliquer les paramètres ci-dessous à un environnement conteneurisé.

ParamètreValeur
<NOM_INTÉGRATION>kube_metrics_server
<CONFIG_INIT>vide ou {}
<CONFIG_INSTANCE>{"prometheus_url": "https://%%host%%:443/metrics"}

SSL

Si votre endpoint est sécurisé, une configuration supplémentaire est requise :

  1. Identifiez le certificat utilisé pour sécuriser l’endpoint des métriques.

  2. Montez le fichier de certificat associé dans le pod de l’Agent.

  3. Appliquez votre configuration SSL. Référez-vous au fichier de configuration par défaut pour en savoir plus.

Validation

Lancez la sous-commande status de l’Agent et cherchez kube_metrics_server dans la section Checks.

Données collectées

Métriques

kube_metrics_server.authenticated_user.requests
(count)
Counter of authenticated requests broken out by username
kube_metrics_server.go.gc_duration_seconds.count
(gauge)
Number of the GC invocation
kube_metrics_server.go.gc_duration_seconds.quantile
(gauge)
GC invocation durations quantiles
kube_metrics_server.go.gc_duration_seconds.sum
(gauge)
GC invocation durations sum
kube_metrics_server.go.goroutines
(gauge)
Number of goroutines that currently exist
kube_metrics_server.kubelet_summary_request_duration.count
(gauge)
Number of Kubelet summary request
kube_metrics_server.kubelet_summary_request_duration.sum
(gauge)
The Kubelet summary request latencies sum
kube_metrics_server.kubelet_summary_scrapes_total
(count)
Total number of attempted Summary API scrapes done by Metrics Server
kube_metrics_server.manager_tick_duration.count
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.manager_tick_duration.sum
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.process.max_fds
(gauge)
Maximum number of open file descriptors
kube_metrics_server.process.open_fds
(gauge)
Number of open file descriptors
kube_metrics_server.scraper_duration.count
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_duration.sum
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_last_time
(gauge)
Last time metrics-server performed a scrape since unix epoch

Checks de service

kube_metrics_server.prometheus.health :
Renvoie CRITICAL si l’Agent ne parvient pas à se connecter aux endpoints de métriques.

Événements

kube_metrics_server n’inclut aucun événement.

Dépannage

Besoin d’aide ? Contactez l’assistance Datadog.