Servidor de métricas Kubernetes

Supported OS

Versión de la integración3.3.1

Información general

Este check monitoriza Kube_metrics_server v0.3.0+, un componente utilizado por el plano de control de Kubernetes.

Configuración

Instalación

El check de Kube_metrics_server está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tu servidor.

Configuración

Host

Para configurar este check para un Agent que se ejecuta en un host, haz lo siguiente:

  1. Edita el archivo kube_metrics_server.d/conf.yaml, que se encuentra en la carpeta conf.d/ en la raíz del directorio de configuración del Agent, para empezar a recopilar los datos de rendimiento de kube_metrics_server. Para ver todas las opciones de configuración disponibles, consulta el [ejemplo kube_metrics_server.d/conf.yaml][4].

  2. Reinicia el Agent.

Contenedores

Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican a continuación.

ParámetroValor
<INTEGRATION_NAME>kube_metrics_server
<INIT_CONFIG>en blanco o {}
<INSTANCE_CONFIG>{"prometheus_url": "https://%%host%%:443/metrics"}

SSL

Si tu endpoint es seguro, se requiere una configuración adicional:

  1. Identifica el certificado utilizado para proteger la métrica del endpoint.

  2. Monta el archivo del certificado relacionado en el pod del Agent.

  3. Aplica tu configuración SSL. Para obtener más información, consulta el archivo de configuración predeterminado.

Validación

Ejecuta el subcomando de estado del Agent y busca kube_metrics_server en la sección Checks:

Datos recopilados

Métricas

kube_metrics_server.authenticated_user.requests
(count)
Counter of authenticated requests broken out by username
kube_metrics_server.go.gc_duration_seconds.count
(gauge)
Number of the GC invocation
kube_metrics_server.go.gc_duration_seconds.quantile
(gauge)
GC invocation durations quantiles
kube_metrics_server.go.gc_duration_seconds.sum
(gauge)
GC invocation durations sum
kube_metrics_server.go.goroutines
(gauge)
Number of goroutines that currently exist
kube_metrics_server.kubelet_summary_request_duration.count
(gauge)
Number of Kubelet summary request
kube_metrics_server.kubelet_summary_request_duration.sum
(gauge)
The Kubelet summary request latencies sum
kube_metrics_server.kubelet_summary_scrapes_total
(count)
Total number of attempted Summary API scrapes done by Metrics Server
kube_metrics_server.manager_tick_duration.count
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.manager_tick_duration.sum
(gauge)
The total time spent collecting and storing metrics
kube_metrics_server.process.max_fds
(gauge)
Maximum number of open file descriptors
kube_metrics_server.process.open_fds
(gauge)
Number of open file descriptors
kube_metrics_server.scraper_duration.count
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_duration.sum
(gauge)
Time spent scraping sources
kube_metrics_server.scraper_last_time
(gauge)
Last time metrics-server performed a scrape since unix epoch

Eventos

kube_metrics_server no incluye eventos.

Checks de servicio

kube_metrics_server.prometheus.health
Returns CRITICAL if the check cannot access the metrics endpoint.
Statuses: ok, critical

kube_metrics_server.up
Returns CRITICAL if Kubernetes Metrics Server is not healthy.
Statuses: ok, critical

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog.