Servidor de métricas Kubernetes
Este check monitoriza Kube_metrics_server v0.3.0+, un componente utilizado por el plano de control de Kubernetes.
Configuración
Instalación
El check de Kube_metrics_server está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tu servidor.
Configuración
Host
Para configurar este check para un Agent que se ejecuta en un host, haz lo siguiente:
Edita el archivo kube_metrics_server.d/conf.yaml
, que se encuentra en la carpeta conf.d/
en la raíz del directorio de configuración del Agent, para empezar a recopilar los datos de rendimiento de kube_metrics_server. Para ver todas las opciones de configuración disponibles, consulta el [ejemplo kube_metrics_server.d/conf.yaml][4].
Reinicia el Agent.
Contenedores
Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican a continuación.
Parámetro | Valor |
---|
<INTEGRATION_NAME> | kube_metrics_server |
<INIT_CONFIG> | en blanco o {} |
<INSTANCE_CONFIG> | {"prometheus_url": "https://%%host%%:443/metrics"} |
SSL
Si tu endpoint es seguro, se requiere una configuración adicional:
Identifica el certificado utilizado para proteger la métrica del endpoint.
Monta el archivo del certificado relacionado en el pod del Agent.
Aplica tu configuración SSL. Para obtener más información, consulta el archivo de configuración predeterminado.
Validación
Ejecuta el subcomando de estado del Agent y busca kube_metrics_server
en la sección Checks:
Datos recopilados
Métricas
kube_metrics_server.authenticated_user.requests (count) | Counter of authenticated requests broken out by username |
kube_metrics_server.go.gc_duration_seconds.count (gauge) | Number of the GC invocation |
kube_metrics_server.go.gc_duration_seconds.quantile (gauge) | GC invocation durations quantiles |
kube_metrics_server.go.gc_duration_seconds.sum (gauge) | GC invocation durations sum |
kube_metrics_server.go.goroutines (gauge) | Number of goroutines that currently exist |
kube_metrics_server.kubelet_summary_request_duration.count (gauge) | Number of Kubelet summary request |
kube_metrics_server.kubelet_summary_request_duration.sum (gauge) | The Kubelet summary request latencies sum |
kube_metrics_server.kubelet_summary_scrapes_total (count) | Total number of attempted Summary API scrapes done by Metrics Server |
kube_metrics_server.manager_tick_duration.count (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.manager_tick_duration.sum (gauge) | The total time spent collecting and storing metrics |
kube_metrics_server.process.max_fds (gauge) | Maximum number of open file descriptors |
kube_metrics_server.process.open_fds (gauge) | Number of open file descriptors |
kube_metrics_server.scraper_duration.count (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_duration.sum (gauge) | Time spent scraping sources |
kube_metrics_server.scraper_last_time (gauge) | Last time metrics-server performed a scrape since unix epoch |
Eventos
kube_metrics_server no incluye eventos.
Checks de servicio
kube_metrics_server.prometheus.health
Returns CRITICAL
if the check cannot access the metrics endpoint.
Statuses: ok, critical
kube_metrics_server.up
Returns CRITICAL
if Kubernetes Metrics Server is not healthy.
Statuses: ok, critical
Solucionar problemas
¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog.