Supported OS Linux Windows Mac OS

Versión de la integración1.0.0

Información general

Este check lleva las estimaciones de uso de energía de las cargas de trabajo de Kuberenetes de Kepler a Datadog.

Configuración

Instalación

Para las versiones del Agent 7.21+/6.21+, sigue las instrucciones a continuación para instalar el check de Kepler en tu host. Consulta Uso de integraciones de la comunidad para realizar la instalación con el Docker Agent o versiones anteriores del Agent.

  1. Ejecute el siguiente comando para instalar la integración:

    datadog-agent integration install -t datadog-kepler==<INTEGRATION_VERSION>
    
  2. Configura tu integración de forma similar a las [integraciones] núcleo(https://github.com/DataDog/integrations-extras/blob/master/kepler/datadog_checks/kepler/data/conf.yaml.example).

Configuración

  1. Edita el archivo kepler.d/conf.yaml, en la carpeta conf.d/ en la raíz del directorio de configuración del Agent para empezar a recopilar los datos de rendimiento de tu kepler. Consulta el kepler.d/conf.yaml de ejemplo para conocer todas las opciones de configuración disponibles.

  2. Reinicia el Agent.

Validación

Ejecuta el subcomando de estado del Agent y busca kepler en la sección Checks.

Datos recopilados

Métricas

kepler.container.usage.bpf_cpu_time.count
(count)
Valor agregado en el valor bpf_cpu_time_ms de bpf
kepler.container.usage.bpf_net_rx_irq.count
(count)
Valor agregado en el valor bpf_net_rx_irq de bpf
kepler.container.usage.bpf_net_tx_irq.count
(count)
Valor agregado en el valor bpf_net_tx_irq de bpf
kepler.container.usage.bpf_page_cache_hit.count
(count)
Valor agregado en el valor bpf_page_cache_hit de bpf
kepler.container.usage.cache_miss.count
(count)
Valor agregado en el valor cache_miss de bpf
kepler.container.usage.core_joules.count
(count)
Valor agregado en el valor central de trained_power_model
kepler.container.usage.cpu_cycles.count
(count)
Valor agregado en el valor cpu_cycles de bpf
kepler.container.usage.cpu_instructions.count
(count)
Valor agregado en el valor cpu_instructions de bpf
kepler.container.usage.dram_joules.count
(count)
Valor agregado en el valor de dram de trained_power_model
kepler.container.usage.gpu_joules.count
(count)
Valor agregado en el valor de gpu de nvidia
kepler.container.usage.joules.count
(count)
Valor agregado en el valor de julios de
kepler.container.usage.package_joules.count
(count)
Valor agregado en el valor de paquete de trained_power_model
kepler.container.usage.platform_joules.count
(count)
Valor agregado en el valor de plataforma de trained_power_model
kepler.container.usage.task_clock.count
(count)
Valor agregado en el valor task_clock_ms de bpf
kepler.container.usage.uncore_joules.count
(count)
Valor agregado en el valor de uncore de trained_power_model
kepler.exporter.build_info
(gauge)
Una métrica con un valor constante ‘1’ etiquetado por versión, revisión, rama, goversion desde la que se construyó kepler_exporter, y los goos y goarch para la compilación.
kepler.node.usage.dram_joules.count
(count)
Valor agregado en el valor dram de trained_power_model
kepler.node_info.count
(count)
Valor agregado en el valor de os
kepler.node.usage.platform_joules.count
(count)
Valor agregado en el valor de plataforma de trained_power_model
kepler.node.usage.uncore_joules.count
(count)
Valor agregado en el valor uncore de trained_power_model
kepler.container.usage.bpf_block_irq.count
(count)
Valor agregado en el valor bpf_block_irq de bpf
kepler.container.usage.other_joules.count
(count)
Valor agregado en otro valor de trained_power_model
kepler.node.usage.core_joules.count
(count)
Valor agregado en el valor central de trained_power_model
kepler.node.usage.package_joules.count
(count)
Valor agregado en el valor de paquete de trained_power_model
kepler.promhttp.metric.handler.errors.count
(count)
Número total de errores internos encontrados por el gestor de métricas promhttp.

Checks de servicio

kepler.openmetrics.health

Devuelve CRITICAL si el Agent no puede conectarse al endpoint de Kepler OpenMetrics, en caso contrario devuelve OK.

Estados: ok, critical

Eventos

Kepler no incluye eventos.

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el soporte de Datadog.