Supported OS Linux Windows Mac OS

Versión de la integración5.0.0

Panel de Consul

Información general

El Datadog Agent recopila muchas métricas de nodos de Consul, incluidas las de:

  • Total de pares de Consul
  • Estado del servicio: para un servicio determinado, ¿cuántos de sus nodos están activos, en transmisión, en advertencia o en estado crítico?
  • Estado del nodo: para un nodo determinado, ¿cuántos de sus servicios están activos, en transmisión, en advertencia o en estado crítico?
  • Coordenadas de red: latencias entre centros de datos y dentro de ellos

El Consul Agent puede proporcionar métricas adicionales con DogStatsD. Estas métricas están más relacionadas con el estado interno de Consul en sí, no con los servicios que dependen de Consul. Hay métricas para:

  • Eventos serf y flaps de miembros
  • Protocolo Raft
  • Rendimiento del DNS

Y muchos más.

Por último, además de las métricas, el Datadog Agent también envía un check de servicio para cada uno de los checks de estado de Consul y un evento después de cada nueva elección de líder.

Configuración

Instalación

El check de Consul del Datadog Agent está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tus nodos de Consul.

Configuración

host

Para configurar este check para un Agent que se ejecuta en un host:

Recopilación de métricas
  1. Edita el archivo consul.d/conf.yaml, en la carpeta conf.d/ en la raíz de tu directorio de configuración del Agent para comenzar a recopilar tus métricas de Consul. Consulta el consul.d/conf.yaml de ejemplo para conocer todas las opciones de configuración disponibles.

    init_config:
    
    instances:
      ## @param url - string - required
      ## Where your Consul HTTP server lives,
      ## point the URL at the leader to get metrics about your Consul cluster.
      ## Use HTTPS instead of HTTP if your Consul setup is configured to do so.
      #
      - url: http://localhost:8500
    
  2. Reinicia el Agent.

OpenMetrics

Opcionalmente, puedes habilitar la opción de configuración use_prometheus_endpoint para obtener un conjunto adicional de métricas del endpoint de Prometheus para Consul.

Nota: Utiliza el método DogStatsD o Prometheus; no habilites ambos para la misma instancia.

  1. Configura Consul para exponer métricas al endpoint de Prometheus. Establece prometheus_retention_time anidado bajo la clave de nivel superior telemetry del archivo de configuración principal de Consul:

    {
      ...
      "telemetry": {
        "prometheus_retention_time": "360h"
      },
      ...
    }
    
  2. Edita el archivo consul.d/conf.yaml, en la carpeta conf.d/ en la raíz de tu directorio de configuración del Agent para empezar a utilizar el endpoint de Prometheus.

    instances:
        - url: <EXAMPLE>
          use_prometheus_endpoint: true
    
  3. Reinicia el Agent.

DogStatsD

En lugar de utilizar el endpoint de Prometheus, puedes configurar Consul para que envíe el mismo conjunto de métricas adicionales al Agent a través de DogStatsD.

  1. Configura Consul para enviar métricas de DogStatsD añadiendo dogstatsd_addr anidado bajo la clave telemetry de nivel superior en el archivo de configuración principal de Consul:

    {
      ...
      "telemetry": {
        "dogstatsd_addr": "127.0.0.1:8125"
      },
      ...
    }
    
  2. Actualiza el archivo de configuración principal del Datadog Agent datadog.yaml añadiendo los siguientes ajustes para garantizar que las métricas se etiquetan correctamente:

    # dogstatsd_mapper_cache_size: 1000  # default to 1000
    dogstatsd_mapper_profiles:
      - name: consul
        prefix: "consul."
        mappings:
          - match: 'consul\.http\.([a-zA-Z]+)\.(.*)'
            match_type: "regex"
            name: "consul.http.request"
            tags:
              method: "$1"
              path: "$2"
          - match: 'consul\.raft\.replication\.appendEntries\.logs\.([0-9a-f-]+)'
            match_type: "regex"
            name: "consul.raft.replication.appendEntries.logs"
            tags:
              peer_id: "$1"
          - match: 'consul\.raft\.replication\.appendEntries\.rpc\.([0-9a-f-]+)'
            match_type: "regex"
            name: "consul.raft.replication.appendEntries.rpc"
            tags:
              peer_id: "$1"
          - match: 'consul\.raft\.replication\.heartbeat\.([0-9a-f-]+)'
            match_type: "regex"
            name: "consul.raft.replication.heartbeat"
            tags:
              peer_id: "$1"
    
  3. Reinicia el Agent.

Recopilación de logs

Disponible para las versiones 6.0 o posteriores del Agent

  1. La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent. Habilítala en tu archivo datadog.yaml con:

    logs_enabled: true
    
  2. Edita este bloque de configuración en tu archivo consul.yaml para recopilar logs de Consul:

    logs:
      - type: file
        path: /var/log/consul_server.log
        source: consul
        service: myservice
    

    Cambia los valores de los parámetros path y service y configúralos para tu entorno. Consulta el consul.d/conf.yaml de ejemplo para conocer todas las opciones de configuración disponibles.

  3. Reinicia el Agent.

En contenedores

Para entornos en contenedores, consulta las plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican a continuación.

Recopilación de métricas
ParámetroValor
<INTEGRATION_NAME>consul
<INIT_CONFIG>en blanco o {}
<INSTANCE_CONFIG>{"url": "https://%%host%%:8500"}
Recopilación de logs

Disponible para las versiones 6.0 o posteriores del Agent

La recopilación de logs está desactivada por defecto en el Datadog Agent. Para activarla, consulta recopilación de logs de Kubernetes.

ParámetroValor
<LOG_CONFIG>{"source": "consul", "service": "<SERVICE_NAME>"}

Validación

[Ejecuta el subcomando de estado del Agent(https://docs.datadoghq.com/agent/guide/agent-commands/#agent-status-and-information) y busca consul en la sección Checks.

Nota: Si tus nodos de Consul tienen habilitado el registro de depuración, el sondeo regular del Datadog Agent se muestra en el log de Consul:

2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/status/leader (59.344us) from=127.0.0.1:53768
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/status/peers (62.678us) from=127.0.0.1:53770
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/health/state/any (106.725us) from=127.0.0.1:53772
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/catalog/services (79.657us) from=127.0.0.1:53774
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/health/service/consul (153.917us) from=127.0.0.1:53776
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/coordinate/datacenters (71.778us) from=127.0.0.1:53778
2017/03/27 21:38:12 [DEBUG] http: Request GET /v1/coordinate/nodes (84.95us) from=127.0.0.1:53780

Consul Agent a DogStatsD

Usa netstat para verificar que Consul también esté enviando sus métricas:

$ sudo netstat -nup | grep "127.0.0.1:8125.*ESTABLISHED"
udp        0      0 127.0.0.1:53874         127.0.0.1:8125          ESTABLISHED 23176/consul

Datos recopilados

Métricas

consul.catalog.nodes_critical
(gauge)
[Integración] El número de nodos registrados con estado de servicio critical
Se muestra como nodo
consul.catalog.nodes_passing
(gauge)
[Integración] El número de nodos registrados con estado de servicio passing
Se muestra como nodo
consul.catalog.nodes_up
(gauge)
[Integración] El número de nodos
Se muestra como nodo
consul.catalog.nodes_warning
(gauge)
[Integración] El número de nodos registrados con estado de servicio warning
Se muestra como nodo
consul.catalog.services_count
(gauge)
[Integración] Métrica para contar el número de servicios que coinciden con criterios como la etiqueta del servicio, el nombre del nodo o el estado. Se puede consultar mediante el agregador sum by.
Se muestra como servicio
consul.catalog.services_critical
(gauge)
[Integración] Total de servicios críticos en los nodos
Se muestra como servicio
consul.catalog.services_passing
(gauge)
[Integración] Total de servicios aprobados en los nodos
Se muestra como servicio
consul.catalog.services_up
(gauge)
[Integración] Total de servicios registrados en los nodos
Se muestra como servicio
consul.catalog.services_warning
(gauge)
[Integración] Total de servicios de alerta en los nodos
Se muestra como servicio
consul.catalog.total_nodes
(gauge)
[Integración] El número de nodos registrados en el clúster de consul
Se muestra como nodo
consul.check.up
(gauge)
Métrica que representa el estado de un check de servicio. Un valor de 0 = no disponible, 1 = aprobado, 2 = advertencia, 3 = crítico.
consul.client.rpc
(count)
[DogStatsD] [Prometheus] Se incrementa cada vez que un agente de Consul en modo cliente hace una solicitud RPC a un servidor de Consul. Esto da una medida de cuánto está cargando un agent dado los servidores de Consul. Esto solo lo generan los agents en modo cliente, no los servidores de Consul.
Se muestra como solicitud
consul.client.rpc.failed
(count)
[DogStatsD] [Prometheus] Se incrementa cada vez que un agente de Consul en modo cliente realiza una solicitud RPC a un servidor de Consul y falla
Se muestra como solicitud
consul.http.request
(gauge)
[DogStatsD] Realiza un seguimiento de cuánto tiempo se tarda en atender la solicitud HTTP dada para el verbo y la ruta dados. Usando un asignador DogStatsD como se describe en el README, las rutas se asignan a etiquetas y no incluyen detalles como nombres de servicio o clave. Para estas rutas, un guión bajo está presente como parámetro, por ejemplo: http_method:GET, path:v1.kv._)
Se muestra como milisegundo
consul.http.request.count
(count)
[Prometheus] Un recuento de cuánto tiempo se tarda en atender la solicitud HTTP dada para el verbo y la ruta dados. Incluye etiquetas para ruta y método. La ruta no incluye detalles como nombres de servicio o clave. Para estas rutas, un guión bajo está presente como parámetro, por ejemplo: path=v1.kv._)
Se muestra como milisegundo
consul.http.request.quantile
(gauge)
[Prometheus] Un cuantil de cuánto tiempo se tarda en atender la solicitud HTTP dada para el verbo y la ruta dados. Incluye etiquetas para ruta y método. La ruta no incluye detalles como nombres de servicio o clave. Para estas rutas, hay un guión bajo como parámetro, por ejemplo: path=v1.kv._)
Se muestra como milisegundo
consul.http.request.sum
(count)
[Prometheus] La suma de lo que se tarda en atender la solicitud HTTP dada para el verbo y la ruta dados. Incluye etiquetas para ruta y método. La ruta no incluye detalles como nombres de servicio o clave. Para estas rutas, un guión bajo está presente como parámetro, por ejemplo: path=v1.kv._)
Se muestra como milisegundo
consul.memberlist.degraded.probe
(gauge)
[DogStatsD] [Prometheus] Esta métrica cuenta el número de veces que el agent de Consul ha realizado la detección de fallos en otro agent a una velocidad de sonda más lenta. El agent utiliza su propia métrica de estado como indicador para realizar esta acción. Si su puntuación de estado es baja, significa que el nodo está en buen estado, y viceversa.
consul.memberlist.gossip.95percentile
(gauge)
[DogStatsD] El p95 para el número de chismes (mensajes) emitidos a un conjunto de nodos seleccionados aleatoriamente.
Se muestra como mensaje
consul.memberlist.gossip.avg
(gauge)
[DogStatsD] Promedio del número de chismes (mensajes) emitidos a un conjunto de nodos seleccionados aleatoriamente.
Se muestra como mensaje
consul.memberlist.gossip.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.memberlist.gossip
consul.memberlist.gossip.max
(gauge)
[DogStatsD] El máximo para el número de chismes (mensajes) difundidos a un conjunto de nodos seleccionados al azar.
Se muestra como mensaje
consul.memberlist.gossip.median
(gauge)
[DogStatsD] La mediana del número de chismes (mensajes) emitidos a un conjunto de nodos seleccionados aleatoriamente.
Se muestra como mensaje
consul.memberlist.gossip.quantile
(gauge)
[Prometheus] El cuantil del número de chismes (mensajes) emitidos a un conjunto de nodos seleccionados aleatoriamente.
Se muestra como mensaje
consul.memberlist.gossip.sum
(count)
[DogStatsD] [Prometheus] La suma del número de chismes (mensajes) emitidos a un conjunto de nodos seleccionados aleatoriamente.
Se muestra como mensaje
consul.memberlist.health.score
(gauge)
[DogStatsD] [Prometheus] Esta métrica describe la percepción de un nodo de su propio estado basado en lo bien que está cumpliendo los requisitos de tiempo real poco restrictivos del protocolo. Esta métrica va de 0 a 8, donde 0 indica “totalmente en buen estado”. Para más detalles, consulta la sección IV del documento de Lifeguard: https://arxiv.org/pdf/1707.00788.pdf
consul.memberlist.msg.alive
(count)
[DogStatsD] [Prometheus] Esta métrica cuenta el número de agents de Consul activos, que el agent ha asignado hasta el momento, basándose en la información de mensajes dada por la capa de red.
consul.memberlist.msg.dead
(count)
[DogStatsD] [Prometheus] Esta métrica cuenta el número de veces que un agent de Consul ha marcado a otro agente como nodo apagado.
Se muestra como mensaje
consul.memberlist.msg.suspect
(count)
[DogStatsD] [Prometheus] El número de veces que un agent de Consul sospecha que otro ha fallado mientras sondea durante el protocolo de gossip.
consul.memberlist.probenode.95percentile
(gauge)
[DogStatsD] El p95 para el tiempo que se tarda en realizar una sola ronda de detección de fallos en un agent selecto de Consul.
Se muestra como nodo
consul.memberlist.probenode.avg
(gauge)
[DogStatsD] Promedio del tiempo necesario para realizar una sola ronda de detección de fallos en un agent seleccionado de Consul.
Se muestra como nodo
consul.memberlist.probenode.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.memberlist.probenode
consul.memberlist.probenode.max
(gauge)
[DogStatsD] El máximo para el tiempo que se tarda en realizar una sola ronda de detección de fallos en un agent selecto de Consul.
Se muestra como nodo
consul.memberlist.probenode.median
(gauge)
[DogStatsD] La mediana del tiempo que se tarda en realizar una sola ronda de detección de fallos en un agent seleccionado de Consul.
Se muestra como nodo
consul.memberlist.probenode.quantile
(gauge)
[Prometheus] El cuantil del tiempo necesario para realizar una única ronda de detección de fallos en un agent de Consul seleccionado.
Se muestra como nodo
consul.memberlist.probenode.sum
(count)
[DogStatsD] [Prometheus] La suma del tiempo necesario para realizar una sola ronda de detección de fallos en un agent de Consul seleccionado.
Se muestra como nodo
consul.memberlist.pushpullnode.95percentile
(gauge)
[DogStatsD] El p95 para el número de agents de Consul que han intercambiado estado con este agent.
Se muestra como nodo
consul.memberlist.pushpullnode.avg
(gauge)
[DogStatsD] La media del número de agents de Consul que han intercambiado estado con este agent.
Se muestra como nodo
consul.memberlist.pushpullnode.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.memberlist.pushpullnode
consul.memberlist.pushpullnode.max
(gauge)
[DogStatsD] El máximo para el número de agents de Consul que han intercambiado estado con este agent.
Se muestra como nodo
consul.memberlist.pushpullnode.median
(gauge)
[DogStatsD] La mediana del número de agents de Consul que han intercambiado estado con este agent.
Se muestra como nodo
consul.memberlist.pushpullnode.quantile
(gauge)
[Prometheus] El cuantil para el número de agents de Consul que han intercambiado estado con este agent.
consul.memberlist.pushpullnode.sum
(count)
[DogStatsD] [Prometheus] La suma del número de agents de Consul que han intercambiado estado con este agent.
consul.memberlist.tcp.accept
(count)
[DogStatsD] [Prometheus] Esta métrica cuenta el número de veces que un agent de Consul ha aceptado una conexión de flujo TCP entrante.
Se muestra como conexión
consul.memberlist.tcp.connect
(count)
[DogStatsD] [Prometheus] Esta métrica cuenta el número de veces que un agent de Consul ha iniciado una sincronización push/pull con otro agent.
Se muestra como conexión
consul.memberlist.tcp.sent
(count)
[DogStatsD] [Prometheus] Esta métrica mide el número total de bytes enviados por un agent de Consul a través del protocolo TCP
Se muestra como byte
consul.memberlist.udp.received
(count)
[DogStatsD] [Prometheus] Esta métrica mide el número total de bytes enviados/recibidos por un agent de Consul a través del protocolo UDP.
Se muestra como byte
consul.memberlist.udp.sent
(count)
[DogStatsD] [Prometheus] Esta métrica mide el número total de bytes enviados/recibidos por un agent de Consul a través del protocolo UDP.
Se muestra como byte
consul.net.node.latency.max
(gauge)
[Integration] Latencia máxima desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.median
(gauge)
[Integration] Mediana de latencia desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.min
(gauge)
[Integration] Latencia mínima desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.p25
(gauge)
[Integración] Latencia P25 desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.p75
(gauge)
[Integración] Latencia P75 desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.p90
(gauge)
[Integración] Latencia P90 desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.p95
(gauge)
[Integración] Latencia P95 desde este nodo a todos los demás
Se muestra en milisegundos
consul.net.node.latency.p99
(gauge)
[Integración] Latencia P99 desde este nodo a todos los demás
Se muestra en milisegundos
consul.peers
(gauge)
[Integración] El número de pares en el conjunto de pares
consul.raft.apply
(count)
[DogStatsD] [Prometheus] El número de transacciones de raft que se producen
Se muestra como transacción
consul.raft.commitTime.95percentile
(gauge)
[DogStatsD] El tiempo p95 que tarda en confirmarse una nueva entrada en el log de raft en el líder
Se muestra como milisegundo
consul.raft.commitTime.avg
(gauge)
[DogStatsD] El tiempo medio que se tarda en consignar una nueva entrada en el log de raft en el líder
Se muestra como milisegundo
consul.raft.commitTime.count
(count)
[DogStatsD] [Prometheus] El número de muestras de raft.commitTime
consul.raft.commitTime.max
(gauge)
[DogStatsD] El tiempo máximo que se tarda en confirmar una nueva entrada en el log de raft en el líder
Se muestra como milisegundo
consul.raft.commitTime.median
(gauge)
[DogStatsD] La mediana del tiempo que se tarda en consignar una nueva entrada en el log de raft en el líder
Se muestra como milisegundo
consul.raft.commitTime.quantile
(gauge)
[Prometheus] El cuantil de tiempo que se tarda en consignar una nueva entrada al log de raft en el líder
Se muestra como milisegundo
consul.raft.commitTime.sum
(count)
[DogStatsD] [Prometheus] La suma del tiempo que se tarda en consignar una nueva entrada al log de raft en el líder
Se muestra como milisegundo
consul.raft.leader.dispatchLog.95percentile
(gauge)
[DogStatsD] El tiempo p95 que tarda el líder en escribir entradas de log en el disco
Se muestra en milisegundos
consul.raft.leader.dispatchLog.avg
(gauge)
[DogStatsD] El tiempo medio que tarda el líder en escribir entradas de log en el disco
Se muestra en milisegundos
consul.raft.leader.dispatchLog.count
(count)
[DogStatsD] [Prometheus] El número de muestras de raft.leader.dispatchLog
consul.raft.leader.dispatchLog.max
(gauge)
[DogStatsD] El tiempo máximo que tarda el líder en escribir entradas de log en el disco
Se muestra como milisegundo
consul.raft.leader.dispatchLog.median
(gauge)
[DogStatsD] El tiempo medio que tarda el líder en escribir entradas de log en el disco
Se muestra en milisegundos
consul.raft.leader.dispatchLog.quantile
(gauge)
[Prometheus] El cuantil de tiempo que tarda el líder en escribir entradas de log en el disco
Se muestra como milisegundo
consul.raft.leader.dispatchLog.sum
(count)
[DogStatsD] [Prometheus] La suma del tiempo que tarda el líder en escribir entradas de log en el disco
Se muestra como milisegundo
consul.raft.leader.lastContact.95percentile
(gauge)
[DogStatsD] El tiempo p95 transcurrido desde la última vez que el líder pudo comprobar su contrato con los seguidores
Se muestra en milisegundos
consul.raft.leader.lastContact.avg
(gauge)
[DogStatsD] Tiempo medio transcurrido desde la última vez que el líder pudo comprobar su contrato con los seguidores
Se muestra en milisegundos
consul.raft.leader.lastContact.count
(count)
[DogStatsD] [Prometheus] El número de muestras de raft.leader.lastContact
consul.raft.leader.lastContact.max
(gauge)
[DogStatsD] Tiempo máximo transcurrido desde la última vez que el líder pudo comprobar su contrato con los seguidores
Se muestra en milisegundos
consul.raft.leader.lastContact.median
(gauge)
[DogStatsD] La mediana del tiempo transcurrido desde que el líder pudo comprobar por última vez su contrato con los seguidores
Se muestra en milisegundos
consul.raft.leader.lastContact.quantile
(gauge)
[Prometheus] El cuantil de tiempo transcurrido desde la última vez que el líder pudo comprobar su contrato con los seguidores
Se muestra como milisegundo
consul.raft.leader.lastContact.sum
(count)
[DogStatsD] [Prometheus] La suma del tiempo transcurrido desde la última vez que el líder pudo comprobar su contrato con los seguidores
Se muestra en milisegundos
consul.raft.replication.appendEntries.logs
(count)
[DogStatsD] [Prometheus] Mide el número de logs replicados a un agente, para acercarlo a los logs del líder.
Se muestra como entrada
consul.raft.replication.appendEntries.rpc.count
(count)
[DogStatsD] [Prometheus] El tiempo que tarda el RFC de append entries en replicar las entradas de log de un agent líder en su(s) agent(s) seguidor(es)
Se muestra en milisegundos
consul.raft.replication.appendEntries.rpc.quantile
(gauge)
[Prometheus] El cuantil que tarda el RFC de append entries en replicar las entradas de log de un agent líder en su(s) agent(s) seguidor(es)
Se muestra en milisegundos
consul.raft.replication.appendEntries.rpc.sum
(count)
[DogStatsD] [Prometheus] La suma el tiempo que tarda el RFC de append entries en replicar las entradas de log de un agent líder en su(s) agent(s) seguidor(es)
Se muestra como milisegundo
consul.raft.replication.heartbeat.count
(count)
[DogStatsD] [Prometheus] Cuenta el tiempo que se tarda en invocar appendEntries en un par.
Se muestra como milisegundo
consul.raft.replication.heartbeat.quantile
(gauge)
[Prometheus] El cuantil del tiempo necesario para invocar appendEntries en un par.
Se muestra como milisegundo
consul.raft.replication.heartbeat.sum
(count)
[DogStatsD] [Prometheus] La suma del tiempo empleado en invocar appendEntries en un par.
Se muestra como milisegundo
consul.raft.state.candidate
(count)
[DogStatsD] [Prometheus]El número de elecciones de líderes iniciados
Se muestra como evento
consul.raft.state.leader
(count)
[DogStatsD] [Prometheus] El número de elecciones de líderes completadas
Se muestra como evento
consul.runtime.gc_pause_ns.95percentile
(gauge)
[DogStatsD] El p95 para el número de nanosegundos consumidos por las pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundo
consul.runtime.gc_pause_ns.avg
(gauge)
[DogStatsD] Promedio del número de nanosegundos consumidos por las pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundo
consul.runtime.gc_pause_ns.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.runtime.gc_pause_ns
consul.runtime.gc_pause_ns.max
(gauge)
[DogStatsD] Máximo número de nanosegundos consumidos por pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundos
consul.runtime.gc_pause_ns.median
(gauge)
[DogStatsD] La mediana del número de nanosegundos consumidos por las pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundos
consul.runtime.gc_pause_ns.quantile
(gauge)
[Prometheus] El cuantil de nanosegundos consumidos por las pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundos
consul.runtime.gc_pause_ns.sum
(count)
[DogStatsD] [Prometheus] La suma de nanosegundos consumidos por las pausas de recolección de elementos no usados (GC) desde que se inició Consul.
Se muestra como nanosegundo
consul.serf.coordinate.adjustment_ms.95percentile
(gauge)
[DogStatsD] El p95 en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.coordinate.adjustment_ms.avg
(gauge)
[DogStatsD] La media en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.coordinate.adjustment_ms.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.serf.coordinate.adjustment_ms
consul.serf.coordinate.adjustment_ms.max
(gauge)
[DogStatsD] El máximo en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.coordinate.adjustment_ms.median
(gauge)
[DogStatsD] La mediana en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.coordinate.adjustment_ms.quantile
(gauge)
[Prometheus] El cuantil en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.coordinate.adjustment_ms.sum
(count)
[DogStatsD] [Prometheus] La suma en milisegundos para el ajuste de coordenadas del nodo
Se muestra como milisegundo
consul.serf.events
(count)
[DogStatsD] [Prometheus] Esto se incrementa cuando un agent de Consul procesa un evento serf
Se muestra como evento
consul.serf.member.failed
(count)
[DogStatsD] [Prometheus] Se incrementa cuando un agent de Consul se marca como eliminado. Esto puede ser un indicador de agents sobrecargados, problemas de red o errores de configuración donde los agents no pueden conectarse entre sí en los puertos requeridos.
consul.serf.member.flap
(count)
[DogStatsD] [Prometheus] Número de veces que un agent de Consul es marcado como eliminado y luego se recupera rápidamente.
consul.serf.member.join
(count)
[DogStatsD] [Prometheus] Se incrementa cuando un agent de Consul procesa un evento de unión
Se muestra como evento
consul.serf.member.left
(count)
[DogStatsD] [Prometheus] Se incrementa cuando un agent de Consul abandona el clúster.
consul.serf.member.update
(count)
[DogStatsD] [Prometheus] Esto se incrementa cuando un agent de Consul se actualiza.
consul.serf.msgs.received.95percentile
(gauge)
[DogStatsD] El p95 para el número de mensajes serf recibidos
Se muestra como mensaje
consul.serf.msgs.received.avg
(gauge)
[DogStatsD] La media del número de mensajes serf recibidos
Se muestra como mensaje
consul.serf.msgs.received.count
(count)
[DogStatsD] [Prometheus] El recuento de mensajes serf recibido
consul.serf.msgs.received.max
(gauge)
[DogStatsD] El máximo de mensajes serf recibidos
Se muestra como mensaje
consul.serf.msgs.received.median
(gauge)
[DogStatsD] La mediana del número de mensajes serf recibidos
Se muestra como mensaje
consul.serf.msgs.received.quantile
(gauge)
[Prometheus] El cuantil para el número de mensajes serf recibido
Se muestra como mensaje
consul.serf.msgs.received.sum
(count)
[DogStatsD] [Prometheus] La suma para el número de mensajes serf recibidos
Se muestra como mensaje
consul.serf.msgs.sent.95percentile
(gauge)
[DogStatsD] El p95 para el número de mensajes serf enviados
Se muestra como mensaje
consul.serf.msgs.sent.avg
(gauge)
[DogStatsD] La media del número de mensajes serf enviados
Se muestra como mensaje
consul.serf.msgs.sent.count
(count)
[DogStatsD] [Prometheus] El recuento de mensajes serf enviados
consul.serf.msgs.sent.max
(gauge)
[DogStatsD] El máximo para el número de mensajes serf enviados
Se muestra como mensaje
consul.serf.msgs.sent.median
(gauge)
[DogStatsD] La mediana del número de mensajes serf enviados
Se muestra como mensaje
consul.serf.msgs.sent.quantile
(gauge)
[Prometheus] El cuantil para el número de mensajes serf enviados
Se muestra como mensaje
consul.serf.msgs.sent.sum
(count)
[DogStatsD] [Prometheus] La suma del número de mensajes serf enviados
Se muestra como mensaje
consul.serf.queue.event.95percentile
(gauge)
[DogStatsD] El p95 para el tamaño de la cola de eventos serf
consul.serf.queue.event.avg
(gauge)
[DogStatsD] El tamaño medio de la cola de eventos serf
consul.serf.queue.event.count
(count)
[DogStatsD] [Prometheus] El número de elementos en la cola de eventos serf.
consul.serf.queue.event.max
(gauge)
[DogStatsD] El tamaño máximo de la cola de eventos serf.
consul.serf.queue.event.median
(gauge)
[DogStatsD] El tamaño medio de la cola de eventos serf
consul.serf.queue.event.quantile
(gauge)
[Prometheus] El cuantil para el tamaño de la cola de eventos serf.
consul.serf.queue.intent.95percentile
(gauge)
[DogStatsD] El p95 para el tamaño de la cola de intento de serf
consul.serf.queue.intent.avg
(gauge)
[DogStatsD] Tamaño medio de la cola de intentos de serf
consul.serf.queue.intent.count
(count)
[DogStatsD] [Prometheus] El número de elementos en la cola de intentos de serf.
consul.serf.queue.intent.max
(gauge)
[DogStatsD] Tamaño máximo de la cola de intentos de serf
consul.serf.queue.intent.median
(gauge)
[DogStatsD] El tamaño medio de la cola de intento de serf
consul.serf.queue.intent.quantile
(gauge)
[Prometheus] El cuantil para el tamaño de la cola de intentos de serf.
consul.serf.queue.query.95percentile
(gauge)
[DogStatsD] El p95 para el tamaño de la cola de consulta de serf
consul.serf.queue.query.avg
(gauge)
[DogStatsD] El tamaño medio de la cola de consultas de serf
consul.serf.queue.query.count
(count)
[DogStatsD] [Prometheus] El número de elementos en la cola de consulta de serf
consul.serf.queue.query.max
(gauge)
[DogStatsD] El tamaño máximo de la cola de consulta de serf.
consul.serf.queue.query.median
(gauge)
[DogStatsD] El tamaño medio de la cola de consultas de serf
consul.serf.queue.query.quantile
(gauge)
[Prometheus] El cuantil para el tamaño de la cola de consulta de serf
consul.serf.snapshot.appendline.95percentile
(gauge)
[DogStatsD] El p95 del tiempo que tarda el agent de Consul en añadir una entrada en el log existente.
Se muestra como milisegundo
consul.serf.snapshot.appendline.avg
(gauge)
[DogStatsD] Promedio del tiempo que tarda el agent de Consul en añadir una entrada al log existente.
Se muestra en milisegundos
consul.serf.snapshot.appendline.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.serf.snapshot.appendline
consul.serf.snapshot.appendline.max
(gauge)
[DogStatsD] El tiempo máximo que tarda el agent de Consul en añadir una entrada al log existente.
Se muestra en milisegundos
consul.serf.snapshot.appendline.median
(gauge)
[DogStatsD] La mediana del tiempo que tarda el agent de Consul en añadir una entrada al log existente.
Se muestra en milisegundos
consul.serf.snapshot.appendline.quantile
(gauge)
[Prometheus] El cuantil del tiempo que tarda el agent de Consul en añadir una entrada en el log existente.
Se muestra como milisegundo
consul.serf.snapshot.compact.95percentile
(gauge)
[DogStatsD] El p95 del tiempo que tarda el agent de Consul en compactar un log. Esta operación solo se produce cuando el snapshot se hace lo suficientemente grande como para justificar la compactación.
Se muestra como milisegundo
consul.serf.snapshot.compact.avg
(gauge)
[DogStatsD] Promedio del tiempo que tarda el agent de Consul en compactar un log. Esta operación solo se produce cuando el snapshot es lo suficientemente grande como para justificar la compactación.
Se muestra en milisegundos
consul.serf.snapshot.compact.count
(count)
[DogStatsD] [Prometheus] El número de muestras de consul.serf.snapshot.compact
consul.serf.snapshot.compact.max
(gauge)
[DogStatsD] El tiempo máximo que tarda el agent de Consul en compactar un log. Esta operación solo se produce cuando el snapshot es lo suficientemente grande como para justificar la compactación.
Se muestra como milisegundos
consul.serf.snapshot.compact.median
(gauge)
[DogStatsD] La mediana del tiempo que tarda el agent de Consul en compactar un log. Esta operación solo se produce cuando el snapshot es lo suficientemente grande como para justificar la compactación.
Se muestra como milisegundos
consul.serf.snapshot.compact.quantile
(gauge)
[Prometheus] El cuantil del tiempo que tarda el agent de Consul en compactar un log. Esta operación solo se produce cuando el snapshot se hace lo suficientemente grande como para justificar la compactación.
Se muestra como milisegundos

Consulta el socumento de telemetría de Consul para una descripción de las métricas que el Agent de Consul envía a DogStatsD.

Consulta el documento de coordenadas de red de Consul para más detalles sobre cómo se calculan las métricas de latencia de red.

Eventos

consul.new_leader:
El Datadog Agent emite un evento cuando el clúster de Consul elige un nuevo líder y lo etiqueta con prev_consul_leader, curr_consul_leader y consul_datacenter.

Checks de servicio

consul.check

Devuelve OK si el servicio está activo, WARNING si hay algún problema y CRITICAL cuando está caído.

Estados: ok, warning, critical, unknown

consul.up

Devuelve OK si el servidor consul está activo, CRITICAL en caso contrario.

Estados: ok, critical

consul.can_connect

Devuelve OK si el Agent puede realizar solicitudes HTTP a consul, CRITICAL en caso contrario.

Estados: ok, critical

consul.prometheus.health

Devuelve CRITICAL si el check no puede acceder al endpoint de métricas; en caso contrario, devuelve OK.

Estados: ok, critical

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el soporte de Datadog.

Referencias adicionales

Documentación útil adicional, enlaces y artículos: