Supported OS Linux Windows

Versión de la integración1.0.0

Información general

Wayfinder es una plataforma de gestión de infraestructura que permite el autoservicio para los desarrolladores a través de una configuración centralizada. Este check monitoriza los componentes clave de gestión de Wayfinder a través del Datadog Agent.

La integración recopila métricas clave del servidor de API de Wayfinder, el controlador, y componentes de webhook. Estas métricas deberían resaltar los problemas en los espacios de trabajo gestionados.

Configuración

Sigue las instrucciones a continuación para instalar la integración en el clúster de gestión de Wayfinder Kubernetes.

Instalación

Para entornos en contenedores, la mejor manera de utilizar esta integración con el Docker Agent es construir el Agent con la integración de Wayfinder instalada.

Requisitos previos:

Un política de red debe configurarse para permitir que el Datadog Agent se conecte a componentes de Wayfinder. La siguiente política de red asume que Datadog está desplegado en el espacio de nombres de Datadog y Wayfinder está desplegado en el espacio de nombres de Wayfinder.

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: datadog-agent
  namespace: wayfinder
spec:
  ingress:
  - from:
    - namespaceSelector:
        matchLabels:
          name: datadog
      podSelector:
        matchLabels:
          app: datadog-agent
    ports:
    - port: 9090
      protocol: TCP
  podSelector:
    matchExpressions:
    - key: name
      operator: In
      values:
      - wayfinder-controllers
      - wayfinder-apiserver
      - wayfinder-webhooks
  policyTypes:
  - Ingress

Para crear una versión actualizada del Agent:

  1. Utiliza el siguiente archivo de Docker:

    FROM gcr.io/datadoghq/agent:latest
    
    ARG INTEGRATION_VERSION=1.0.0
    
    RUN agent integration install -r -t datadog-wayfinder==${INTEGRATION_VERSION}
    
  2. Crea la imagen y envíala a tu registro privado de Docker.

  3. Actualiza la imagen de contenedor del Datadog Agent. Si estás utilizando un Helm chart, modifica la sección agents.image del archivo values.yaml para sustituir la imagen por defecto del Agent:

    agents:
      enabled: true
      image:
        tag: <NEW_TAG>
        repository: <YOUR_PRIVATE_REPOSITORY>/<AGENT_NAME>
    
  4. Utiliza el nuevo archivo values.yaml para actualizar el Agent:

    helm upgrade -f values.yaml <RELEASE_NAME> datadog/datadog
    

Configuración

  1. Edita el archivo wayfinder/conf.yaml, en la carpeta conf.d/ en la raíz del directorio de configuración del Agent para empezar a recopilar tus datos de Wayfinder. Consulta el wayfinder/conf.yaml de muestra para ver todas las opciones de configuración disponibles.

  2. Reinicia el Agent.

Validación

Ejecuta el subcomando de estado del Agent y busca wayfinder en la sección Checks.

Datos recopilados

Métricas

wayfinder.controller_runtime.active_workers
(gauge)
Number of currently used workers per controller.
wayfinder.controller_runtime.max_concurrent_reconciles
(gauge)
Maximum number of concurrent reconciles per controller.
wayfinder.controller_runtime.reconcile_errors_total.count
(count)
Total number of reconciliation errors per controller.
wayfinder.controller_runtime.reconcile_time_seconds.bucket
(count)
Bucket of length of time per reconciliation per controller.
wayfinder.controller_runtime.reconcile_time_seconds.count
(count)
Count of length of time per reconciliation per controller.
wayfinder.controller_runtime.reconcile_time_seconds.sum
(count)
Sum of length of time per reconciliation per controller.
wayfinder.controller_runtime.reconcile_total.count
(count)
A summary of the total controller reconciles.
wayfinder.workqueue.adds_total.count
(count)
Total number of adds handled by workqueue.
wayfinder.workqueue.depth
(gauge)
Current depth of workqueue.
wayfinder.workqueue.queue_duration_seconds.bucket
(count)
Bucket of length of time in seconds an item stays in workqueue before being requested.
wayfinder.workqueue.queue_duration_seconds.count
(count)
Count of time in seconds an item stays in workqueue before being requested.
wayfinder.workqueue.queue_duration_seconds.sum
(count)
Sum of time in seconds an item stays in workqueue before being requested.
wayfinder.workqueue.retries.count
(count)
Total number of retries handled by workqueue.
wayfinder.workqueue.unfinished_work_seconds
(gauge)
How many seconds of work has been done that is in progress and hasn’t been observed by work_duration. Large values indicate stuck threads. One can deduce the number of stuck threads by observing the rate at which this increases.

Checks de servicio

Wayfinder no incluye checks de servicio.

Eventos

Wayfinder no incluye ningún evento.

Resolución de problemas

¿Necesitas ayuda? Ponte en contacto con el soporte de Datadog.