Ignorar los recursos no deseados en APM

Documentos > APM > Guías para el rastreo > Ignorar los recursos no deseados en APM

Un servicio puede administrar una variedad de solicitudes, algunas de las cuales puede que no quieras que se rastreen o se incluyan en las métricas de trazas. Un ejemplo de esto son, posiblemente, los checks de estado en una aplicación web. Esta documentación cubre dos opciones principales: muestreo y filtrado.

Si necesitas ayuda para decidir cuál opción es la más adecuada para tu caso de uso, ponte en contacto con asistencia técnica de Datadog.

Muestreo

Si quieres que el tramo (span) se incluya en las métricas de trazas pero no quieres que se ingiera, utiliza reglas de muestreo. Para obtener más información sobre el muestreo, consulta Controles de ingesta.

Utilización de reglas de muestreo

El enfoque de recomendado consiste en utilizar reglas de muestreo, que permiten muestrear trazas en función de los nombres de los recursos, los nombres de los servicios, las etiquetas (tags) y los nombres de las operaciones:

DD_TRACE_SAMPLING_RULES='[{"resource": "GET healthcheck", "sample_rate": 0.0}]'

O para realizar un muestreo basado en las etiquetas de la URL HTTP:

DD_TRACE_SAMPLING_RULES='[{"tags": {"http.url": "http://.*/healthcheck$"}, "sample_rate": 0.0}]'

Las decisiones de muestreo se determinan utilizando el primer tramo de una traza. Si el tramo que contiene la etiqueta con la que quieres filtrar no es una , esta regla no se aplica.

Filtrado

Si no quieres que se ingiera el tramo y no quiere que se refleje en las métricas de trazas, utiliza el filtrado.

Existen dos formas de especificar que un punto de conexión de este tipo no debe rastrearse y debe excluirse de las métricas de trazas:

Configuración del Trace Agent (en el Datadog Agent) o bien
Configuración del rastreador.

Opciones de configuración del Trace Agent

El componente Trace Agent dentro del Datadog Agent tiene dos métodos para evitar que aparezcan ciertas trazas: ignorar etiquetas de tramos o ignorar recursos. Si se descartan trazas debido a esta configuración, las métricas de trazas excluyen estas solicitudes.

La configuración del Trace Agent para ignorar ciertos tramos o recursos se aplica a todos los servicios que envían trazas a este Datadog Agent particular. Si tienes requisitos específicos de la aplicación, utiliza, en su lugar, el método de Configuración del rastreador.

Ignorar en función de las etiquetas de tramos

Empezando con el Datadog Agent 6.27.0/7.27.0, con la opción filtrar por etiquetas, se descartan trazas con tramos de raíz que coincidan con etiquetas de tramos especificadas. Esta opción se aplica a todos los servicios que envían trazas a este Datadog Agent particular. Las trazas que se descartan debido al filtro por etiquetas no se incluyen en las métricas de trazas.

Si puedes identificar mediante programación un conjunto de trazas que sabes que no quieres enviar a Datadog y ninguna otra opción de esta guía resuelve tu necesidad, puedes considerar añadir una etiqueta de tramo personalizada para poder descartar las trazas. Ponte en contacto con el servicio de soporte técnico para tratar tu caso de uso con más detalle, de modo que Datadog pueda seguir ampliando esta funcionalidad.

La opción de filtrar por etiquetas requiere una coincidencia exacta de las cadenas. Si tu caso de uso requiere ignorar por expresiones regulares, consulta Ignorar en función de los recursos.

Puedes especificar etiquetas de tramos para requerir o rechazar utilizando un lista de claves y valores separados por espacios en variables de entorno:

DD_APM_FILTER_TAGS_REQUIRE: Recopila solo las trazas que tienen tramos de raíz con una coincidencia exacta con las etiquetas de tramos y valores especificados. Si no coincide con esta regla, se descarta la traza. Por ejemplo, DD_APM_FILTER_TAGS_REQUIRE="key1:value1 key2:value2". En el Datadog Agent 7.49+, las expresiones regulares pueden estar provistas de DD_APM_FILTER_TAGS_REGEX_REQUIRE.
DD_APM_FILTER_TAGS_REJECT: Rechaza las trazas que tienen tramos de raíz con una coincidencia exacta con las etiquetas de tramos y valores especificados. Si coincide con esta regla, se descarta la traza. Por ejemplo, DD_APM_FILTER_TAGS_REJECT="key1:value1 key2:value2". En el Datadog Agent 7.49+, las expresiones regulares pueden estar provistas de DD_APM_FILTER_TAGS_REGEX_REJECT.

También las puedes configurar en la configuración del Agent con una lista separada por comas:

datadog.yaml

apm_config:
  filter_tags:
    require: ["db:sql", "db.instance:mysql"]
    reject: ["outcome:success", "key2:value2"]

Por ejemplo, para ignorar comprobaciones de estado donde la http.url coincide con este punto conexión:

datadog.yaml

apm_config:
  filter_tags:
    reject: ["http.url:http://localhost:5050/healthcheck"]

Datadog Operator

datadog-agent.yaml

apiVersion: datadoghq.com/v2alpha1
kind: DatadogAgent
metadata:
  name: datadog
spec:
  override:
    nodeAgent:
      containers:
        trace-agent:
          env:
            - nombre: DD_APM_FILTER_TAGS_REJECT
              valor: tag_key1:tag_val2 tag_key2:tag_val2

After making your changes, apply the new configuration by using the following command:

kubectl apply -n $DD_NAMESPACE -f datadog-agent.yaml

Helm

datadog-values.yaml

agents:
  containers:
    traceAgent:
      env:
        - nombre: DD_APM_FILTER_TAGS_REJECT
          valor: tag_key1:tag_val2 tag_key2:tag_val2

After making your changes, upgrade your Datadog Helm chart using the following command:

helm upgrade -f datadog-values.yaml <RELEASE NAME> datadog/datadog

Al filtrar trazas de esta manera, se eliminan estas solicitudes de las métricas de trazas. Para obtener más información sobre cómo reducir el consumo sin afectar las métricas de trazas, consulta Controles de consumo.

En el backend, Datadog crea y añade las siguientes etiquetas de tramos a los tramos después de la ingesta. Ten en cuenta que estas etiquetas no se pueden utilizar para eliminar trazas a nivel del Datadog Agent, ya que el Agent solo filtra en función de las etiquetas disponibles antes de la ingesta.

Nombre	Descripción
`http.path_group`	La ruta de acceso de URL completa desde la etiqueta `http.url`.
`http.url_details.host`	La parte del nombre de host de la etiqueta `http.url`.
`http.url_details.path`	El destino completo de la solicitud tal y como se pasa en una línea de solicitud HTTP o equivalente.
`http.url_details.scheme`	El esquema de solicitud de la etiqueta `http.url`.
`http.url_details.queryString`	La parte de la cadena de consulta de la etiqueta `http.url`.
`http.url_details.port`	El puerto HTTP de la etiqueta `http.url`.
`http.useragent_details.os.family`	La familia del SO informada por el User-Agent.
`http.useragent_details.browser.family`	La familia de navegadores informada por el User-Agent.
`http.useragent_details.device.family`	La familia de dispositivos informada por el User-Agent.

A partir del 1 de octubre de 2022, el backend de Datadog implementa una reasignación para aplicar la Semántica de etiquetas de tramos en los rastreadores en todos los tramos ingeridos. Si quieres descartar tramos en función de las etiquetas a nivel del Datadog Agent, utiliza las etiquetas de la columna Reasignar desde.

Comunicaciones de red

Nombre	Reasignar desde
`network.host.ip`	`tcp.local.address` - Node.js
`network.destination.ip`	`out.host` - Todos los lenguajes
`network.destination.port`	`grpc.port` - Python `tcp.remote.port` - Node.js `out.port` - Todos los lenguajes

Solicitudes HTTP

Nombre	Reasignar desde
`http.route`	`aspnet_core.route` - .NET `aspnet.route` - .NET `laravel.route` - PHP `symfony.route` - PHP
`http.useragent`	`user_agent` - Java, C++
`http.url_details.queryString`	`http.query.string` - Python

Base de datos

Nombre	Reasignar desde
`db.system`	`db.type` - Java, Python, Node.js, Go `active_record.db.vendor` - Ruby `sequel.db.vendor` - Ruby
`db.instance`	`mongodb.db` - Python `sql.db` - Python `db.name` - Todos los lenguajes
`db.statement`	`cassandra.query` - Go `consul.command` - Python `memcached.query` - Python `mongodb.query` - Python, .NET, Go `redis.command` - Python `redis.raw_command` - Python `sql.query` - Python, PHP, Node.js, Java
`db.row_count`	`cassandra.row_count` - Python `db.rowcount` - Python, PHP `mongodb.rows` - Python `sql.rows` - Python
`db.cassandra.cluster`	`cassandra.cluster` - Python, Go
`db.cassandra.consistency_level`	`cassandra.consistency_level` - Python, Go
`db.cassandra.table`	`cassandra.keyspace` - Python, Go
`db.redis.database_index`	`db.redis.dbIndex` - Java `out.redis_db` - Python, Ruby
`db.mongodb.collection`	`mongodb.collection` - Python, .NET, Ruby, PHP
`db.cosmosdb.container`	`cosmosdb.container` - .NET

Cola de mensajes

Nombre	Reasignar desde
`messaging.destination`	`amqp.destination` - Node.js `amqp.queue` - .NET `msmq.queue.path` - .NET `aws.queue.name` - .NET
`messaging.url`	`aws.queue.url` - .NET, Java
`messaging.message_id`	`server_id` - Go
`messaging.message_payload_size`	`message.size` - .NET, Java
`messaging.operation`	`amqp.command` - .NET `msmq.command` - .NET
`messaging.rabbitmq.routing_key`	`amqp.routing_key` - Java `amqp.routingKey` - Nodes.js
`messaging.rabbitmq.delivery_mode`	`messaging.rabbitmq.exchange` - .NET
`messaging.msmq.message.transactional`	`msmq.message.transactional` - .NET
`messaging.msmq.queue.transactional`	`msmq.queue.transactional` - .NET
`messaging.kafka.consumer_group`	`kafka.group` - Java
`messaging.kafka.tombstone`	`kafka.tombstone` - .NET `tombstone` - Java
`messaging.kafka.partition`	`kafka.partition` - .NET `partition` - Node.js, Go, Java
`messaging.kafka.offset`	`kafka.offset` - .NET
`messaging.msmq.message.transactional`	`msmq.message.transactional` - .NET

Llamadas a procedimientos remotos

Nombre	Reasignar desde
`rpc.service`	`grpc.method.service` - Python, .NET
`rpc.method`	`grpc.method.name` - Python, .NET, Go
`rpc.grpc.package`	`grpc.method.package` - Python, .NET, Go
`rpc.grpc.status_code`	`grpc.code` - Go `status.code` - Python, .NET, Node.js `grpc.status.code` - Python, .NET, Node.js
`rpc.grpc.kind`	`grpc.method.kind` - Python, Node.js, Go, .NET
`rpc.grpc.path`	`rpc.grpc.path` - Python, Node.js, Go, .NET
`rpc.grpc.request.metadata.*`	`grpc.request.metadata.*` - Python, Node.js `rpc.grpc.request.metadata` - Go
`rpc.grpc.response.metadata.*`	`grpc.response.metadata.*` - Python, Node.js

Errores

Nombre	Reasignar desde
`error.message`	`error.msg` - Todos los lenguajes

Ignorar en función de los recursos

La opción ignorar recursos permite excluir recursos si el tramo de raíz global de la traza coincide con determinados criterios. Consulta Excluir recursos de la recopilación. Esta opción se aplica a todos los servicios que envían trazas a este Datadog Agent particular. Las trazas que se descartan porque se ignoran recursos no se incluyen en las métricas de trazas.

Puedes especificar los recursos que deseas ignorar en el archivo de configuración del Agent, datadog.yaml o con la variable de entorno DD_APM_IGNORE_RESOURCES. Consulta los ejemplos siguientes.

Utilización de Datadog.yaml:

datadog.yaml

apm_config:
## @param ignore_resources - lista de cadenas - opcional
## Se puede proporcionar un lista de expresiones regulares para excluir determinados trazas en función del nombre del recurso.
## Todas las entradas deben ir entre comillas dobles y separadas por comas.

  ignore_resources: ["(GET|POST) /healthcheck","API::NotesController#index"]

Utilización de DD_APM_IGNORE_RESOURCES:

DD_APM_IGNORE_RESOURCES="(GET|POST) /healthcheck,API::NotesController#index"

Notas:

Cuando se utiliza el formato de variable de entorno (DD_APM_IGNORE_RESOURCES), los valores deben proporcionarse como una lista de cadenas separadas por comas.
La sintaxis de las expresiones regulares que acepta el Trace Agent se evalúa con expresiones regulares de Go.
Según cuál sea tu estrategia de despliegue, puedes tener que ajustar la expresión regular escapando caracteres especiales.
Si utilizas contenedores dedicados con Kubernetes, asegúrate de que la variable de entorno para la opción de ignorar recursos se esté aplicando al contenedor del Trace-Agent.

Ejemplo

Considera una traza que contiene llamadas a /api/healthcheck desde la cual no quieres ver trazas:

Gráfica de llamas de un recurso que quieres que el rastreador ignore

Toma nota del nombre del recurso del tramo de raíz global.

Nombre de la operación: rack.request
Nombre del recurso: Api::HealthchecksController#index
Http.url: /api/healthcheck

Para utilizar correctamente la opción de ignorar recurso, la regla de la expresión regular escrita debe coincidir con el nombre del recurso, Api::HealthchecksController#index. Existen varias opciones de expresiones regulares posibles, pero para filtrar trazas desde este recurso tal como está, una posible expresión regular que puedes utilizar es Api::HealthchecksController#index$.

Según cuál sea tu forma de despliegue, la sintaxis será un poco diferente:

datadog.yaml

apm_config:
  ignore_resources: Api::HealthchecksController#index$

Para valores múltiples:

apm_config:
  ignore_resources: ["value1","Api::HealthchecksController#index$"]

En la lista de variables de entorno del contenedor del Datadog Agent, añade DD_APM_IGNORE_RESOURCES con un patrón como el del ejemplo siguiente. Docker Compose tiene su propia sustitución de variables para tener en cuenta cuando utilices caracteres especiales como $.

    environment:
      // otras variables de entorno del Datadog Agent
      - DD_APM_IGNORE_RESOURCES=Api::HealthchecksController#index$$

Para valores múltiples:

    environment:
      // otras variables de entorno del Datadog Agent
      - DD_APM_IGNORE_RESOURCES="value1","Api::HealthchecksController#index$$"

En tu comando Docker run para hacer girar el Datadog Agent, añade DD_APM_IGNORE_RESOURCES:

docker run -d --name datadog-agent \
              --cgroupns host \
              --pid host \
              -v /var/run/docker.sock:/var/run/docker.sock:ro \
              -v /proc/:/host/proc/:ro \
              -v /sys/fs/cgroup/:/host/sys/fs/cgroup:ro \
              -e DD_API_KEY=<> \
              -e DD_APM_IGNORE_RESOURCES="Api::HealthchecksController#index$" \
              -e DD_APM_ENABLED=true \
              -e DD_APM_NON_LOCAL_TRAFFIC=true \
              gcr.io/datadoghq/agent:latest

Para valores múltiples:

              -e DD_APM_IGNORE_RESOURCES=["value1","Api::HealthchecksController#index$"] \

En el contenedor del Trace Agent dedicado, añade la variable de entorno DD_APM_IGNORE_RESOURCES:

    - nombre: trace-agent
        imagen: "gcr.io/datadoghq/agent:latest"
        imagePullPolicy: IfNotPresent
        comando: ["trace-agent", "-config=/etc/datadog-agent/datadog.yaml"]
        recursos: {}
        puertos:
        - containerPort: 8126
          hostPort: 8126
          nombre: traceport
          protocolo: TCP
        env:
        - nombre: DD_API_KEY
          valueFrom:
            secretKeyRef:
              nombre: "datadog-secret"
              clave: api-key
        - nombre: DD_KUBERNETES_KUBELET_HOST
          valueFrom:
            fieldRef:
              fieldPath: status.hostIP
        - nombre: KUBERNETES
          valor: "yes"
        - nombre: DOCKER_HOST
          valor: unix:///host/var/run/docker.sock
        - nombre: DD_LOG_LEVEL
          valor: "INFO"
        - nombre: DD_APM_ENABLED
          valor: "true"
        - nombre: DD_APM_NON_LOCAL_TRAFFIC
          valor: "true"
        - nombre: DD_APM_RECEIVER_PORT
          valor: "8126"
        - nombre: DD_KUBELET_TLS_VERIFY
          valor: "false"
        - nombre: DD_APM_IGNORE_RESOURCES
          valor: "Api::HealthchecksController#index$"

Para valores múltiples:

        - nombre: DD_APM_IGNORE_RESOURCES
          valor: '"value1","Api::HealthchecksController#index$"'

En la sección traceAgent del archivo values.yaml, añade DD_APM_IGNORE_RESOURCES en la sección env y, a continuación, haz girar helm como de costumbre.

values.yaml

    traceAgent:
      # agents.containers.traceAgent.env -- Variables de entorno adicionales para el contenedor del trace-agent container
      env:
        - name: DD_APM_IGNORE_RESOURCES
          value: Api::HealthchecksController#index$

Para valores múltiples:

        - nombre: DD_APM_IGNORE_RESOURCES
          valor: value1, Api::HealthchecksController#index$

También puedes configurar agents.containers.traceAgent.env en el comando helm install:

helm install dd-agent -f values.yaml \
  --set datadog.apiKeyExistingSecret="datadog-secret" \
  --set agents.containers.traceAgent.env[0].name=DD_APM_IGNORE_RESOURCES, \
    agents.containers.traceAgent.env[0].value="Api::HealthchecksController#index$" \
  datadog/datadog

Si utilizas Amazon ECS (como en EC2), en tu definición del contenedor del Datadog Agent, añade la variable de entorno DD_APM_IGNORE_RESOURCES con los valores necesarios para que el JSON evalúe de la siguiente manera:

    "environment": [
    // other environment variables for the Datadog Agent
        {
          "name": "DD_APM_IGNORE_RESOURCES",
          "value": "Api::HealthchecksController#index$"
        }
     ]

Al filtrar las trazas de esta manera se eliminan estas solicitudes de las métricas de trazas. Para obtener información sobre cómo reducir la ingesta sin afectar a las métricas de trazas, consulta los controles de ingestión.

Opciones de configuración del rastreador

Algunos de los rastreadores específicos del lenguaje tienen una opción para modificar tramos antes de que se envíen al Datadog Agent. Utiliza esta opción si tienes requisitos específicos de la aplicación y utilizas uno de los lenguajes que se enumeran a continuación.

1. Si la solicitud está asociada a una traza distribuida, la traza resultante puede tener imprecisiones de muestreo si se descartan partes de ella debido a estas reglas de filtrado.
2. Al filtrar las trazas de esta manera se eliminan estas solicitudes de las métricas de trazas. Para obtener información sobre cómo reducir la ingesta sin afectar a las métricas de trazas, consulta los controles de ingesta.

El rastreador de Ruby tiene un pipeline de posprocesamiento que elimina trazas que cumplen ciertos criterios. Puedes obtener más información y ejemplos en Trazas de posprocesamiento.

Por ejemplo, si el nombre del recurso es Api::HealthchecksController#index, utiliza la clase Datadog::Tracing::Pipeline::SpanFilter para eliminar trazas que contengan el nombre del recurso. Este filtro también puede utilizarse para hacer coincidir otros metadatos disponibles para el objeto de tramo.

Datadog::Tracing.before_flush(
   Datadog::Tracing::Pipeline::SpanFilter.new { |span| span.resource =~ /Api::HealthchecksController#index/ }
)

El rastreador Python ofrece una opción para filtrar los traces (trazas) no deseadas:

Uso de filtros personalizados

Para casos de uso avanzados, puedes crear filtros personalizados:

from ddtrace.trace import tracer
from ddtrace.trace import TraceFilter
import re

class CustomFilter(TraceFilter):
    def __init__(self, pattern):
        self.pattern = re.compile(pattern)

    def process_trace(self, trace):
        for span in trace:
            if span.get_tag('http.url') and self.pattern.match(span.get_tag('http.url')):
                return None  # Drop the trace
        return trace  # Keep the trace

# Configure the tracer with your custom filter
tracer.configure(trace_processors=[CustomFilter(r'http://.*/healthcheck$')])

Configura una lista de bloqueados en la extensión Http. Toma nota de las coincidencias de la lista de bloqueados en los documentos de la API. Por ejemplo, las solicitudes Http entrantes coinciden con las rutas de acceso URL, entonces, si la etiqueta de tramo http.url de la traza es http://<domain>/healthcheck, escribe una regla de acceso que coincida con la URL healthcheck:

const tracer = require('dd-trace').init();
tracer.use('http', {
  // incoming http requests match on the path
  server: {
    blocklist: ['/healthcheck']
  },
  // outgoing http requests match on a full URL
  client: {
    blocklist: ['https://telemetry.example.org/api/v1/record']
  }
})

//import http

La configuración del rastreador para la integración debe venir antes de que se importe ese módulo instrumentado.

El rastreador de Java tiene una opción para que un TraceInterceptor personalizado filtre determinados tramos. Consulta Ampliar los rastreadores.

Por ejemplo, si el nombre de tu recurso es GET /healthcheck, escribe un interceptor de trazas que descarte trazas que contengan este nombre del recurso. Ajusta la lógica para adaptarla a tu caso de uso.

public class GreetingController {
   static {
       // En un bloque estático de clase para evitar inicializar muchas veces.
       GlobalTracer.get().addTraceInterceptor(new TraceInterceptor() {
           @Override
           public Collection<? extends MutableSpan> onTraceComplete(Collection<? extends MutableSpan> trace) {
               para (MutableSpan span : trace) {
                   si ("GET /healthcheck".contentEquals(span.getResourceName())) {
                       devolver Collections.emptyList();
                   }
               }
               devolver traza;
           }
           @Override
           public int priority() {
               devolver 200;  // Algún número único
           }
       });
   }
}

Ignorar los recursos no deseados en APM

Muestreo

Utilización de reglas de muestreo

Filtrado

Opciones de configuración del Trace Agent

Ignorar en función de las etiquetas de tramos

Datadog Operator

Helm

Comunicaciones de red

Solicitudes HTTP

Base de datos

Cola de mensajes

Llamadas a procedimientos remotos

Errores

Ignorar en función de los recursos

Ejemplo

Opciones de configuración del rastreador

Uso de filtros personalizados

How can I help you today?