Comprender la política de retención de Datadog para retener eficazmente los datos de traza

Ingerir y retener las trazas que te interesan

La mayoría de las trazas (traces) generadas por tus aplicaciones son repetitivas, y no es necesariamente relevante ingerirlas y retenerlas a todas. En el caso de las solicitudes satisfactorias, basta con conservar una muestra representativa del tráfico de tus aplicaciones, ya que no es posible analizar decenas de solicitudes rastreadas cada segundo.

Las más importante son las trazas que contienen indicios de posibles problemas en tu infraestructura, es decir, trazas con errores o latencia inusual. Además, para endpoints específicos que son críticos para tu negocio, es posible que desees retener el 100% del tráfico, para asegurarte de investigar y solucionar cualquier problema del cliente en detalle.

 Las trazas relevantes se retienen al almacenar una combinación de trazas de alta latencia, trazas de errores y trazas críticas para el negocio.

Cómo la política de retención de Datadog te ayuda a retener lo importante

Datadog ofrece dos formas principales de retener los datos por más de 15 minutos:

Datadog captura trazas de errores y latencia relevantes mediante el filtro de retención inteligente, y trazas críticas para el negocio mediante filtros de retención personalizados.

Algoritmo de muestreo de diversidad: filtro de retención inteligente

Por defecto, el filtro de retención inteligente mantiene una selección representativa de trazas sin necesidad de crear decenas de filtros de retención personalizados.

Conserva al menos un tramo (y la traza distribuida asociada) para cada combinación de environment, service, operation y resource cada 15 minutos como máximo para los percentiles de latencia p75, p90 y p95, así como una selección representativa de errores, para cada código de estado de respuesta distinto.

Para saber más, lee la documentación del filtro de retención inteligente.

Filtros de retención basados en etiquetas

Los filtros de retención basados en etiquetas proporcionan la flexibilidad necesaria para conservar las trazas más importantes para tu empresa. Cuando se indexan tramos con filtros de retención, también se almacena la traza asociada, lo que asegura que se mantenga la visibilidad de toda la solicitud y su contexto distribuido.

Búsqueda y análisis eficaces de datos de tramo indexados

El conjunto de datos recopilados por el muestreo de diversidad no está muestreado de forma uniforme (es decir, no es proporcionalmente representativo del tráfico completo). Está sesgado hacia los errores y las trazas de alta latencia. Si deseas hacer un análisis solo sobre un conjunto de datos muestreados de forma uniforme, excluye estos tramos que se muestrean por razones de diversidad añadiendo el parámetro de consulta -retained_by:diversity_sampling en el Trace Explorer.

Por ejemplo, para medir el número de operaciones de pago agrupadas por nivel de comerciante en tu aplicación, excluir el conjunto de datos de muestreo de diversidad asegura que realizas este análisis sobre un conjunto de datos representativo, y así las proporciones de pagos basic, enterprise y premium son realistas:

Número de operaciones de pago por nivel, análisis que excluye los datos de muestreo de diversidad

Por otro lado, si deseas medir el número de comerciantes únicos por nivel de comerciante, incluye el conjunto de datos de muestreo de diversidad que podría capturar IDs de comerciantes adicionales no detectados por los filtros de retención personalizados:

Número de comerciantes por nivel, análisis que incluye los datos de muestreo de diversidad

Más enlaces, artículos y documentación útiles: