Pipelines

Documentos > Gestión de logs > Configuración de log > Pipelines

Información general

Los pipelines y procesadores descritos en esta documentación son específicos de los entornos de generación de logs basados en la nube. Para agregar, procesar y enrutar logs on-premises, consulta Observability Pipelines.

Datadog analiza automáticamente logs con formato JSON. Luego, puedes añadir valor a todos tus logs (sin procesar y JSON), enviándolos a un pipeline de procesamiento. Los pipelines aceptan logs con una amplia variedad de formatos y los traducen a un formato común en Datadog. Implementar una estrategia de pipelines y de procesamiento de logs es beneficioso, ya que introduce una convención de nomenclatura de atributos para tu organización.

Los pipelines analizan y enriquecen los logs encadenándolos secuencialmente mediante procesadores. De este modo, se extraen detalles significativos o atributos del texto semiestructurado para reutilizarlos como facetas. Cada log que pasa por los pipelines se prueba con todos los filtros de pipelines. Si el log coincide con un filtro, todos los procesadores se aplican secuencialmente antes de pasar al siguiente.

Los pipelines y los procesadores pueden aplicarse a cualquier tipo de log. No es necesario modificar la configuración de la gestión de logs, ni implementar cambios en ninguna regla de procesamiento del lado del servidor. Todo puede configurarse en la página de configuración de pipelines.

Nota: Para un uso óptimo de la solución Log Management, Datadog recomienda utilizar como máximo 20 procesadores por pipeline y 10 reglas de análisis sintáctico en un procesador Grok. Datadog se reserva el derecho de desactivar reglas de análisis, procesadores o pipelines que no rindan lo suficiente y que puedan afectar al rendimiento del servicio de Datadog.

Permisos de pipelines

Los pipelines utilizan el Control de acceso detallado para gestionar quién puede editar configuraciones de pipelines y procesadores. Esto significa que los permisos pueden ser asignados a roles, usuarios individuales y equipos, asegurando un control preciso de los recursos de pipelines. Los pipelines sin ninguna restricción se consideran sin irrestrictos, lo que significa que cualquier usuario con el permiso logs_write_pipelines puede modificar el pipeline y sus procesadores.

Para cada pipeline, los administradores pueden elegir los siguientes contextos de edición:

Editor: Solo los usuarios, equipos o roles especificados pueden editar la configuración de pipelines y procesadores.
Editor de procesadores: Solo los procesadores (incluidos los pipelines anidados) pueden ser editados por usuarios, equipos o roles especificados. Nadie puede modificar los atributos de un pipeline, como su consulta de filtro o su orden en la lista global de pipelines.

Conceder a un usuario acceso a una lista de restricciones de pipelines no concede automáticamente los permisos logs_write_pipelines o logs_write_processors. Los administradores deben conceder estos permisos por separado.

Puedes gestionar estos permisos mediante programación a través de la API y Terraform.

Preprocesamiento

El preprocesamiento de logs JSON se produce antes de que los logs ingresen al pipeline de procesamiento. El preprocesamiento ejecuta una serie de operaciones basadas en atributos reservados, como timestamp, status, host, service y message. Si tienes diferentes nombres de atributos en tus logs JSON, utiliza el preprocesamiento para asignar tus nombres de atributos de logs a los de la lista de atributos reservados.

El preprocesamiento de logs JSON viene con una configuración predeterminada que funciona para los reenviadores de logs estándar. Para editar esta configuración y adaptar las estrategias de reenvío de logs personalizados o específicos:

Ve a Pipelines en Datadog y selecciona Preprocesamiento de logs de JSON.
Nota: El preprocesamiento de logs JSON es la única manera de definir uno de los atributos de tus logs como host para tus logs.
Cambia la asignación por defecto en función del atributo reservado:

Atributo de origen

Si un archivo de log con formato JSON incluye el atributo ddsource, Datadog interpreta su valor como el origen del log. Para utilizar los mismos nombres de origen que Datadog, consulta la biblioteca de pipelines de integración.

Nota: Los logs procedentes de un entorno contenedorizado requieren el uso de una variable de entorno para anular los valores por defecto del origen y del servicio.

Atributo de host

El uso de Datadog Agent o del formato RFC5424 configura automáticamente el valor del host en tus logs. Pero si un archivo de log con formato JSON incluye el siguiente atributo, Datadog interpreta su valor como el host del log:

host
hostname
syslog.hostname

Nota: En Kubernetes, si un log JSON ingestado por Datadog Agent contiene un atributo de clave host, hostname o syslog.hostname, ese valor anula el nombre de host del Agent predeterminado para ese log. Como resultado, el log no hereda las etiquetas (tags) esperadas a nivel de host, que se establecen a nivel de host, del host correcto. En este caso, Datadog recomienda borrar estos atributos para asegurar que tus logs puedan ser atribuidos a los hosts correctos.

Atributo de fecha

Por defecto, Datadog genera una marca de tiempo y la añade a un atributo de fecha cuando se reciben logs. Pero si un archivo de log con formato JSON incluye uno de los siguientes atributos, Datadog interpreta su valor como la fecha oficial del log:

@timestamp
timestamp
_timestamp
Timestamp
eventTime
date
published_date
syslog.timestamp

Especifica los atributos alternativos que se utilizarán como origen de la fecha del log, configurando un procesador del reasignador de fechas de logs.

Nota: Datadog rechaza una entrada de log si su fecha oficial es anterior a las 18 horas pasadas.

Los formatos de fecha reconocidos son: ISO8601, UNIX (el formato EPOCH de milisegundos) y RFC3164.

Atributo de mensaje

Por defecto, Datadog ingiere el valor del mensaje como cuerpo de la entrada del log. Ese valor se resalta y se muestra en el Log Explorer, donde se indexa para la búsqueda de texto completo. Sin embargo, si un archivo de log con formato JSON incluye uno de los siguientes atributos, Datadog interpreta su valor como el mensaje oficial del log:

message
msg
log

Especifica los atributos alternativos que se utilizarán como origen del mensaje del log, configurando un procesador del reasignador de mensajes de logs.

Atributo de estado

Cada entrada de log puede especificar un nivel de estado disponible para las búsqueda por facetas en Datadog. Pero si un archivo de log con formato JSON incluye uno de los siguientes atributos, Datadog interpreta su valor como el estado oficial del log:

status
severity
level
syslog.severity

Especifica los atributos alternativos que se utilizarán como origen del estado del log, configurando un procesador del reasignador de estados de logs.

Atributo de servicio

El uso de Datadog Agent o del formato RFC5424 configura automáticamente el valor del servicio en tus logs. Pero si un archivo de log con formato JSON incluye el siguiente atributo, Datadog interpreta su valor como el servicio del log:

service
syslog.appname
dd.service

Especifica los atributos alternativos que se utilizarán como origen del servicio del log, configurando un procesador del reasignador de servicios de logs.

Atributo de ID de rastreo

Por defecto, los rastreadores de Datadog pueden inyectar automáticamente los ID de rastreo y de tramo (span) en tus logs. Pero si un log con formato JSON incluye los siguientes atributos, Datadog interpreta su valor como el trace_id del log:

dd.trace_id
contextMap.dd.trace_id
named_tags.dd.trace_id
trace_id

Especifica los atributos alternativos que se utilizarán como ID de rastreo del log, configurando un procesador del reasignador de ID de rastreo de logs.

Atributo de ID de span (tramo)

En forma predeterminada, los rastreadores de Datadog pueden insertar automáticamente ID de span (tramo) en tus logs. Sin embargo, si un log con formato JSON incluye los siguientes atributos, Datadog interpreta su valor como el span_id del log:

dd.span_id
contextMap.dd.span_id
named_tags.dd.span_id
span_id

Crear un pipeline

Ve a Pipelines en Datadog.
Selecciona New Pipeline (Nuevo pipeline).
Selecciona un log en la vista previa de Live Tail para aplicarle un filtro, o aplícale tu propio filtro. Elige un filtro del menú desplegable o crea tu propio filtro seleccionando el icono </>. Los filtros te permiten limitar los tipos de logs a los que se aplica un pipeline.
Nota: El filtrado del pipeline se aplica antes que cualquier procesador del pipeline. Por esta razón, no se puede filtrar con un atributo que se extrae del propio pipeline.
Ponle un nombre a tu pipeline.
(Opcional) Añade una descripción y etiquetas al pipeline para indicar su propósito y propiedad. Las etiquetas de pipeline no afectan a los logs, pero pueden utilizarse para filtrar y buscar en la página de pipelines.
Pulsa Create (Crear).

Ejemplo de log transformado por un pipeline:

Pipelines de integración

Consulta la lista de integraciones compatibles.

Los pipelines de procesamiento de integración están disponibles para ciertas sources (fuentes) cuando se configuran para recopilar logs. Estos pipelines son sólo de lectura y analizan tus logs de forma apropiada para el source (fuente) particular. Para los logs de integración, se instala automáticamente un pipeline de integración que se encarga de analizar tus logs y añade la faceta correspondiente en tu Explorer de logs.

Para ver un pipeline de integración, ve a la página Pipelines. Para editar un pipeline de integración, clónalo y luego edita el clon:

Consulta el siguiente ejemplo de logs de ELB:

Nota: Los pipelines de integraciones no pueden eliminarse, solo desactivarse.

Biblioteca de pipelines de integraciones

Para ver la lista completa de pipelines de integraciones que ofrece Datadog, consulta la biblioteca de pipelines de integraciones. La biblioteca de pipelines muestra cómo Datadog procesa diferentes formatos de log por defecto.

Para utilizar un pipeline de integración, Datadog recomienda instalar la integración configurando la source de logs correspondiente. Una vez que Datadog reciba el primer log con esta fuente, la instalación se activa automáticamente y el pipeline de integración se añade a la lista de pipelines de procesamiento. Para configurar la fuente de logs, consulta la documentación de la integración correspondiente.

También es posible copiar un pipeline de integración utilizando el botón de clonación.

Añadir un procesador o un pipeline anidado

Ve a Pipelines en Datadog.
Sitúate sobre un pipeline y haz clic en la flecha situada junto a él para expandir los procesadores y los pipelines anidados.
Selecciona Add Processor (Añadir procesador) o Add Nested Pipeline (Añadir pipeline anidado).

Procesadores

Un procesador se ejecuta dentro de un pipeline para completar una acción de estructuración de datos. Consulta la documentación sobre procesadores para aprender a añadir y configurar un procesador por tipo de procesador, dentro de la aplicación o con la API.

Consulta Análisis de fechas para obtener más información sobre los formatos de fecha y hora personalizados y el parámetro timezone necesario para las marcas de tiempo que no sean UTC.

Pipelines anidados

Los pipelines anidados se encuentran dentro de otros pipelines. Utiliza pipelines anidados para dividir el proceso en dos pasos. Por ejemplo, utiliza primero un filtro de alto nivel, como un equipo, y luego un segundo nivel de filtrado basado en una integración, un servicio o cualquier otro atributo u etiqueta.

Un pipeline puede contener pipelines anidados y procesadores, mientras que un pipeline anidado sólo puede contener procesadores.

Introduce un pipeline dentro de otro pipeline para convertirlo en un pipeline anidado:

Sitúate sobre el pipeline que quieres mover y haz clic en el icono Move to (Mover a).
Selecciona el pipeline al que quieres mover el pipeline original. Nota: Los pipelines que contienen pipelines anidados sólo pueden moverse a una posición de nivel superior y no pueden moverse a otro pipeline.
Haz clic en Move (Mover).

Gestión de tus pipelines

Identifica cuándo se ha realizado el último cambio en un pipeline o procesador y qué usuario ha realizado el cambio, utilizando la información de modificación del pipeline. Filtra tus pipelines utilizando esta información de modificación, así como otras propiedades de faceta, como por ejemplo si el pipeline está habilitado o es de sólo lectura.

Gestionar tus pipelines utilizando la búsqueda por facetas, la información de modificación del pipeline y el modal de reordenamiento

Reordena con precisión los pipelines utilizando la opción Move to del panel deslizante de opciones. Desplázate y haz clic en la posición exacta a la que quieres mover el pipeline seleccionado con el modal Move to. Los pipelines no pueden introducirse en otros pipelines de sólo lectura. Los pipelines que contienen pipelines anidados sólo pueden moverse a otras posiciones de nivel superior y no pueden moverse a otros pipelines.

Reordenar tus pipelines con precisión utilizando el modal Move to (Mover a)

Métricas de uso estimado

Las métricas de uso estimadas se muestran para cada pipeline. Se muestra el volumen y el recuento de logs que están siendo ingeridos y modificados por cada pipeline. Cada pipeline incluye un enlace al dashboard de uso estimado de logs. Este dashboard ofrece gráficos detallados de las métricas de uso del pipeline.