Si bien los datos de Live Processes se almacenan durante 36 horas, puedes generar métricas de distribución globales y de percentil de tus procesos para monitorizar el consumo de recursos a largo plazo. Las métricas basadas en procesos se almacenan durante 15 meses como cualquier otra métrica de Datadog. Esto puede ayudarte a:
Depurar problemas de infraestructura pasados y actuales
Identificar tendencias en el consumo de recursos de tus cargas de trabajo fundamentales
Evaluar el estado de tu sistema antes y después de los tests de carga o estrés
Realizar un seguimiento del efecto de las implementaciones de software en el estado de tus hosts o contenedores subyacentes
Generar una métrica basada en procesos
Puedes generar una nueva métrica basada en procesos directamente a partir de consultas en la página de Live Processes, o en la pestaña Manage Metrics (Gestionar métricas), al hacer clic en + New Metric (+ Métrica nueva).
Añadir una nueva métrica basada en procesos
Seleccionar etiquetas (tags) para filtrar la consulta: la sintaxis de la consulta es la misma que para Live Processes. Solo se consideran para la agregación los procesos que coinciden con el contexto de tus filtros. Los filtros de búsqueda de texto solo se admiten en la página de Live Processes.
Seleccionar la medida de la que deseas realizar un seguimiento: ingresa una medida como Total CPU % para agregar un valor numérico y crear sus métricas agregadas count, min, max, sum y avg correspondientes.
Añadir etiquetas a group by: selecciona etiquetas que se añadirán como dimensiones a tus métricas, para que se puedan filtrar, agregar y comparar. De manera predeterminada, las métricas generadas a partir de procesos no tienen etiquetas a menos que se añadan de manera explícita. En este campo se puede utilizar cualquier etiqueta disponible para consultas de Live Processes.
Nombrar la métrica: completa el nombre de tu métrica. Las métricas basadas en procesos siempre tienen el prefijo proc. y el sufijo [selección_de_medida].
Añadir agregaciones de percentiles: selecciona la casilla de verificación Include percentile aggregations (Incluir agregaciones de percentiles) para generar los percentiles p50, p75, p90, p95 y p99. Las métricas de percentil también se consideran métricas de clientes y se facturan en consecuencia.
Puedes crear varias métricas con la misma consulta al seleccionar la casilla Create Another (Crear otra) en la parte inferior del modal de creación de métricas. Cuando se selecciona, el modal permanece abierto después de que se haya creado la métrica, con los filtros y grupos de agregación ya completados.
Nota: Los puntos de datos para métricas basadas en procesos se generan en intervalos de diez segundos. Es posible que se produzca un retraso de hasta 3 minutos desde el momento en que se crea o actualiza la métrica hasta el momento en que se informa el primer punto de datos.
Las métricas basadas en procesos se consideran métricas personalizadas y se facturan en consecuencia. Evita agrupar por etiquetas ilimitadas o de cardinalidad extremadamente alta, como comando y usuario, para evitar afectar tu facturación.
Actualizar una métrica basada en procesos
Después de crear una métrica, se pueden actualizar los siguientes campos:
Filtrar consultas: añade o elimina etiquetas del campo «Filter by» (Filtrar por) a fin de cambiar el conjunto de procesos coincidentes para los que se generan métricas.
Grupos de agregación: añade o elimina etiquetas del campo «Group by» (Agrupar por) para desglosar tus métricas de diferentes maneras o gestionar su cardinalidad.
Selección de percentiles: marca o desmarca la casilla «Include percentile aggregations» (Incluir agregaciones de percentiles) para eliminar o generar métricas de percentil.
Para cambiar el tipo o nombre de la métrica, se debe crear una nueva métrica.
Aprovechar las métricas de proceso en toda la plataforma de Datadog
Una vez que se hayan creado, puedes utilizar las métricas de percentil y agregadas de distribución de procesos como cualquier otra en Datadog. Por ejemplo, puedes:
Graficar métricas basadas en procesos en dashboards y notebooks para realizar un seguimiento del consumo histórico de recursos de cargas de trabajo importantes
Crear monitores basados en umbrales o anomalías además de métricas basadas en procesos para detectar cuándo la memoria de CPU o RSS cae o aumenta de manera inesperada
Utilizar las correlaciones de métricas para contextualizar los cambios en el consumo de recursos frente al rendimiento del software interno y de terceros