Solucionar problemas de alertas de monitor

Información general

Esta guía proporciona información general de algunos conceptos básicos que pueden ayudarte a determinar si el comportamiento de alertas de tu monitor es válido. Si sospechas que las evaluaciones de tu monitor no reflejan con precisión los datos subyacentes, consulta las siguientes secciones mientras inspeccionas tu monitor.

Monitorizar estados

Mientras que las evaluaciones de monitor no tienen estado, lo que significa que el resultado de una evaluación no depende de los resultados de evaluaciones anteriores, los propios monitores sí tienen estado y este se actualiza en función de los resultados de evaluación de sus consultas y configuraciones. Una evaluación de monitor con un estado determinado no provocará necesariamente que el estado del monitor cambie al mismo estado. A continuación se indican algunas causas potenciales:

Las métricas son demasiado dispersas dentro de una ventana de evaluación de métricas de monitor

Si las métricas están ausentes de la ventana de evaluación de un monitor y el monitor no está configurado para anticipar condiciones de ausencia de datos, la evaluación puede ser skipped. En tal caso, el estado monitor no se actualiza, por lo que un monitor que previamente tenía el estado OK permanece OK. Lo mismo ocurre con un monitor con el estado Alert. Utiliza el gráfico del historial de la página de estado del monitor y selecciona el grupo y el periodo de tiempo que te interesen. Si los datos están escasamente poblados, consulta Monitorizar la aritmética y las métricas escasas para obtener más información.

Monitorizar actualizaciones de estado generadas por condiciones externas

El estado de un monitor también puede actualizarse a veces en ausencia de una evaluación de monitor, por ejemplo, debido a la resolución automática.

Verificar la presencia de datos

Si el estado de tu monitor no es el que esperabas, confirma el comportamiento de la fuente de datos subyacente. En el caso de un monitor de métricas, puedes utilizar el gráfico del historial para ver los puntos de datos extraídos por la consulta de métricas.

Condiciones de alerta

Algunas veces, el comportamiento inesperado de un monitor puede ser el resultado de una mala configuración de las condiciones de alerta, que varían según el tipo de monitor. Si tu consulta de monitor utiliza la función as_count(), consulta la guía de as_count() en evaluaciones de monitores.

Si utilizas umbrales de recuperación, comprueba las condiciones enumeradas en la guía de umbrales de recuperación para ver si el comportamiento es el esperado.

Monitorizar estados y grupos

Tanto en las evaluaciones como en los estados de monitor, el seguimiento se realiza por grupos.

Para un monitor de alertas múltiples, un grupo es un conjunto de etiquetas (tags) con un valor para cada clave de agrupación (por ejemplo, env:dev, host:myhost para un monitor agrupad por env y host). Para una alerta simple, sólo hay un grupo (*) que representa todo lo que hay dentro del contexto del monitor.

Por defecto, Datadog mantiene los grupos de monitores disponibles en la interfaz de usuario durante 24 horas, o 48 horas para los monitores de host, a menos que se modifique la consulta. Para obtener más información, consulta Monitorizar los cambios de configuración que no surten efecto.

Si anticipas la creación de nuevos grupos de monitores dentro del contexto de tus monitores con alertas múltiples, tal vez quieras configurar un periodo de espera para la evaluación de estos nuevos grupos. Esto puede ayudarte a evitar alertas sobre el comportamiento esperado de los nuevos grupos, como un alto uso de recursos asociado a la creación de un nuevo contenedor. Para obtener más información, consulta Periodo de espera para nuevo grupo.

Si tu monitor realiza consultas de métricas en la nube basadas en crawlers, utiliza un periodo de espera de evaluación para asegurarte de que hayan llegado las métricas antes de la evaluación del monitor. Consulta Periodo de espera para métricas en la nube para obtener más información sobre los cronogramas de los crawlers de integraciones en la nube.

Problemas con las notificacies

Si tu monitor se comporta como se espera, pero produce notificaciones no deseadas, existen varias opciones para reducir o suprimir las notificaciones:

Notificaciones de ausencia

Si sospechas que las notificaciones no se están entregando correctamente, consulta los siguientes elementos para garantizar que las notificaciones puedan entregarse:

Notificaciones múltiples Opsgenie

Si utilizas las notificaciones múltiples @opsgenie-[...] en tu monitor, enviamos esas notificaciones con el mismo alias Opsgenie. Debido a una característica de Opsgenie, Opsgenie descartará lo que considere una duplicación.

Leer más