Crear alertas de clúster para notificar si un porcentaje de los grupos están en estado crítico

Información general

Esta guía te muestra cómo crear alertas que no te notifiquen cada vez que un grupo individual cumple la condición, sino sólo cuando un determinado porcentaje de grupos lo hace. Esto es útil, por ejemplo, si quieres que un monitor te alerte sólo cuando un determinado porcentaje de hosts o contenedores alcanzan un estado crítico.

Ejemplo: alerta sobre un porcentaje de hosts con elevado uso de CPU

En este ejemplo, quieres recibir una notificación cuando el 40 por ciento de los hosts tienen un uso de CPU superior al 50 por ciento. Aprovecha las funciones min_cutoff y count_nonzero:

  • Utiliza la función min_cutoff para contabilizar el número de hosts que tienen un uso de CPU superior al 50 por ciento.
  • Utiliza la función count_nonzero para contabilizar el número total de hosts.
  • Divide uno por el otro para obtener el porcentaje resultante de hosts con un uso de CPU superior al 50 por ciento.
cluster-alert-condition
  • Luego, establece la condición para generar una alerta si el porcentaje de hosts que tienen esa condición alcanza el 40 por ciento.
cluster-alert-trigger

Este monitor rastrea el porcentaje de hosts que han tenido un uso de CPU superior al 50 por ciento durante los últimos diez minutos y genera un notificación si más del 40 por ciento de esos hosts cumplen la condición especificada.

Referencias adicionales