Datadog Cloud Network Monitoring (CNM) proporciona visibilidad de tu tráfico de red entre servicios, contenedores, zonas de disponibilidad y cualquier otra etiqueta en Datadog. Después de activar CNM, puedes crear un monitor de CNM y recibir alertas si una métrica de red de TCP cruza un umbral que hayas establecido. Por ejemplo, puedes monitorizar el rendimiento de red entre un cliente/servidor específico y recibir alertas si ese rendimiento supera un umbral.
Creación de un monitor
Para crear un monitor de CNM en Datadog, utiliza la navegación principal: Monitors –> New Monitor –> Cloud Network. (Monitores –> Nuevo monitor –> Red en la nube).
Definir la consulta de búsqueda
- Crea una consulta de búsqueda mediante el uso de la misma lógica que en una búsqueda de CNM Analytics.
- Selecciona las etiquetas por las que deseas agrupar el cliente y el servidor.
- Elige si deseas mostrar u ocultar el tráfico no disponible.
- Selecciona una métrica que desees medir en la lista desplegable. Por defecto, el monitor mide la suma de las métricas seleccionadas. Consulta qué métricas están disponibles para monitores de CNM en las definiciones de métrica.
- Establece el límite de resultados que deseas incluir en la consulta.
Puedes crear monitores de CNM mediante el uso de fórmulas y funciones. Esto puede utilizarse, por ejemplo, para crear monitores sobre el rendimiento entre un cliente y un servidor.
El siguiente ejemplo muestra el uso de una fórmula para calcular el porcentaje de retransmisiones de un cliente a un servidor.
Para más información, consulta la documentación Funciones.
Definiciones de métrica
Las siguientes tablas contienen las diferentes métricas de CNM en las que puedes crear monitores.
Volumen
Nombre de la métrica | Definición |
---|
Bytes recibidos | Bytes recibidos del cliente. |
Bytes enviados | Bytes enviados desde el cliente. |
Paquetes enviados | Paquetes enviados desde el cliente. |
TCP
Nombre de la métrica | Definición |
---|
Retransmisiones | Retransmisiones entre cliente/servidor. |
Latencia | Tiempo promedio que se tarda en establecer la conexión. |
RTT (tiempo de ida y vuelta) | Tiempo promedio que se tarda en recibir una respuesta. |
Fluctuación | Variación promedio del RTT. |
Tiempos de espera de TCP | Número de conexiones de TCP vencidas desde la perspectiva del sistema operativo. Esto puede indicar problemas generales de conectividad y latencia. |
Rechazos de TCP | Número de conexiones de TCP rechazadas por el servidor. Por lo general, esto indica un intento de conexión a una IP/puerto que no está recibiendo conexiones, o una mala configuración del firewall/seguridad. |
Reinicios de TCP | Número de conexiones de TCP reiniciadas por el servidor. |
Conexiones establecidas | Establece conexiones entre cliente/servidor. |
Conexiones cerradas | Conexiones cerradas entre cliente/servidor. |
DNS
Nombre de la métrica | Definición |
---|
Solicitudes DNS | Número total de solicitudes DNS. |
Fallos de DNS | Número total de fallos de DNS. |
Tiempos de espera de DNS | Número total de tiempos de inactividad de DNS. |
Respuestas fallidas de DNS | Número total de respuestas de DNS fallidas. |
Respuestas correctas de DNS | Número total de respuestas de DNS correctas. |
Latencia del fallo de DNS | Latencia media de fallo de DNS. |
Latencia de éxito de DNS | Latencia media de éxito de DNS. |
Errores NXDOMAIN | Número total de errores NXDOMAIN. |
Errores SERVFAIL | Número total de errores SERVFAIL. |
Otros errores | Número total de otros errores. |
Definir condiciones de alerta
Configura monitores para que se activen si el valor de la consulta supera un umbral y personaliza las opciones avanzadas de alerta para los umbrales de recuperación y los retrasos de las evaluaciones. Para obtener más información, consulta Configurar monitores.
Notificaciones
Para obtener instrucciones detalladas sobre la sección Configure notifications and automations (Configurar notificaciones y automatizaciones), consulta la página Notificaciones.
Monitores comunes
Puedes empezar a crear monitores en CNM con los siguientes monitores comunes. Estos proporcionan un buen punto de partida para realizar un seguimiento de tu red y recibir alertas si tu red está experimentando un tráfico inusual y potencialmente experimentando un comportamiento inesperado de red.
Monitor de rendimiento
El monitor de rendimiento te avisa si el rendimiento entre dos endpoints especificados en la consulta supera un umbral. La monitorización del rendimiento puede ayudar a determinar si tu red se está acercando a la capacidad dado tu ancho de banda de red. Saber esto puede darte tiempo suficiente para hacer ajustes a tu red y evitar cuellos de botella y otros efectos descendentes.
Porcentaje de retransmisiones
Las retransmisiones se producen cuando los paquetes se dañan o se pierden e indican una falta de fiabilidad en la red. El monitor de porcentaje de retransmisiones te avisa si el porcentaje del total de paquetes enviados que resultan en retransmisiones supera un umbral.
Fallos de DNS
El monitor de fallo de DNS realiza un seguimiento del rendimiento del servidor DNS para ayudar a identificar problemas de DNS del lado del servidor y del lado del cliente. Utiliza este monitor para alertarte si la suma de fallos de DNS supera un umbral.
Para leer más
Más enlaces, artículos y documentación útiles: