Surveillance DNS
La gestion des incidents est désormais disponible pour tous ! La gestion des incidents est désormais disponible pour tous !

Surveillance DNS

La surveillance DNS offre une vue d’ensemble des performances de vos serveurs DNS afin d’identifier les problèmes de DNS côté serveur et côté client. En recueillant et en affichant les métriques de DNS liées aux flux sur votre réseau, cette page permet de déterminer :

  • Les pods ou les services à l’origine des requêtes DNS et les serveurs qui reçoivent ces requêtes.
  • Les endpoints qui émettent le plus de requêtes ou associés aux taux de requêtes les plus élevés.
  • Si le temps de réponse d’un serveur DNS face aux requêtes a augmenté de façon progressive ou abrupte.
  • Les serveurs DNS associés à un taux d’erreurs élevé et le type d’erreurs émises.

La surveillance DNS est actuellement disponible en version bêta publique.

Configuration

Les métriques de surveillance DNS sont automatiquement recueillies par le system-probe avec les versions 7.23+ de l’Agent. Après installation, l’onglet « DNS » apparaît directement dans la section Network Performance Monitoring. Aucune configuration supplémentaire n’est requise.

Requêtes

Utilisez les barres de recherche source et destination en haut de la page afin de récupérer les dépendances entre un client (source), qui effectue la requête DNS, et un serveur DNS (destination), qui répond à la requête DNS. Le port de destination est automatiquement défini sur le port DNS 53 afin que toutes les dépendances renvoyées correspondent au format (client → serveur DNS).

Afin de rechercher un client spécifique, agrégez et filtrez le trafic DNS en ajoutant des tags dans la barre de recherche de source. Dans la vue par défaut, la source est agrégée selon le tag service. Ainsi, chaque ligne du tableau représente un service qui effectue des requêtes DNS auprès d’un serveur DNS.

Afin de rechercher un serveur DNS spécifique, filtrez la barre de recherche de destination en utilisant des tags. Pour configurer l’affichage de votre destination, sélectionnez l’une des options suivantes dans le menu déroulant Group by :

  • dns_server : Le serveur qui reçoit les requêtes DNS. La valeur de ce tag est la même que pod_name ou task_name. Si ces tags ne sont pas disponibles, host_name est utilisé.
  • host : Le hostname du serveur DNS.
  • service : Le service exécuté sur le serveur DNS.
  • IP : L’adresse IP du serveur DNS.

Cet exemple montre tous les flux entre les pods dans la zone de disponibilité de l’environnement de production et les hosts qui reçoivent les requêtes DNS :

Métriques

Vos métriques de DNS sont affichées dans les graphiques et le tableau associé.

Remarque : l’intervalle de collecte par défaut est de cinq minutes, et la durée de rétention est de sept jours.

Les métriques de DNS suivantes sont disponibles :

MétriqueDescription
Requêtes DNSLe nombre de requêtes DNS effectuées par le client.
Requêtes DNS/secondeLe taux de requêtes DNS effectuées par le client.
Temps de réponse DNSLe temps de réponse moyen du serveur DNS à une requête du client.
ExpirationsLe nombre de requêtes DNS du client qui ont dépassé le délai d’expiration (affiché sous forme de pourcentage de toutes les réponses DNS).
ErreursLe nombre de requêtes du client qui ont généré des codes d’erreur DNS (affiché sous forme de pourcentage de toutes les réponses DNS).
SERVFAILLe nombre de requêtes du client qui ont généré des codes d’erreur SERVFAIL (le serveur DNS n’a pas répondu) (affiché sous forme de pourcentage de toutes les réponses DNS).
NXDOMAINLe nombre de requêtes du client qui ont généré des codes d’erreur NXDOMAIN (le nom de domaine n’existe pas) (affiché sous forme de pourcentage de toutes les réponses DNS).
OTHERLe nombre de requêtes du client qui ont généré des codes d’erreur qui ne sont ni NXDOMAIN ni SERVFAIL (affiché sous forme de pourcentage de toutes les réponses DNS).
ÉchecsLe nombre total d’expirations et d’erreurs dans les requêtes DNS du client (affiché sous forme de pourcentage de toutes les réponses DNS).

Tableau

Le tableau Network affiche les métriques ci-dessous pour chaque dépendance source/destination définie dans votre requête.

Pour configurer les colonnes de votre tableau, utilisez le bouton Customize en haut à droite.

Pour affiner le trafic affiché dans votre vue, utilisez les options Filter Traffic.

Volet latéral

Le volet latéral fournit des données de télémétrie contextuelle pour vous aider à débuguer rapidement les dépendances du serveur DNS. Utilisez les onglets Flows, Logs, Traces et Processes pour déterminer si une augmentation du nombre de requêtes entrantes, du temps de réponse ou du taux d’échecs d’un serveur DNS est attribuable à :

  • des processus lourds monopolisant les ressources de l’infrastructure sous-jacente
  • des erreurs d’application dans le code côté client
  • un grand nombre de requêtes issues d’un port ou d’une adresse IP spécifique

Pour aller plus loin