Metrics

Participez à une session de webinaire d'habilitation

Explorez et inscrivez-vous aux sessions d'habilitation de base pour des métriques personnalisées. Découvrez comment les métriques personnalisées vous aident à suivre les KPI de votre application, tels que le nombre de visiteurs, la taille moyenne du panier client, la latence des requêtes ou la distribution des performances pour un algorithme personnalisé.

INSCRIVEZ-VOUS

Ceci est une introduction aux métriques dans Datadog et à leur utilité. Cette section comprend les sujets suivants :




Aperçu

Qu’est-ce que les métriques ?

Les métriques sont des valeurs numériques qui peuvent surveiller l’évolution de nombreux éléments de votre environnement (latence, taux d’erreur, inscriptions, etc.).

Dans Datadog, les données des métriques sont ingérées et stockées sous forme de points de données avec une valeur et un timestamp :

[ 17.82,  22:11:01 ]

Une séquence de points de données est stockée sous la forme d’une série temporelle :

[ 17.82,  22:11:01 ]
[  6.38,  22:11:12 ]
[  2.87,  22:11:38 ]
[  7.06,  22:12:00 ]

Toutes les métriques avec des timestamps en fractions de seconde sont arrondies à la seconde la plus proche. Si plusieurs points ont le même timestamp, le dernier point écrase les précédents.

Pourquoi les métriques sont-elles utiles ?

Les métriques fournissent une vue d’ensemble de votre système. Vous pouvez les utiliser pour évaluer la santé de votre environnement d’un coup d’œil. Visualisez à quelle vitesse les utilisateurs chargent votre site web, ou la consommation moyenne de mémoire de vos serveurs, par exemple. Une fois que vous avez identifié un problème, vous pouvez utiliser les journaux et le traçage pour approfondir le dépannage.

Les métriques qui suivent la santé du système sont automatiquement fournies par les intégrations de Datadog avec plus de 1,000 services. Vous pouvez également suivre des métriques spécifiques à votre entreprise, également connues sous le nom de métriques personnalisées. Vous pouvez suivre des éléments tels que le nombre de connexions d’utilisateurs, la taille des paniers des utilisateurs, jusqu’à la fréquence des commits de code de votre équipe.

De plus, les métriques peuvent vous aider à ajuster l’échelle de votre environnement pour répondre à la demande de vos clients. Savoir exactement combien vous devez consommer en ressources peut vous aider à économiser de l’argent ou à améliorer les performances.

Soumettre des métriques à Datadog

Il existe plusieurs façons d’envoyer des métriques à Datadog.

  • Intégrations prises en charge par Datadog : 1,000+ Les intégrations incluent des métriques prêtes à l’emploi. Pour accéder à ces métriques, naviguez vers la page d’intégration spécifique à votre service et suivez les instructions d’installation. Si vous devez surveiller une instance EC2, par exemple, vous iriez à la documentation d’intégration Amazon EC2.

  • Vous pouvez générer des métriques directement au sein de la plateforme Datadog. Par exemple, vous pouvez compter les codes d’état d’erreur apparaissant dans vos journaux et les stocker comme une nouvelle métrique dans Datadog.

  • Souvent, vous devrez suivre des métriques liées à votre entreprise (par exemple, le nombre de connexions ou d’inscriptions d’utilisateurs). Dans ces cas, vous pouvez créer des métriques personnalisées. Les métriques personnalisées peuvent être soumises via l’Agent, DogStatsD ou l’API HTTP.

  • De plus, l’Agent Datadog envoie automatiquement plusieurs métriques standard (telles que l’utilisation du CPU et du disque).

Pour parcourir une synthèse de l’ensemble des sources et méthodes d’envoi de métriques, consultez la section Types de métriques.

Types de métriques et visibilité des métriques en temps réel 

Types de métriques 

Datadog prend en charge plusieurs types de métriques : count, gauge, rate, histogram et distribution. Chaque type possède ses propres avantages. Les types de métriques déterminent quels graphiques et fonctions sont disponibles pour être utilisés avec la métrique dans l’application.

L’Agent Datadog ne fait pas de demande séparée aux serveurs de Datadog pour chaque point de données que vous envoyez. Au lieu de cela, il rapporte les valeurs collectées sur un intervalle de temps de vidage. Le type de la métrique détermine comment les valeurs collectées depuis votre hôte pendant cet intervalle sont agrégées pour soumission.

Un type compte additionne toutes les valeurs soumises dans un intervalle de temps. Cela serait approprié pour une métrique suivant le nombre de visites sur le site web, par exemple.

Le type taux prend le compte et le divise par la durée de l’intervalle de temps. Ceci est utile si vous êtes intéressé par le nombre de visites par seconde.

Un type jauge prend la dernière valeur rapportée pendant l’intervalle. Ce type aurait du sens pour suivre l’utilisation de la RAM ou du CPU, où prendre la dernière valeur fournit une image représentative du comportement de l’hôte pendant l’intervalle de temps. Dans ce cas, utiliser un type différent tel que compte conduirait probablement à des valeurs inexactes et extrêmes. Choisir le bon type de métrique garantit des données précises.

Un histogramme rapporte cinq valeurs différentes résumant les valeurs soumises : la moyenne, le compte, la médiane, le 95ᵉ percentile et le maximum. Cela produit cinq séries temporelles différentes. Ce type de métrique est adapté à des éléments tels que la latence, pour laquelle il ne suffit pas de connaître la valeur moyenne. Les histogrammes vous permettent de comprendre comment vos données étaient réparties sans enregistrer chaque point de données individuel.

Une distribution est similaire à un histogramme, mais elle résume les valeurs soumises pendant un intervalle de temps sur tous les hôtes de votre environnement. Vous pouvez également choisir de rapporter plusieurs percentiles : p50, p75, p90, p95 et p99. Vous pouvez en apprendre davantage sur cette fonctionnalité puissante dans la documentation sur les distributions.

Référez-vous à la section Types de métriques pour obtenir des exemples détaillés de chaque type de métrique, ainsi que des instructions pour leur envoi.

Interrogation des métriques

Vous pouvez visualiser vos métriques et créer des graphiques dans Datadog depuis le Metrics Explorer, les dashboards ou les notebooks.

Astuce : Pour ouvrir la page Résumé des métriques à partir de la recherche globale de Datadog, appuyez sur Cmd/Ctrl + K et recherchez metrics.

Voici un exemple de visualisation représentant une série temporelle :

Un graphique de séries temporelles affiche une métrique de latence représentée par une seule ligne bleue avec plusieurs pics.

Ce graphique linéaire affiche la latence (en millisecondes) des utilisateurs (en abscisse) en fonction de l’heure (en ordonnée).

Visualisations supplémentaires

Datadog fournit différents types de visualisations, afin que chacun puisse représenter et visualiser facilement ses métriques.

Une requête de métrique se compose des mêmes deux étapes d’évaluation pour commencer : agrégation temporelle et agrégation spatiale. Consultez l’anatomie d’une requête de métrique pour plus d’informations.


De plus, Datadog propose de nombreux autres types de graphiques et de widgets pour les visualisations. Vous pouvez en apprendre davantage à leur sujet dans la série de blogs de Datadog sur les graphiques de métriques.

L’expérience de graphisme est cohérente que vous utilisiez des tableaux de bord, des carnets ou des moniteurs. Vous pouvez créer des graphiques en utilisant l’interface utilisateur de l’éditeur de graphiques ou en modifiant directement la chaîne de requête brute. Pour modifier la chaîne de requête, utilisez le bouton </> à l’extrême droite.

Anatomie d’une requête de métrique

Voici à quoi ressemble une requête de métrique dans Datadog :

Exemple de requête avec des sections codées par couleur

Cette requête peut être divisée en plusieurs parties :

Nom de la métrique

Tout d’abord, choisissez la métrique spécifique que vous souhaitez représenter graphiquement en la recherchant ou en la sélectionnant dans le menu déroulant à côté de Métrique. Si vous n’êtes pas sûr de la métrique à utiliser, commencez par l’Explorateur de métriques ou un carnet de notes. Vous pouvez également voir une liste des métriques en cours de rapport actif sur la page Résumé des métriques.

Filtrer votre métrique

Après avoir sélectionné une métrique, vous pouvez filtrer votre requête en fonction des balises. Par exemple, vous pouvez utiliser account:prod pour délimiter votre requête afin d’inclure uniquement les métriques de vos hôtes de production. Pour plus d’informations, consultez la documentation sur le balisage.

Configurer l’agrégation temporelle

Ensuite, choisissez la granularité de vos données en utilisant le regroupement temporel. Dans cet exemple, vous avez défini qu’il y a un point de données pour chaque heure (3600 secondes). Vous pouvez choisir comment vous souhaitez agréger les données dans chaque intervalle de temps. Par défaut, moyenne est appliquée, mais d’autres options disponibles sont somme, min, max et compte. Vous pouvez également personnaliser la façon dont vos données de métriques sont agrégées et regroupées avec des fonctions ou des modificateurs dans l’application. Par exemple, si vous souhaitez appliquer max et personnaliser la façon dont vos données de métriques sont agrégées et regroupées dans le temps avec des requêtes alignées sur le calendrier, vous utiliseriez .rollup(max, 60). Pour plus d’informations, consultez la documentation sur les Fonctions, Regroupement et Modificateurs dans l’application.

Configurer l’agrégation d’espace

Dans Datadog, “espace” fait référence à la façon dont les métriques sont réparties sur différents hôtes et balises. Il y a deux aspects différents de l’espace que vous pouvez contrôler : l’agrégateur et le regroupement.

L’agrégateur définit comment les métriques dans chaque groupe sont combinées. Il existe quatre agrégations disponibles : somme, min, max et moyenne.

Le regroupement définit ce qui constitue une ligne sur le graphique. Par exemple, si vous avez des centaines d’hôtes répartis sur quatre régions, le regroupement par région vous permet de tracer une ligne pour chaque région. Cela réduirait le nombre de séries temporelles à quatre.

Appliquer des fonctions (optionnel)

Vous pouvez modifier les valeurs de votre graphique avec des fonctions mathématiques. Cela peut signifier effectuer des opérations arithmétiques entre un entier et une métrique (par exemple, multiplier une métrique par 2). Ou effectuer des opérations arithmétiques entre deux métriques (par exemple, créer une nouvelle série temporelle pour le taux d’utilisation de la mémoire comme ceci : jvm.heap_memory / jvm.heap_memory_max).

Agrégation temporelle et spatiale

L’agrégation temporelle et l’agrégation spatiale sont deux composants importants de toute requête. Parce que comprendre comment ces agrégations fonctionnent vous aide à éviter de mal interpréter vos graphiques, ces concepts sont expliqués plus en détail ci-dessous.

Agrégation temporelle

Datadog stocke un grand volume de points, et dans la plupart des cas, il n’est pas possible de les afficher tous sur un graphique. Il y aurait plus de points de données que de pixels. Datadog utilise l’agrégation temporelle pour résoudre ce problème en combinant les points de données en seaux temporels. Par exemple, lors de l’examen de quatre heures, les points de données sont combinés en seaux de deux minutes. Ceci est appelé un rollup. À mesure que l’intervalle de temps que vous avez défini pour votre requête augmente, la granularité de vos données diminue.

Vous pouvez choisir parmi cinq agrégations pour combiner vos données dans chaque compartiment temporel : sum, min, max, avg et count.

Il est important de se rappeler que l’agrégation temporelle est toujours appliquée dans chaque requête que vous effectuez.

Agrégation spatiale

L’agrégation spatiale divise une seule métrique en plusieurs séries temporelles par des balises telles que l’hôte, le conteneur et la région. Par exemple, si vous souhaitez voir la latence de vos instances EC2 par région, vous devez utiliser la fonction de regroupement de l’agrégation spatiale pour combiner les hôtes de chaque région.

Il existe quatre agrégateurs qui peuvent être appliqués lors de l’utilisation de l’agrégation spatiale : sum, min, max et avg. En utilisant l’exemple ci-dessus, disons que vos hôtes sont répartis sur quatre régions : us-east-1, us-east-2, us-west-1 et us-west-2. Les hôtes de chaque région doivent être combinés à l’aide d’une fonction d’agrégation. Utiliser l’agrégateur max donnerait la latence maximale constatée parmi les hôtes dans chaque région, tandis que l’agrégateur avg donnerait la moyenne de la latence par région.

Requêtes imbriquées

Ajoutez des couches supplémentaires d’agrégation sur les résultats des requêtes existantes dans le temps et l’espace avec des requêtes imbriquées dans l’interface utilisateur ou via l’API. Pour plus d’informations, consultez la documentation sur les Requêtes imbriquées.

Voir des informations en temps réel sur les métriques

La page Résumé des métriques affiche une liste de vos métriques rapportées à Datadog pour une période spécifiée : la dernière heure, le dernier jour ou la dernière semaine. Les métriques peuvent être filtrées par nom de métrique ou par balise.

Cliquez sur n’importe quel nom de métrique pour afficher un panneau latéral de détails avec des informations plus détaillées. Le panneau latéral de détails affiche des informations clés pour une métrique donnée, y compris ses métadonnées (type, unité, intervalle), le nombre de métriques distinctes, le nombre d’hôtes ayant envoyé des données, le nombre de balises soumises et un tableau contenant toutes les balises soumises pour une métrique. Voir quelles balises sont soumises sur une métrique vous aide à comprendre le nombre de métriques distinctes qui en résultent, puisque ce nombre dépend de vos combinaisons de valeurs de balises.

Remarque : Le nombre de métriques distinctes rapportées dans le panneau latéral de détails sur le Résumé des métriques n’a pas d’impact sur votre facturation. Consultez vos détails d’utilisation pour un comptage précis de votre utilisation au cours du mois dernier.

Consultez la section Metrics Summary pour en savoir plus.

Lectures complémentaires