Incident Management Analytics

Présentation

Incident Management Analytics est une source de données interrogeable vous permettant d’obtenir des statistiques agrégées sur les incidents. Vous pouvez interroger ces données d’analyse dans divers widgets de graphique, que ce soit dans des dashboards et des notebooks, afin d’analyser l’historique de résolution des incidents au fil du temps. En guise de point de départ, Datadog fournit un modèle de dashboard et un modèle de notebook offrant une vue d’ensemble de la gestion des incidents. Vous pouvez cloner et dupliquer ces modèles comme bon vous semble.

Les widgets suivants prennent en charge Incident Management Analytics :

  • Série temporelle
  • Top List
  • Valeur de requête

Mesures

Datadog fournit par défaut les mesures agrégées suivantes pour créer vos requêtes d’analyse :

  1. Count (*)
  2. Customer Impact Duration
  3. Status Active Duration (durée pendant laquelle l’incident a conservé le statut Active)
  4. Status Stable Duration (durée pendant laquelle l’incident a conservé le statut Stable)
  5. Time to Repair (timestamp de fin de l’impact client - timestamp de création de l’incident)
  6. Time to Resolve (timestamp de résolution - timestamp de création)

En plus de ces mesures par défaut, vous pouvez créer d’autres mesures en ajoutant des champs de propriété Number personnalisés dans les paramètres de votre incident.

Configuration d’un graphique

Pour configurer votre graphique à l’aide de la solution Incident Management Analytics, suivez ces étapes :

  1. Sélectionnez votre visualisation.
  2. Sélectionnez Incidents dans le menu déroulant des sources de données.
  3. Sélectionnez une mesure dans le menu déroulant jaune.
    • Statistique par défaut : nombre d’incidents.
  4. Sélectionnez une agrégation pour la mesure.
  5. (Facultatif) Sélectionnez un cumul pour la mesure.
  6. (Facultatif) Utilisez la barre de recherche pour limiter la statistique à un sous-ensemble d’incidents.
  7. (Facultatif) Sélectionnez une facette dans le menu déroulant rose pour répartir la mesure par groupe et sélectionner un nombre limité de groupes à afficher.
  8. Donnez un titre au graphique.
  9. Enregistrez votre widget.

Exemple : Durée hebdomadaire de l’impact client des pannes par service

  1. Widget : graphique linéaire de série temporelle
  2. Source de données : Incidents
  3. Mesure : Customer Impact Duration
  4. Agrégation : avg
  5. Cumul : 1w
  6. Filtre : severity:(“SEV-1” OR “SEV-2”)
  7. Groupe : Services, limités aux 5 premiers
Exemple de requête d'analyse d'incident