Downtimes
Rapport de recherche Datadog : Bilan sur l'adoption de l'informatique sans serveur Rapport : Bilan sur l'adoption de l'informatique sans serveur

Downtimes

Planifiez des downtimes pour éviter de déclencher vos monitors en cas d’arrêt système, de maintenance hors ligne ou de mise à niveau.

Planifier un downtime

Pour planifier un downtime de monitor dans Datadog, utilisez le menu principal : Monitors –> Manage Downtime. Cliquez ensuite sur le bouton Schedule Downtime en haut à droite.

Choisir les éléments à désactiver

Utilisez le menu déroulant pour choisir les monitors à désactiver, ou cherchez-les. Si vous choisissez de laisser le champ vide, tous les monitors seront désactivés par défaut. Vous pouvez également sélectionner un contexte afin de limiter votre downtime à un host, appareil ou tag de votre choix.

Planifiez un downtime basé sur un ou plusieurs tags de monitor. Vous devez sélectionner au moins un tag, et il n’est pas possible de définir plus de 32 tags. Les noms de tag ne doivent pas dépasser 256 caractères. Seuls les monitors possédant TOUS les tags sélectionnés sont désactivés. Vous pouvez également sélectionner des contextes pour restreindre encore plus le downtime.

Si vous choisissez de désactiver des monitors limités par un contexte, cliquez sur Preview affected monitors pour voir les monitors inclus. Tous les monitors créés ou modifiés après la planification du downtime sont automatiquement inclus dans le downtime s’ils correspondent au contexte.

Remarque : si un monitor à alertes multiples est inclus, il est uniquement désactivé pour les groupes couverts par le contexte. Par exemple, si un downtime est couvert par le contexte host:X et qu’une alerte multiple est déclenchée pour host:X et host:Y, Datadog envoie une notification de monitor pour host:Y, mais pas pour host:X.

Planifier un downtime

Définissez un downtime ponctuel en saisissant la date et l’heure de début, ainsi que le fuseau horaire. Vous pouvez aussi définir une date et une heure de fin.

Les downtimes récurrents sont utiles pour les périodes de maintenance récurrentes.

Définissez un downtime récurrent en saisissant la date et l’heure de début, le fuseau horaire, la répétition et la durée. Vous pouvez aussi préciser une date de fin ou un nombre d’occurrences.

Lorsqu’une occurrence d’un downtime récurrent prend fin, cette occurrence est annulée et un nouveau downtime possédant les mêmes caractéristiques (avec une nouvelle date de début et de fin) est créé. Remarque : le créateur d’origine est associé à tous les nouveaux downtimes créés.

Ajouter un message

Saisissez un message pour informer votre équipe à propos de ce downtime. Le champ de message prend en charge la mise en forme Markdown standard ainsi que la fonction de notification « @ » de Datadog.

Informer votre équipe

Informez votre équipe en spécifiant les membres de l’équipe ou envoyez le message à une intégration de service.

Gérer les downtimes

La page Manage Downtime affiche la liste des downtimes actifs et planifiés. Sélectionnez un downtime pour afficher plus de détails, pour le modifier ou pour le supprimer. Utilisez la zone de texte Filter downtimes pour chercher des downtimes.

Historique

L’historique des downtimes est accessible depuis la page Monitor Status (il est superposé à l’historique de transition des groupes). Vous pouvez également le consulter dans le flux d’événements en recherchant tags:audit,downtime, ou en précisant un ID de downtime spécifique : tags:audit,downtime_id:<ID_DOWNTIME>.

Désactivation

Les monitors déclenchent des événements lorsque leur statut, à savoir ALERT, WARNING, RESOLVED et NO DATA, change. Lorsqu’un monitor est désactivé ou fait l’objet d’un downtime planifié et que son statut passe de RESOLVED à un autre statut, aucun événement ni aucune notification ne se déclenche.

Remarque : si vous désactivez ou réactivez un monitor via l’IU, les downtimes planifiés associés à ce monitor ne sont pas supprimés. Pour modifier ou supprimer un downtime, utilisez la page Manage Downtimes ou passez par l’API.

Si le statut d’un monitor change durant un downtime (en passant par exemple de OK à ALERT, WARNING ou NO DATA) et reste identique après la fin d’un downtime planifié, aucune notification n’est envoyée. Toutefois, un événement de rétablissement se déclenche dès que des données sont renvoyées pour ce contexte ou dès que le statut du monitor repasse à OK.

Ce comportement a été conçu dans le but d’empêcher l’envoi d’alertes NO DATA lors de l’utilisation de la fonctionnalité Autoresolve. Si vous préférez que le monitor déclenche un événement NO DATA chaque fois que la désactivation prend fin, contactez l’équipe d’assistance Datadog afin de demander l’activation de cette fonctionnalité pour votre compte. Remarque : cela concerne uniquement les situations où un monitor termine une période de downtime avec un statut NO DATA.

Si un monitor déclenche une alerte avant un downtime et que le statut est rétabli pendant ce downtime, un événement de rétablissement est envoyé pendant ce downtime (s’il s’agit du premier rétablissement).

Rapport sur les monitors

Tous les statuts ayant déclenché une alerte sont inclus dans le rapport hebdomadaire sur les monitors, même si le monitor est en downtime.

Pour aller plus loin