Este producto no es compatible con el sitio Datadog seleccionado. ().

Información general

Incident AI transforma el modo en que tu equipo gestiona incidentes automatizando las tareas de coordinación y proporcionando información inteligente a lo largo del ciclo de vida de incidente. Integrado en Datadog Incident Management, funciona en Slack y en la plataforma Datadog para ayudarte a responder más rápido y aprender de cada incidente.

Entre sus principales funciones figuran:

  • Resúmenes de incidentes: Obtén resúmenes contextualizados cuando te unas a canales de incidentes.
  • Detección de incidentes relacionados: Detección automática de incidentes relacionados para identificar problemas sistémicos y recurrentes.
  • Solicitar información o tomar medidas: Declara incidentes, actualiza la gravedad y el estado, busca en el historial de incidente y mucho más, todo ello a través de mensajes conversacionales en Slack.
  • Notificaciones mejoradas por IA: Rellena dinámicamente las actualizaciones de las partes interesadas con resúmenes generados por IA de los factores contribuyentes, del impacto y de las correcciones a través de correo electrónico, MS Teams, Slack y otros canales.
  • Seguimiento automatizado: Incident AI recopila elementos de acción mencionados durante los incidentes y los sugiere como tareas de seguimiento cuando se resuelve el incidente.
  • Informes retrospectivos inteligentes: Genera primeros borradores exhaustivos con secciones basadas en IA que cubren resúmenes ejecutivos, plazos, impacto en el cliente y lecciones aprendidas, para proporcionar a los intervinientes una base sólida sobre la que apoyarse.

Empezar con la coordinación de incidentes

Incident AI ayuda a coordinar los incidentes, especialmente los que implican a varios equipos, sugiriendo los pasos a seguir a lo largo del ciclo de vida del incident). Esto agiliza la comunicación y mejora la gestión general de los procesos.

  1. Conecta Datadog a Slack.
    1. En cualquier canal de Slack, ejecuta el comando /dd connect.
    2. Sigue las instrucciones en pantalla para completar el proceso de conexión.
  2. Activa la integración Slack en Datadog Incident Management.
    1. En la sección Integraciones de la configuración de incidentes, busca la configuración de Slack.
    2. Activa los siguientes conmutadores:
      • Enviar mensajes del canal Slack a la línea de tiempo del incidente
      • Activa las funciones de Incident AI en canales de incidentes de Slack de tu organización.
        Nota: Las funciones de gestión de incidentes de Incident AI solo pueden activarse para una organización Datadog dentro de un único espacio de trabajo de Slack.
  3. Para interactuar con Incident AI en un canal de Slack, invítalo ejecutando el comando @Datadog.

Personalizar las notificaciones a las partes interesadas

Incident AI puede rellenar dinámicamente detalles clave en las notificaciones a las partes interesadas, proporcionando actualizaciones más claras y rápidas a través de las herramientas que tu equipo ya utiliza. Las reglas de notificación admiten el envío a una amplia variedad de destinos, como correo electrónico, Datadog On-Call, MS Teams, Slack, etc., lo que garantiza que las actualizaciones mejoradas con IA lleguen a las personas adecuadas, en la plataforma adecuada y en el momento oportuno.

  1. En la configuración de incidentes, ve a Plantillas de notificación.
  2. Crea una nueva plantilla o edita una existente.
  3. En el cuerpo del mensaje, inserta cualquiera de las siguientes variables de IA:
    CampoVariable
    Factores contribuyentes IA{{incident.ai_contributing_factors}}
    Impacto IA{{incident.ai_impact}}
    Problema IA{{incident.ai_issue}}
    Corrección IA{{incident.ai_remediation}}
    Plantilla de nuevo mensaje con variables de IA en ella
  4. Haz clic en Save (Guardar) para guardar la plantilla.
  5. Ve a las reglas de notificación de tu incidente.
  6. Haz clic en Nueva Regla.
  7. En Con plantilla…, selecciona la plantilla de mensaje que acabas de crear.
  8. Haz clic en Save (Guardar) para guardar la regla de notificación.

Resúmenes de incidente proactivos

Al unirte a un canal de incidentes en Slack (conectado a Datadog Incident Management), Incident AI publica automáticamente un resumen con información clave del incidente, como los factores contribuyentes, el impacto, el problema y la solución. Esto también se puede solicitar ad-hoc utilizando /dd incident (incidente) summary. Este resumen solo es visible para ti.

Cuando un incidente pasa a resuelto, Incident AI publica un resumen final. Esto es visible para todos en el canal.

Ejemplo de resumen de incidentes en Slack

Sugerencia de tarea de seguimiento proactiva

Una vez resuelto un incidente, Incident AI recopila todas las tareas de seguimiento que los intervinientes hayan mencionado durante el incidente. A continuación, se te pide que las revises y las crees con un solo clic. Estas tareas se guardan como seguimientos de incidentes en Datadog Incident Management. Para obtener más información, consulta Seguimientos de incidentes.

Para ver las tareas de seguimiento sugeridas:

  1. Ve a un incidente pertinente en Datadog.
  2. Abre la pestaña Post-Incident (Post incidente) para ver una lista de todas las tareas de seguimiento que has guardado desde Slack.

Detección de incidentes relacionados

Incident AI señala automáticamente los incidentes relacionados si se declaran con menos de 20 minutos de diferencia, lo que te ayuda a identificar problemas sistémicos más amplios.

Chatear con Incident AI

Utiliza mensajes en lenguaje natural para solicitar información o tomar medidas desde Slack:

FuncionalidadEjemplo de mensaje
Declarar una incidencia@Datadog Declare an incident
Cambiar la gravedad@Datadog Update this incident to SEV-3
Cambiar el estado@Datadog Mark this incident as stable
@Datadog Resolve this incident
Solicitar un nuevo resumen@Datadog Give me a summary of this incident
@Datadog Summarize incident-262
Nota: Los incidentes privados no se resumen.
Buscar el historial de incidentes@Datadog How many incidents are currently ongoing?
@Datadog Show me all Sev-1 incidents that occurred in the past week.
Profundizar en incidentes concretos@Datadog What was the root cause of incident-123?
@Datadog What remediation actions did the responders take in incident-123?
Buscar incidentes relacionados@Datadog Are there any related incidents?
@Datadog Find me incidents related to DDoS attacks from the past month
Investigación de detección precoz@Datadog A customer is unable to check out. Is there an incident?
@Datadog Are there any incidents now impacting the payments service?

Personaliza las plantillas retrospectivas con variables de incidentes IA

  1. En Datadog, ve a las plantillas retrospectivas de tu incidente.
  2. Haz clic en New Postmortem Template (Nueva plantilla retrospectiva).
  3. Personaliza tu plantilla utilizando las siguientes variables de IA para obtener un contenido dinámico generado por AI:
    DescripciónVariable
    Resumen ejecutivo{{incident.ai_summary}}
    Contexto y dependencias del sistema{{incident.ai_system_overview}}
    Línea de tiempo de eventos clave{{incident.ai_key_timeline}}
    Resumen del impacto en el cliente{{incident.ai_customer_impact}}
    Acciones de seguimiento{{incident.ai_action_items}}
    Lecciones clave para la prevención futura{{incident.ai_lessons_learned}}

    Nota: Las variables de IA deben ir precedidas de una cabecera de sección.

  4. Haz clic en Save (Guardar). Tu nueva plantilla aparecerá como una opción de plantilla durante la generación de la plantilla retrospectiva.

Generar un primer borrador del análisis retrospectivo del incidente

Para generar un borrador de un análisis retrospectivo asistido por IA:

  1. En Datadog, ve al incidente resuelto del que quieres generar un análisis retrospectivo.
  2. Asegúrate de que la línea de tiempo del incidente contiene al menos 10 mensajes.
  3. Haz clic en Generate Postmortem (Generar análisis retrospectivo).
  4. En Elegir plantilla, selecciona la plantilla predefinida Incidente general con contenido de IA o una plantilla personalizada que hayas creado.
  5. Haz clic en Generate (Generar). Espera hasta un minuto para que se genere el análisis retrospectivo. No cierres la pestaña durante este tiempo.
  6. Revisa el borrador del análisis retrospectivo generado mediante IA. Sirve como punto de partida para los intervinientes en el incidente. Datadog recomienda revisar y perfeccionar el borrador antes de compartirlo.

Referencias adicionales