Colas de mensajes fallidos
Data Streams Monitoring no está disponible para el sitio .
Data Streams Monitoring (DSM) proporciona visibilidad de tus colas de mensajes faliidos (DLQ) no vacías, lo que te permite monitorizar e inspeccionar los fallos en el procesamiento de mensajes. DSM también te permite corregir estos fallos de procesamiento de mensajes directamente en Datadog.
La monitorización de las colas de mensajes fallidos está disponible para las colas de Amazon SQS.
Monitorizar DLQ
Configuración
Utilización
Crear un monitor (noun) para una cola de mensajes fallidos
Para saber si tu cola está redirigiendo mensajes a su DLQ, puedes crear un monitor (noun) de métricas que alerte sobre la métrica data_streams.sqs.dead_letter_queue.messages.
Para crear un monitor (noun) para la DLQ de una cola:
- En Datadog, ve a Data Streams Monitoring.
- Selecciona la pestaña Explore (Explorar) (predeterminada).
- Haz clic en una cola admitida para abrir su panel lateral.
- Selecciona la pestaña Dead Letter Queue (Cola de mensajes fallidos).
- Haz clic en Create Monitor (Crear monitor (noun)) para abrir una page (página) de configuración de monitor (noun). Las entradas predeterminadas son suficientes para crear un monitor (noun) que alerte cuando tu DLQ no esté vacío, pero también puedes realizar configuraciones adicionales en esta page (página) si lo deseas.
- Haz clic en Create (Crear) en la parte inferior de la page (página).
Detectar problemas de procesamiento de mensajes
Data Streams Monitoring te ayuda a detectar dónde no se han podido procesar los mensajes y qué servicios posteriores podrían verse afectados:
El DSM Service Map (mapa de servicios) resalta las colas con mensajes en sus DLQ, lo que te ayuda a identificar visualmente dónde se producen los fallos.
En la page (página) de DSM Issues (problemas) se enumeran todas las colas que están experimentando problemas de procesamiento de mensajes
Solucionar los problemas de DLQ
Puedes inspeccionar y resolver DLQ no vacíos directamente en Datadog con Datadog Actions.
Configuración
En Datadog, crea una connection (conexión). Necesitas una entidad IAM para realizar las acciones. Esta entidad IAM puede ser un Usuario IAM (con una clave de acceso secreta) o un Rol IAM (asumido con sts:AssumeRole) y tener los siguientes permisos:
sqs:ReceiveMessage (para información)sqs:StartMessageMoveTask (para redirigir)sqs:PurgeQueue (para purgar)
Estos permisos pueden aplicarse globalmente a todas las colas SQS o restringirse a colas específicas.
Utilización
Después de configurar la connection (conexión), puedes hacer clic en una cola admitida para abrir su panel lateral, donde puedes utilizar las siguientes acciones:
- Información para inspeccionar el contenido del mensaje fallido e identificar la causa raíz
- Redirigir para volver a poner en cola los mensajes para otro intento de procesamiento
- Purgar para borrar los mensajes que ya no es necesario procesar
Solucionar problemas
Si no puedes ver la información de la cola de mensajes fallidos:
- Confirma que has instalado la integración de Datadog-AWS
- Confirma que tu rol de AWS utiliza la política
AmazonSQSReadOnlyAccess gestionada por AWS. - Confirma que tu rol tiene los permisos
sqs:ListQueues y sqs:GetQueueAttributes