(LEGACY) Alta disponibilidad y recuperación ante desastres
Observability Pipelines no está disponible en el sitio US1-FED de Datadog.
Esta guía es para grandes despliegues a nivel de producción.
En el contexto de Observability Pipelines, la alta disponibilidad se refiere a que el worker de Observability Pipelines permanezca disponible si se produce algún problema en el sistema.
Para lograr una alta disponibilidad:
- Despliega al menos dos instancias del worker de Observability Pipelines en cada zona de disponibilidad.
- Despliegue el worker de Observability Pipelines en al menos dos zonas de disponibilidad.
- Enfrenta tus instancias del worker de Observability Pipelines con un balanceador de carga que equilibre el tráfico entre las instancias del worker de Observability Pipelines. Para obtener más información, consulta Planificación y escalado de capacidades.
Mitigación en casos de fallo
Gestión de problemas relacionados con los procesos del worker de Observability Pipelines
Para mitigar un problema relacionado con el proceso de un sistema, distribuye el worker de Observability Pipelines entre varios nodos y enfréntalos con un balanceador de carga de red que pueda redirigir el tráfico a otra instancia del worker de Observability Pipelines. Además, la autorreparación automatizada a nivel de plataforma debería reiniciar el proceso o sustituir el nodo.
Mitigación de fallos en nodos
Para mitigar un problema relacionado con un nodo, distribuye el worker de Observability Pipelines entre varios nodos y enfréntalos con un balanceador de carga de red que pueda redirigir el tráfico a otro nodo del worker de Observability Pipelines. Además, la autorreparación automatizada a nivel de plataforma debería sustituir el nodo.
Gestión de los fallos en las zonas de disponibilidad
Para mitigar los problemas relacionados con las zonas de disponibilidad, despliega el worker de Observability Pipelines en varias zonas de disponibilidad.
Mitigación de fallos en regiones
El worker de Observability Pipelines está diseñado para enrutar datos de observabilidad internos y no debe conmutar por error a otra región, sino que debería desplegarse en todas tus regiones. Por lo tanto, si toda tu red o región fallan, el worker de Observability Pipelines falla con ellas. Para obtener más información, consulta Redes.
Recuperación ante desastres
Recuperación ante desastres internos
El worker de Observability Pipelines es una herramienta de nivel de infraestructura diseñada para enrutar datos internos de observabilidad. Implementa una arquitectura de nada compartido y no gestiona estados que deban replicarse o transferirse a un sitio de recuperación ante desastres (DR). Por lo tanto, si toda tu región falla, el worker de Observability Pipelines falla con ella. Por lo tanto, debes instalar el worker de Observability Pipelines en tu sitio de DR como parte de tu plan de DR más amplio.
Recuperación ante desastres externos
Si estás utilizando un destino gestionado, como Datadog, el worker de Observability Pipelines puede facilitar el enrutamiento automático de datos a tu sitio de DR Datadog utilizando la función de disyuntor del worker de Observability Pipelines.