- 필수 기능
- 시작하기
- Glossary
- 표준 속성
- Guides
- Agent
- 통합
- 개방형텔레메트리
- 개발자
- Administrator's Guide
- API
- Datadog Mobile App
- CoScreen
- Cloudcraft
- 앱 내
- 서비스 관리
- 인프라스트럭처
- 애플리케이션 성능
- APM
- Continuous Profiler
- 스팬 시각화
- 데이터 스트림 모니터링
- 데이터 작업 모니터링
- 디지털 경험
- 소프트웨어 제공
- 보안
- AI Observability
- 로그 관리
- 관리
네트워킹 항목에서 다룬 바와 같이, Datadog은 리전당 하나의 관측성 파이프라인 작업자 애그리게이터(aggregator)로 시작할 것을 권장합니다. 이는 관측성 파이프라인 작업자의 초기 배포가 지나치게 복잡해지는 것을 방지하기 위한 것이지만, 다음과 같이 다중 배포로 시작하는 것이 적합한 상황도 있습니다.
공용 인터넷을 통한 데이터 전송 방지. 다중 클라우드와 리전이 있는 경우, 각 클라우드와 리전에 관측성 파이프라인 작업자 애그리게이터(aggregator)를 배포하여 인터넷을 통해 다량의 데이터가 전송되는 것을 방지합니다. 관측성 파이프라인 작업자 애그리게이터(aggregator)는 내부 데이터를 수신하고 네트워크의 단일 출구 포인트 역할을 해야 합니다.
독립적 관리. 사용 사례에 따라 관측성 파이프라인 작업자 애그리게이터(aggregator)를 독립적으로 운영 및 관리할 수 있는 팀이 있습니다. 예를 들어, 데이터 사이언스 팀은 자체적 인프라스트럭처 운영 책임을 지고 자체 가시성 파이프라인 작업자 애그리게이터(aggregator)를 독립적으로 운영할 수단을 가지고 있을 수 있습니다.
많은 사용자가 VPC와 클러스터 내부에 다중 클라우드 계정을 가지고 있습니다. Datadog은 이러한 경우에도 여전히 리전당 하나의 관측성 파이프라인 작업자 애그리게이터(aggregator)를 배포할 것을 권장합니다. 유틸리티 또는 툴 클러스터에 관측성 파이프라인 작업자를 배포하여 모든 클라우드 계정이 해당 클러스터로 데이터를 전송하도록 설정하세요. 자세한 내용은 네트워킹을 참조하세요.
아키텍처를 고가용성 또는 고내구성으로 만들기 위해서 Kafka 같은 Pub-Sub 시스템을 사용할 필요는 없지만(고가용성 및 장애 복구 항목 참조), 다음과 같은 이점이 있습니다.
안정성이 향상됩니다. Pub-Sub 시스템은 자주 변경되지 않는 매우 안정적이고 내구성 있는 시스템으로 설계되었습니다. 관리형 옵션을 사용하는 경우 특히 더 안정적입니다. 관측성 파이프라인 작업자는 목적에 따라 더 자주 변경될 가능성이 높습니다. 클라이언트 인식의 가용성을 높이고 복구 절차를 보다 간단하게 만들려면 관측성 파이프라인 작업자 다운타임을 Pub-Sub 시스템 뒤로 따로 분리합니다.
로드 밸런서가 필요하지 않습니다. Pub-Sub 시스템에서 로드 밸런서를 사용할 필요가 없습니다. Pub-Sub 시스템이 컨슈머 조정을 처리하므로 관측성 파이프라인 작업자를 더 쉽게 수평 확장할 수 있습니다.
파티셔닝, 즉 Kafka 용어로 ‘토픽’은 Pub-Sub 시스템에서 데이터를 분리하는 것을 의미합니다. 데이터를 생성한 서비스 또는 호스트 등 데이터 출처 라인을 따라 파티셔닝합니다.
Pub-Sub 시스템을 사용하는 경우, Datadog은 관측성 파이프라인 작업자에 대해 다음과 같은 설정 변경을 권장합니다.
본 섹션에서는 레거시 대상에 대한 전역 계산을 수행하기 위한 권장 사항을 제공해 드립니다. 최신 대상은 이미 전역 계산을 지원합니다. 예를 들어 Datadog은 메트릭 데이터의 전역 관측성을 해결하는 분포(예: DDSketch)를 지원합니다.
전역 집계는 전체 리전에 대한 데이터를 집계하는 기능을 뜻합니다. 예를 들어, CPU 로드 평균에 대한 전역 사분위수를 계산할 수 있습니다. 이를 계산하려면 단일 관측성 파이프라인 작업자 인스턴스가 모든 노드의 CPU 로드 평균 통계에 액세스할 수 있어야 합니다. 수평 확장 시에는 불가능하며, 각 개별 관측성 파이프라인 작업자 인스턴스는 전체 데이터의 일부만 액세스할 수 있습니다. 따라서 집계는 계층화되어야 합니다.
위 다이어그램에서 티어 2 애그리게이터는 티어 1 애그리게이터로부터 전체 데이터의 집계된 하위 스트림을 받습니다. 이러한 방법으로 단일 인스턴스가 전체 스트림을 처리하지 않고 단일 장애점을 발생시키지 않고도 전역 보기를 얻을 수 있습니다.