Ambari

Supported OS Mac OS

Integration version4.2.1

개요

이 검사는 Datadog Agent를 통해 Ambari를 모니터링합니다.

설정

설치

Ambari 검사는 Datadog Agent 패키지에 포함되어 있어 서버에 추가 설치가 필요하지 않습니다.

구성

호스트

호스트에서 실행 중인 Agent에 대해 이 검사를 설정하려면:

메트릭 수집
  1. Ambari 성능 데이터 수집을 시작하려면 Agent 구성 디렉터리 루트에 있는 conf.d/ 폴더에서 ambari.d/conf.yaml 파일을 편집합니다. 사용 가능한 모든 구성 옵션은 샘플 ambari.d/conf.yaml을 참조하세요.

    init_config:
    
    instances:
      ## @param url - string - required
      ## The URL of the Ambari Server, include http:// or https://
      #
      - url: localhost
    
  2. Agent를 재시작합니다.

로그 수집

Agent 버전 6.0 이상에서 사용 가능

  1. Datadog Agent에서 로그 수집은 기본적으로 비활성화되어 있으므로 datadog.yaml 파일에서 활성화합니다.

    logs_enabled: true
    
  2. 맨 아래 logs 줄의 주석을 제거하여 ambari.d/conf.yaml을 편집합니다. Ambari 로그 파일의 올바른 경로로 로그 path를 업데이트하세요.

      logs:
        - type: file
          path: /var/log/ambari-server/ambari-alerts.log
          source: ambari
          service: ambari
          log_processing_rules:
              - type: multi_line
                name: new_log_start_with_date
                # 2019-04-22 15:47:00,999
                pattern: \d{4}\-(0?[1-9]|1[012])\-(0?[1-9]|[12][0-9]|3[01])
      ...
    
  3. Agent를 재시작합니다.

컨테이너화

컨테이너화된 환경의 경우 자동탐지 통합 템플릿에 다음 파라미터를 적용하는 방법이 안내되어 있습니다.

메트릭 수집
파라미터
<INTEGRATION_NAME>ambari
<INIT_CONFIG>비어 있음 또는 {}
<INSTANCE_CONFIG>{"url": "http://%%host%%"}
로그 수집

Agent 버전 6.0 이상에서 사용 가능

Datadog Agent에서 로그 수집은 기본값으로 비활성화되어 있습니다. 이를 활성화하려면 쿠버네티스(Kubernetes) 로그 수집을 참조하세요.

파라미터
<LOG_CONFIG>`{“source”: “ambari”, “service”: “<SERVICE_NAME>”, “log_processing_rules”:{“type”:“multi_line”,“name”:“new_log_start_with_date”,“pattern”:"\d{4}-(0?[1-9]

검증

Agent의 상태 하위 명령을 실행하고 Checks 섹션에서 ambari를 찾으세요.

수집한 데이터

이 통합은 모든 클러스터의 모든 호스트에 대해 다음 시스템 메트릭을 수집합니다.

  • boottime
  • cpu
  • disk
  • memory
  • load
  • network
  • process

collect_service_metrics로 서비스 메트릭 수집이 활성화된 경우 이 통합은 포함된 각 서비스 구성 요소에 대해 포함 목록의 헤더가 있는 메트릭을 수집합니다.

메트릭

ambari.boottime
(gauge)
Host boot time.
Shown as millisecond
ambari.cpu.cpu_idle
(gauge)
Host Idle CPU.
Shown as percent
ambari.cpu.cpu_nice
(gauge)
Host Nice CPU.
Shown as percent
ambari.cpu.cpu_num
(gauge)
Host Idle CPU.
ambari.cpu.cpu_system
(gauge)
Host System CPU.
Shown as percent
ambari.cpu.cpu_user
(gauge)
Host User CPU.
Shown as percent
ambari.cpu.cpu_wio
(gauge)
Host CPU waiting for IO.
Shown as percent
ambari.disk.disk_free
(gauge)
Free disk space.
Shown as byte
ambari.disk.disk_total
(gauge)
Total disk size.
Shown as byte
ambari.disk.read_bytes
(gauge)
Read bytes.
Shown as byte
ambari.disk.read_count
(gauge)
Read count.
ambari.disk.read_time
(gauge)
Disk read time.
Shown as millisecond
ambari.disk.write_bytes
(gauge)
Written bytes.
Shown as byte
ambari.disk.write_count
(gauge)
Written count.
ambari.disk.write_time
(gauge)
Disk write time.
Shown as millisecond
ambari.load_fifteen
(gauge)
Load fifteen.
Shown as percent
ambari.load_five
(gauge)
Load Five.
Shown as percent
ambari.load_one
(gauge)
Load one.
Shown as percent
ambari.memory.mem_cached
(gauge)
Cached Memory.
Shown as byte
ambari.memory.mem_free
(gauge)
Free Memory.
Shown as byte
ambari.memory.mem_shared
(gauge)
Shared Memory.
Shown as byte
ambari.memory.mem_total
(gauge)
Total Memory
Shown as byte
ambari.memory.swap_free
(gauge)
Free Swap
Shown as byte
ambari.memory.swap_total
(gauge)
Total Swap
Shown as byte
ambari.network.bytes_in
(gauge)
Network bytes in.
Shown as byte
ambari.network.bytes_out
(gauge)
Network bytes out.
Shown as byte
ambari.network.pkts_in
(gauge)
Network packets in.
Shown as byte
ambari.network.pkts_out
(gauge)
Network packets out.
Shown as byte
ambari.process.proc_run
(gauge)
Process run.
ambari.process.proc_total
(gauge)
Process total.

이벤트

Ambari에는 이벤트가 포함되어 있지 않습니다.

서비스 점검

ambari.can_connect
Returns OK if the cluster is reachable, CRITICAL otherwise.
Statuses: ok, critical

ambari.state
Returns OK if the service is installed or running, WARNING if the service is stopping or uninstalling, CRITICAL if the service is uninstalled or stopped.
Statuses: ok, warning, critical

트러블슈팅

도움이 필요하신가요? Datadog 지원 팀에 문의하세요.