Hdfs

HDFS DataNode 통합

HDFS Dashboard

개요

각 HDFS DataNodes의 디스크 사용률과 실패한 볼륨을 추적합니다. 이 Agent 점검은 이러한 메트릭뿐만 아니라 블록 및 캐시 관련 메트릭도 수집합니다.

이 점검(hdfs_datanode)과 그에 대응하는 점검(hdfs_namenode)을 사용합니다. 이전의 두 가지 기능이 합쳐진 점검(hdfs)은 더 이상 권장되지 않습니다.

설정

호스트에서 실행 중인 Agent에 이 점검을 설치하고 구성하려면 아래 지침을 따르세요. 컨테이너화된 환경이라면 Autodiscovery 통합 템플릿에서 자세한 적용 방법을 확인하세요.

설치

HDFS DataNode 점검은 Datadog Agent 패키지에 포함되어 있으므로 DataNodes에 다른 것을 설치할 필요가 없습니다.

구성

Agent 연결

호스트

호스트에서 실행 중인 에이전트에 대해 이 점검을 구성하려면:

  1. 에이전트 구성 디렉터리 루트에 있는 conf.d/ 폴더에서 hdfs_datanode.d/conf.yaml 파일을 편집합니다. 사용할 수 있는 구성 옵션 전체를 보려면 hdfs_datanode.d/conf.yaml 샘플을 참고하세요.

    init_config:
    
    instances:
      ## @param hdfs_datanode_jmx_uri - string - required
      ## The HDFS DataNode check retrieves metrics from the HDFS DataNode's JMX
      ## interface via HTTP(S) (not a JMX remote connection). This check must be installed on a HDFS DataNode. The HDFS
      ## DataNode JMX URI is composed of the DataNode's hostname and port.
      ##
      ## The hostname and port can be found in the hdfs-site.xml conf file under
      ## the property dfs.datanode.http.address
      ## https://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml
      #
      - hdfs_datanode_jmx_uri: http://localhost:9864
    
  2. 에이전트를 재시작합니다.

컨테이너화된 환경

컨테이너화된 환경의 경우 자동탐지 통합 템플릿에 다음 파라미터를 적용하는 방법이 안내되어 있습니다.

파라미터
<INTEGRATION_NAME>hdfs_datanode
<INIT_CONFIG>비워두거나 {}
<INSTANCE_CONFIG>{"hdfs_datanode_jmx_uri": "http://%%host%%:9864"}

로그 수집

에이전트 >6.0에서 사용 가능

  1. Datadog 에이전트에서 로그 수집은 기본적으로 사용하지 않도록 설정되어 있습니다. datadog.yaml파일에서 사용하도록 설정합니다.

      logs_enabled: true
    
  2. DataNode 로그 수집을 시작하려면 hdfs_datanode.d/conf.yaml 파일에 다음 구성 블록을 추가합니다.

      logs:
        - type: file
          path: /var/log/hadoop-hdfs/*.log
          source: hdfs_datanode
          service: <SERVICE_NAME>
    

    pathservice 파라미터 값을 내 환경에 맞도록 변경합니다.

  3. 에이전트를 재시작합니다.

검증

에이전트 상태 하위 명령을 실행하고 점검 섹션에서 hdfs_datanode를 찾습니다.

수집한 데이터

메트릭

이벤트

HDFS-datanode 점검에는 이벤트가 포함되지 않습니다.

서비스 점검

트러블슈팅

도움이 필요하신가요? Datadog 지원팀에 문의하세요.

참고 자료

HDFS NameNode 통합

HDFS 대시보드

개요

클러스터가 불안정한 상태(NameNode가 하나만 남았을 때 또는 클러스터에 용량을 추가해야 할 때)로 전환되는 시점을 파악하기 위해 기본 대기 HDFS NameNodes를 모니터링합니다. 이 Agent 점검은 남은 용량, 손상/누락된 블록, 작동하지 않는 DataNodes, 파일 시스템 부하, 적게 복제된 블록, 전체 볼륨 장애(모든 DataNodes에서) 등에 메트릭을 수집합니다.

이 점검(hdfs_namenode)과 그에 대응하는 점검(hdfs_datanode)을 사용합니다. 이전의 두 가지 기능이 합쳐진 점검(hdfs)은 더 이상 권장되지 않습니다.

설정

호스트에서 실행 중인 Agent에 이 점검을 설치하고 구성하려면 아래 지침을 따르세요. 컨테이너화된 환경이라면 Autodiscovery 통합 템플릿에서 자세한 적용 방법을 확인하세요.

설치

HDFS NameNode 점검은 Datadog Agent 패키지에 포함되어 있으므로 NameNodes에 다른 것을 설치할 필요가 없습니다.

구성

Agent 연결

호스트

호스트에서 실행 중인 에이전트에 대해 이 점검을 구성하려면:

  1. 에이전트 구성 디렉터리 루트에 있는 conf.d/ 폴더에서 hdfs_namenode.d/conf.yaml 파일을 편집합니다. 사용할 수 있는 구성 옵션 전체를 보려면 hdfs_namenode.d/conf.yaml 샘플을 참고하세요.

    init_config:
    
    instances:
      ## @param hdfs_namenode_jmx_uri - string - required
      ## The HDFS NameNode check retrieves metrics from the HDFS NameNode's JMX
      ## interface via HTTP(S) (not a JMX remote connection). This check must be installed on
      ## a HDFS NameNode. The HDFS NameNode JMX URI is composed of the NameNode's hostname and port.
      ##
      ## The hostname and port can be found in the hdfs-site.xml conf file under
      ## the property dfs.namenode.http-address
      ## https://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml
      #
      - hdfs_namenode_jmx_uri: http://localhost:9870
    
  2. 에이전트를 재시작합니다.

컨테이너화된 환경

컨테이너화된 환경의 경우 자동탐지 통합 템플릿에 다음 파라미터를 적용하는 방법이 안내되어 있습니다.

파라미터
<INTEGRATION_NAME>hdfs_namenode
<INIT_CONFIG>비워두거나 {}
<INSTANCE_CONFIG>{"hdfs_namenode_jmx_uri": "https://%%host%%:9870"}

로그 수집

에이전트 >6.0에서 사용 가능

  1. Datadog 에이전트에서 로그 수집은 기본적으로 사용하지 않도록 설정되어 있습니다. datadog.yaml파일에서 사용하도록 설정합니다.

      logs_enabled: true
    
  2. NameNode 로그 수집을 시작하려면 hdfs_namenode.d/conf.yaml 파일에 다음 구성 블록을 추가합니다.

      logs:
        - type: file
          path: /var/log/hadoop-hdfs/*.log
          source: hdfs_namenode
          service: <SERVICE_NAME>
    

    pathservice 파라미터 값을 내 환경에 맞도록 변경합니다.

  3. 에이전트를 재시작합니다.

검증

에이전트 상태 하위 명령을 실행하고 점검 섹션에서 hdfs_namenode를 찾습니다.

수집한 데이터

메트릭

이벤트

HDFS-namenode 점검에는 이벤트가 포함되지 않습니다.

서비스 점검

트러블슈팅

도움이 필요하신가요? Datadog 지원팀에 문의하세요.

참고 자료