개요
본 점검은 Datadog Agent로 Red Hat Gluster 스토리지 클러스터 서비스 상태, 볼륨, 브릭 상태를 모니터링합니다.
본 GlusterFS 통합은 Red Hat 벤더 및 오픈 소스 버전과 모두 호환됩니다.
설정
아래 지침에 따라 호스트에서 실행 중인 Agent에 이 점검을 설치하고 설정하세요. 컨테이너화된 환경의 경우 Autodiscovery 통합 템플릿에서 해당 지침을 적용하는 방법에 관한 가이드를 참고하세요.
설치
GlusterFS 점검은 Datadog Agent 패키지에 포함되어 있습니다.
서버에 추가로 설치할 필요가 없습니다.
설정
Agent의 구성 디렉터리 루트에서 conf.d/ 폴더의 glusterfs.d/conf.yaml 파일을 편집해 GlusterFS 성능 데이터 수집을 시작할 수 있습니다. 모든 가용 구성 옵션을 보려면 glusterfs.d/conf.yaml 샘플을 참조하세요.
init_config:
## @param gstatus_path - string - optional - default: /opt/datadog-agent/embedded/sbin/gstatus
## Path to the gstatus command.
##
## A version of the gstatus is shipped with the Agent binary.
## If you are using a source install, specify the location of gstatus.
#
# gstatus_path: /opt/datadog-agent/embedded/sbin/gstatus
instances:
-
## @param min_collection_interval - number - optional - default: 60
## The GlusterFS integration collects cluster-wide metrics which can put additional workload on the server.
## Increase the collection interval to reduce the frequency.
##
## This changes the collection interval of the check. For more information, see:
## https://docs.datadoghq.com/developers/write_agent_check/#collection-interval
#
min_collection_interval: 60
참고: 기본값으로 gstatus는 gluster 명령을 내부 호출하며, 해당 명령은 superuser로 실행해야 합니다. sudoers 파일에 다음 줄을 추가합니다.
dd-agent ALL=(ALL) NOPASSWD:/path/to/your/gstatus
GlusterFS 환경에 루트가 필요하지 않은 경우 use_sudo 설정 옵션을 false로 설정합니다.
Agent를 다시 시작합니다.
로그 수집
로그 수집은 Datadog 에이전트에서 기본적으로 비활성화되어 있습니다. datadog.yaml 파일에서 활성화합니다.
glusterfs.d/conf.yaml 파일에서 다음 설정 블록을 편집하여 GlusterFS 로그 수집을 시작합니다.
logs:
- type: file
path: /var/log/glusterfs/glusterd.log
source: glusterfs
- type: file
path: /var/log/glusterfs/cli.log
source: glusterfs
환경에 맞게 path 파라미터 값을 변경합니다. 모든 가용 구성 옵션은 샘플 conf.yaml을 참조하세요.
- Agent를 다시 시작합니다.
Kubernetes 환경에서 로그 수집 Agent를 설정하는 방법에 대한 자세한 내용을 확인하려면 Kubernetes 로그 수집을 참조하세요.
검증
Agent 상태 하위 명령을 실행하고 Checks 섹션에서 glusterfs을 찾습니다.
수집한 데이터
Metrics
| |
|---|
glusterfs.brick.block_size (게이지) | 브릭의 블록 크기 byte로 표시됨 |
glusterfs.brick.inodes.free (게이지) | 브릭의 사용 가능한 아이노드 byte로 표시됨 |
glusterfs.brick.inodes.total (게이지) | 브릭의 총 아이노드 byte로 표시됨 |
glusterfs.brick.inodes.used (게이지) | 브릭에서 사용된 아이노드 byte로 표시됨 |
glusterfs.brick.online (게이지) | 온라인 브릭 개수 unit으로 표시됨 |
glusterfs.brick.size.free (게이지) | 사용 가능한 브릭 크기 byte로 표시됨 |
glusterfs.brick.size.total (게이지) | 브릭의 총 크기 byte로 표시됨 |
glusterfs.brick.size.used (게이지) | 브릭에서 사용된 현재 바이트 byte로 표시됨 |
glusterfs.cluster.nodes.active (게이지) | 현재 활성 노드 node로 표시됨 |
glusterfs.cluster.nodes.count (게이지) | 클러스터의 총 노드 수 node로 표시됨 |
glusterfs.cluster.volumes.count (게이지) | 클러스터의 볼륨 수 unit으로 표시됨 |
glusterfs.cluster.volumes.started (게이지) | 클러스터에서 시작된 볼륨 수 unit으로 표시됨 |
glusterfs.subvol.disperse (게이지) | 하위 볼륨의 분산 개수 unit으로 표시됨 |
glusterfs.subvol.disperse_redundancy (게이지) | 하위 볼륨의 분산 중복 unit으로 표시됨 |
glusterfs.subvol.replica (게이지) | 하위 볼륨의 복제본 unit으로 표시됨 |
glusterfs.volume.bricks.count (게이지) | 볼륨의 브릭 개수 unit으로 표시됨 |
glusterfs.volume.disperse (게이지) | 볼륨에 분산된 개수 unit으로 표시됨 |
glusterfs.volume.disperse_redundancy (게이지) | 볼륨의 분산 중복 수 unit으로 표시됨 |
glusterfs.volume.distribute (게이지) | 분산된 개수 unit으로 표시됨 |
glusterfs.volume.inodes.free (게이지) | 볼륨 내 여유 아이노드 byte로 표시됨 |
glusterfs.volume.inodes.total (게이지) | 볼륨의 아이노드 총 크기 byte로 표시됨 |
glusterfs.volume.inodes.used (게이지) | 볼륨 내 사용된 아이노드 바이트 byte로 표시됨 |
glusterfs.volume.online (게이지) | 온라인 볼륨 수 unit으로 표시됨 |
glusterfs.volume.replica (게이지) | 볼륨의 복제본 unit으로 표시됨 |
glusterfs.volume.size.free (게이지) | 볼륨 내 여유 바이트 byte로 표시됨 |
glusterfs.volume.size.total (게이지) | 볼륨의 총 바이트 byte로 표시됨 |
glusterfs.volume.size.used (게이지) | 볼륨 내 사용된 바이트 byte로 표시됨 |
glusterfs.volume.snapshot.count (게이지) | 볼륨의 스냅샷 개수 unit으로 표시됨 |
glusterfs.volume.used.percent (게이지) | 사용된 볼륨의 백분율 percent로 표시 |
이벤트
GlusterFS는 이벤트를 포함하지 않습니다.
서비스 점검
glusterfs.brick.health
하위 볼륨이 ‘degraded’면 CRITICAL을 반환합니다. ‘up’이면 OK를 반환합니다.
상태: ok, critical, warning
glusterfs.volume.health
볼륨이 ‘degraded’면 CRITICAL을 반환합니다. ‘up’이면 OK를 반환합니다.
상태: ok, critical, warning
glusterfs.cluster.health
볼륨이 ‘degraded’면 CRITICAL을 반환합니다. ‘up’이면 OK를 반환합니다.
상태: ok, critical, warning
트러블슈팅
도움이 필요하세요? Datadog 지원 팀에 문의하세요.