개요
본 점검은 Datadog Agent로 Red Hat Gluster 스토리지 클러스터 서비스 상태, 볼륨, 브릭 상태를 모니터링합니다.
본 GlusterFS 통합은 Red Hat 벤더 및 오픈 소스 버전과 모두 호환됩니다.
설정
아래 지침을 따라 호스트에서 실행되는 Agent에 대해 이 점검을 설치 및 설정하세요. 컨테이너화된 환경의 경우, 이러한 지침을 적용하는 데 가이드가 필요하다면 자동탐지 통합 템플릿을 참조하세요.
설치
GlusterFS 점검은 Datadog Agent 패키지에 포함됩니다.
서버에 추가 설치할 필요가 없습니다.
설정
Agent 설정 디렉터리 루트의 conf.d/
폴더에서 glusterfs.d/conf.yaml
파일을 편집해 GlusterFS 성능 데이터 수집을 시작합니다. 사용할 수 있는 설정 옵션을 모두 보려면 glusterfs.d/conf.yaml 샘플을 참고하세요.
init_config:
## @param gstatus_path - string - optional - default: /opt/datadog-agent/embedded/sbin/gstatus
## Path to the gstatus command.
##
## A version of the gstatus is shipped with the Agent binary.
## If you are using a source install, specify the location of gstatus.
#
# gstatus_path: /opt/datadog-agent/embedded/sbin/gstatus
instances:
-
## @param min_collection_interval - number - optional - default: 60
## The GlusterFS integration collects cluster-wide metrics which can put additional workload on the server.
## Increase the collection interval to reduce the frequency.
##
## This changes the collection interval of the check. For more information, see:
## https://docs.datadoghq.com/developers/write_agent_check/#collection-interval
#
min_collection_interval: 60
참고: 기본값으로 gstatus
는 gluster
명령을 내부 호출하며, 해당 명령은 superuser로 실행해야 합니다. sudoers
파일에 다음 줄을 추가합니다.
dd-agent ALL=(ALL) NOPASSWD:/path/to/your/gstatus
GlusterFS 환경에 루트가 필요하지 않은 경우 use_sudo
설정 옵션을 false
로 설정합니다.
Agent를 재시작합니다.
로그 수집
Datadog 에이전트에서 로그 수집은 기본적으로 사용하지 않도록 설정되어 있습니다. datadog.yaml
파일에서 로그 수집을 사용하도록 설정합니다.
glusterfs.d/conf.yaml
파일에서 다음 설정 블록을 편집하여 GlusterFS 로그 수집을 시작합니다.
logs:
- type: file
path: /var/log/glusterfs/glusterd.log
source: glusterfs
- type: file
path: /var/log/glusterfs/cli.log
source: glusterfs
환경에 따라 path
파라미터 값을 변경합니다. 사용 가능한 모든 설정 옵션은 conf.yaml 샘플을 참조하세요.
- Agent를 재시작합니다.
Kubernetes 환경에서 로그 수집 Agent를 설정하는 방법에 대한 자세한 내용을 확인하려면 Kubernetes 로그 수집을 참조하세요.
검증
Agent 상태 하위 명령을 실행하고 점검 섹션에서 glusterfs
를 검색합니다.
수집한 데이터
메트릭
| |
---|
glusterfs.brick.block_size (gauge) | Block Size of brick Shown as byte |
glusterfs.brick.inodes.free (gauge) | Free inodes in brick Shown as byte |
glusterfs.brick.inodes.total (gauge) | Total inodes in brick Shown as byte |
glusterfs.brick.inodes.used (gauge) | Inode used in brick Shown as byte |
glusterfs.brick.online (gauge) | Number of bricks online Shown as unit |
glusterfs.brick.size.free (gauge) | Brick size free Shown as byte |
glusterfs.brick.size.total (gauge) | Total brick size Shown as byte |
glusterfs.brick.size.used (gauge) | Current bytes used in brick Shown as byte |
glusterfs.cluster.nodes.active (gauge) | Current active nodes Shown as node |
glusterfs.cluster.nodes.count (gauge) | Total number of nodes in cluster Shown as node |
glusterfs.cluster.volumes.count (gauge) | Number of volumes in cluster Shown as unit |
glusterfs.cluster.volumes.started (gauge) | Number of volumes started in cluster Shown as unit |
glusterfs.heal_info.entries.count (gauge) | Number of entries requiring healing Shown as unit |
glusterfs.subvol.disperse (gauge) | Disperse count of subvolume Shown as unit |
glusterfs.subvol.disperse_redundancy (gauge) | Disperse redundancy of subvolume Shown as unit |
glusterfs.subvol.replica (gauge) | Replicas in subvolume Shown as unit |
glusterfs.volume.bricks.count (gauge) | Number of bricks in volume Shown as unit |
glusterfs.volume.disperse (gauge) | Number of dispersed in volume Shown as unit |
glusterfs.volume.disperse_redundancy (gauge) | Number of disperse redundancy in volume Shown as unit |
glusterfs.volume.distribute (gauge) | Number of distributed Shown as unit |
glusterfs.volume.inodes.free (gauge) | Inodes free in volume Shown as byte |
glusterfs.volume.inodes.total (gauge) | Total size inodes in volume Shown as byte |
glusterfs.volume.inodes.used (gauge) | Used bytes of inodes in volume Shown as byte |
glusterfs.volume.online (gauge) | Number of volumes online Shown as unit |
glusterfs.volume.replica (gauge) | Replicas in volumes Shown as unit |
glusterfs.volume.size.free (gauge) | Bytes free in volume Shown as byte |
glusterfs.volume.size.total (gauge) | Bytes total in volume Shown as byte |
glusterfs.volume.size.used (gauge) | Bytes used in volume Shown as byte |
glusterfs.volume.snapshot.count (gauge) | number of snapshots of volume Shown as byte |
glusterfs.volume.used.percent (gauge) | percentage of volume used Shown as percent |
이벤트
GlusterFS는 이벤트를 포함하지 않습니다.
서비스 점검
glusterfs.brick.health
Returns CRITICAL
if the sub volume is ‘degraded’. Returns OK
if ‘up’.
Statuses: ok, critical, warning
glusterfs.volume.health
Returns CRITICAL
if the volume is ‘degraded’. Returns OK
if ‘up’.
Statuses: ok, critical, warning
glusterfs.cluster.health
Returns CRITICAL
if the volume is ‘degraded’. Returns OK
otherwise.
Statuses: ok, critical, warning
트러블슈팅
도움이 필요하신가요? Datadog 고객 지원팀에 문의하세요.