모니터 상태

개요

모니터를 생성한 후 모니터 상태 페이지를 사용해 시간에 따른 상태를 봅니다.

모니터 상태 페이지

헤더

헤더는 모니터 상태, 상태 시간, 모니터 이름을 포함합니다. 오른쪽에는 음소거, 확인 및 설정 톱니 버튼이 있습니다.

음소거

음소거 버튼을 사용해 전체 모니터를 음소거하거나 범위를 설정하여 부분적으로 음소거합니다. 사용 가능한 범위는 모니터의 그룹 태그를 기준으로 합니다. 동시에 여러 범위 또는 모니터를 음소거하는 방법에 대한 상세 정보는 다운타임을 참조하세요.

참고: UI를 사용하여 모니터를 음소거하거나 음소거하지 않으면 해당 모니터와 연결된 모든 예약 다운타임을 삭제합니다.

확인

모니터가 알림 상태에 있는 경우 확인 버튼이 표시됩니다. 이 버튼을 사용해 모니터를 직접 확인합니다.

모니터 resolve 기능은 다음 평가 때 인위적으로 모니터 상태를 OK로 전환합니다. 다음 모니터 평가는 보통 모니터 기반 데이터에서 수행됩니다.

현재 데이터가 ALERT 상태에 대응하기 때문에 모니터가 알림을 보는 경우, resolve는 모니터가 상태를 ALERT -> OK -> ALERT로 전환하도록 합니다. 그러므로 resolve을(를) 사용하면 알림을 확인하거나 Datadog가 알림을 무시하도록 하기에 적합하지 않습니다.

모니터를 직접 확인하는 것은 데이터가 간헐적으로 보고되는 경우에 적합합니다. 예를 들어, 알림을 트리거한 이후, 모니터가 추가로 데이터를 수집하지 않으므로 더 이상 알림 조건을 평가하거나 OK 상태로 되돌릴 수 없습니다. 해당 경우 resolve 기능 또는 Automatically resolve monitor after X hours는 모니터를 OK 상태로 다시 변경합니다.

일반적인 사용 사례: 오류가 없는 경우, 오류 메트릭 기반 모니터가 생성되지 않습니다. 코드의 aws.elb.httpcode_elb_5xx 또는 DogStatsD 카운터는 오류가 있는 경우에만 오류를 보고합니다.

인시던트 생성

인시던트 신고를 선택하여 모니터에서 인시던트를 생성합니다. 인시던트 신고 팝업 모달과 함께 심각도, 알림 및 추가 참고 사항을 설정합니다. 자세한 정보는 인시던트 관리 설명서를 참조하세요.

설정

설정 톱니바퀴를 클릭해 사용 가능한 옵션을 표시합니다.

옵션설명
편집현재 모니터를 편집합니다. 모니터 설정 섹션의 상세 정보를 확인합니다.
복제현재 모니터의 사본을 만듭니다.
내보내기현재 모니터를 위해 JSON 설정을 내보냅니다. 이 옵션은 모니터 생성 시에도 사용할 수 있습니다. 프로그래밍 방식으로 모니터를 관리하는 경우 UI에서 모니터를 정의하고 JSON으로 내보냅니다.
삭제현재 모니터를 삭제합니다. 삭제 확인 메시지가 나타납니다.

속성

모니터 개요의 속성 섹션:

속성설명
상태알림, 경고, 데이터 없음 또는 확인
유형모니터 유형에 대해 자세히 알아보세요.
ID모니터 API에 사용됩니다.
생성된 날짜모니터가 생성된 날짜입니다.
작성자모니터를 생성한 사람입니다.
태그모니터 수준에서 첨부된 태그입니다. 연필 아이콘을 클릭해 태그를 편집하세요.
쿼리[쿼리하는 방법]에 대해 자세히 알아보세요6.
메시지모니터의 알림 섹션에 지정된 메시지입니다.

상태 및 기록

상태 및 기록 섹션은 쿼리와 함께 시간에 따른 모니터 상태 변경 사항을 표시합니다. 정보를 필터링하려면 섹션 윗 부분에 있는 검색 상자, 상태 및 시간 선택기를 사용합니다.

상태

상태 그래프는 시간에 따른 모니터의 상태를 그룹별로 상세히 보여줍니다. 참고: None 또는 no groups found이 표시되면 다음 상황 중 하나가 적용될 수 있습니다.

  • 모니터가 새로 생성되어 아직 평가되지 않았습니다.
  • 모니터 쿼리가 최근 변경되었습니다.
  • 종종 데이터를 제공하는 메트릭에 대한 모니터 타임프레임이 너무 짧습니다.
  • 이 모니터는 데이터가 자주 발생하지 않는 메트릭에 대해 전체 데이터 기간을 요구하도록 설정되어 있습니다. 고급 알림 조건을 참조하세요.
  • 쿼리에 이전에 포함된 호스트 이름이 변경되었습니다. 호스트 이름 변경이 2시간 내 UI에서 종료됩니다.
  • 필터링 중인 쿼리가 예상대로 작동하지 않습니다.

상태 그래프는 모니터 쿼리의 차원이 아니라 알림에 설정된 차원을 보여줍니다. 예를 들어, 모니터 쿼리는 servicehost로 그룹화되지만 service의 알림만 수신하길 원할 수 있습니다. 상태 그래프는 service별로 그룹화된 모니터 상태를 표시합니다. View all를 클릭하여 host 하위 그룹을 볼 수 있습니다. View all을 클릭하면 각 하위 그룹의 상태 그래프가 표시된 패널이 열립니다. 알림 그룹화에 관한 자세한 정보는 모니터 설정을 참조하세요.

서비스별로 그룹화된 모니터 상태, 하위 그룹 보기를 위한 강조 표시 옵션

그룹 또는 이벤트별로 모니터 상태 필터링

Status & History 뷰의 범위를 특정 그룹으로 좁히려면, 필터 필드를 사용하여 필터링하려는 속성을 입력합니다. 그룹 필터 구문은 모니터 검색 쿼리와 동일한 원칙을 따릅니다. 다음은 따라야 할 몇 가지 모범 사례입니다.

  • 필터는 대소문자를 구분하며, env:prodenv:Prod는 동일한 모니터 그룹을 반환하지 않습니다. Datadog은 태그의 일관성을 유지할 것을 권장합니다. 자세한 내용은 태그 시작하기를 참조하세요.

  • 쿼리에 와일드카드가 자동 추가됩니다. 특정 필터를 적용하려면 쿼리를 큰따옴표(")로 묶습니다. 큰따옴표를 사용하지 않는 다음 쿼리를 예로 들어 보겠습니다.

    availability-zone:us-central1-a,instance-type:*,name:gke-demo-1
    

    모니터는 쿼리가 특정 그룹 하나를 표시할 것으로 예상되더라도 팔로우 그룹을 반환합니다.

    availability-zone:us-central1-a,instance-type:*,name:gke-demo-10
    availability-zone:us-central1-a,instance-type:*,name:gke-demo-12
    

    쿼리를 큰따옴표로 묶으면 예상 그룹을 반환합니다. "availability-zone:us-central1-a,instance-type:*,name:gke-demo-1"

노트북에서 모니터 조사

메트릭 평가를 더 자세히 살펴보려면 상태 그래프에서 노트북에서 열기를 클릭합니다. 그러면 모니터 쿼리에 대한 형식화된 그래프와 함께 조사 노트북이 생성됩니다.

노트북에서 열기 버튼

노트북은 모니터 평가 기간 범위와 일치해야 하며 해당 경우 관련 로그를 포함합니다.

모니터 그룹 보존 기간 추적

Datadog은 쿼리가 변경되지 않는 한, UI에서 모니터 그룹을 24시간 동안 사용할 수 있도록 유지합니다. 누락된 데이터에 관해 알리도록 구성된 호스트 모니터 및 서비스 검사는 48시간 동안 사용할 수 있습니다. 모니터 그래프가 점선으로 나타나고 non-reporting으로 표시되는 경우 다음과 같은 이유가 있을 수 있습니다.

  • 새 그룹은 모니터가 생성된 후 일정 시간이 지나야 평가됩니다. 평가 그래프는 기간 시작 시점부터 그룹이 처음 평가되는 시점까지를 점선으로 표시합니다.
  • 그룹이 보고를 중단하고 평가를 중지했다가 다시 보고를 시작합니다. 그룹이 평가를 중지한 시점부터 다시 평가를 시작한 시점까지 점선으로 표시됩니다.
그룹 보존 기간 추적

참고: Non-reporting은 데이터가 없는 것과는 다릅니다. Non-reporting 상태는 그룹에 따라 다릅니다.

기록

기록 그래프는 수집한 데이터를 상태 그래프에 맞춰 표시합니다. 모니터에서 메트릭 쿼리에 제출된 원시 데이터 포인트를 표시합니다. 모니터 상태 페이지는 노트북과 대시보드에서 사용되는 동일한 시계열 그래프 위젯을 사용합니다.

평가 그래프

평가 그래프는 모니터별로 다릅니다. 기록 그래프와 동일한 쿼리 논리를 사용하지만 기록 그래프의 타임프레임 대괄호 범위로 설정되어 있습니다. 모니터에 대응하는 확대, 고정된 창인 평가 창을 통해 표시된 포인트가 올바르게 집계되었는지 확인할 수 있습니다. 예를 들어 모니터가 지난 15분 간의 쿼리 평균을 평가하도록 구성된 경우 평가 그래프의 각 데이터 포인트는 지난 15분 평가 창에 대한 메트릭 집계 값을 보여줍니다.

이 그래프는 모니터에서 설정한 평가 조건 대비 적용된 메트릭의 원시 데이터 포인트 결과를 표시합니다. 이 시각화 자료는 기록 그래프와는 다릅니다. 이 그래프는 모니터 쿼리를 통과한 후 데이터의 값을 표시하기 때문입니다.

이벤트

모니터에서 생성된 이벤트(알림, 경고, 복구 등)가 상태 및 기록 섹션 위에 있는 시간 선택기에 따라 이 섹션에 표시됩니다. 이벤트는 또한 이벤트 탐색기에도 표시됩니다.

감사 추적

Audit Trail은 모든 모니터 유형에 대한 모니터 변경 사항을 자동 캡처하고 이벤트를 생성합니다. 이 이벤트는 모니터 변경 사항을 문서화합니다.

예를 들어, 모니터를 수정한 경우 Audit Trail 이벤트는 다음을 표시합니다.

  • 이전 모니터 구성
  • 현재 모니터 구성
  • 변경한 사용자

자세한 내용은 Audit Trail 문서를 참조하고, Audit Trail 모범 사례 블로그를 읽어보세요.

Datadog는 또한 생성한 모니터를 변경할 때 알림을 수신할 수 있는 옵션을 제공합니다. 모니터 편집기 하단의 권한 정의 및 감사 알림 아래에서 *모니터가 수정된 경우 모니터 생성자 및 알림 수신자에게 알리기 옆에 있는 드롭다운의 알리기를 선택하세요.

알리기 설정은 특정 모니터 알림을 수신하기로 한 모든 사람들과 모니터 생성자에게 모니터 감사 이벤트가 포함된 이메일을 전송합니다. 모니터 감사 이벤트는 또한 이벤트 탐색기에도 나타납니다.

내보내기 및 가져오기

모니터 상태 페이지에서 모든 모니터의 JSON 내보내기 파일을 확보할 수 있습니다. 설정 톱니바퀴(오른쪽 상단)를 클릭한 다음 메뉴에서 내보내기를 고릅니다.

JSON을 통해 Datadog으로 모니터를 불러오기 하려면, 메인 내비게이션에서 Monitors –> New Monitor –> Import로 이동합니다.

참고 자료