HBase RegionServer

Supported OS Linux Windows Mac OS

Versión de la integración1.0.0

Información general

Obtén métricas del servicio HBase RegionServer en tiempo real para:

  • Visualizar y monitorizar estados HBase RegionServer.
  • Reciba notificaciones sobre fallos y eventos de HBase RegionServer.

Configuración

El check de HBase RegionServer no está incluido en el paquete del Datadog Agent, por lo que es necesario instalarlo.

Instalación

Para el Agent v7.21/v6.21 o posteriores, sigue las instrucciones a continuación para instalar el check de HBase RegionServer en tu host. Consulta Uso de integraciones comunitarias para instalar con el Docker Agent o versiones anteriores del Agent.

  1. Ejecuta el siguiente comando para instalar la integración del Agent:

    datadog-agent integration install -t datadog-hbase_regionserver==<INTEGRATION_VERSION>
    
  2. Configura tu integración de forma similar a las integraciones centrales.

Configuración

  1. Edita el archivo hbase_regionserver.d/conf.yaml, en la carpeta conf.d/ en la raíz de tu directorio de configuración del Agent para comenzar a recopilar tus métricas de HBase RegionServer. Consulta el ejemplo hbase_regionserver.d/conf.yaml para conocer todas las opciones de configuración disponibles.

  2. Reinicia el Agent

Recopilación de logs

  1. La recopilación de logs se encuentra deshabilitada de manera predeterminada en el Datadog Agent; debes habilitarla en el archivo datadog.yaml:

    logs_enabled: true
    
  2. Añade este bloque de configuración a tu archivo hbase_regionserver.d/conf.yaml para empezar a recopilar tus logs de Hbase_regionserver:

    logs:
      - type: file
        path: /path/to/my/directory/file.log
        source: hbase
    

    Cambia el valor del parámetro path y configúralo para tu entorno. Consulta el ejemplo hbase_regionserver.d/conf.yaml para conocer todas las opciones de configuración disponibles.

  3. Reinicia el Agent.

Validación

Ejecuta el subcomando de estado del Agent y busca hbase_regionserver en la sección Checks.

Datos recopilados

Métricas

hbase.regionserver.ipc.queue_size
(gauge)
Número de bytes en las colas de llamadas.
Se muestra en bytes
hbase.regionserver.ipc.num_open_connections
(gauge)
Número de conexiones abiertas.
hbase.regionserver.ipc.num_active_handler
(gauge)
Número de identificadores RPC activos.
hbase.regionserver.ipc.total_call_time.max
(gauge)
Tiempo total de la llamada, incluido el tiempo en cola y el tiempo de procesamiento.
Se muestra en milisegundos
hbase.regionserver.ipc.total_call_time.mean
(gauge)
Tiempo total de la llamada, incluido el tiempo en cola y el tiempo de procesamiento.
Se muestra en milisegundos
hbase.regionserver.ipc.total_call_time.median
(gauge)
Tiempo total de la llamada, incluido el tiempo en cola y el tiempo de procesamiento.
Se muestra en milisegundos
hbase.regionserver.ipc.total_call_time.percentile.99
(gauge)
Tiempo total de la llamada, incluido el tiempo en cola y el tiempo de procesamiento.
Se muestra en milisegundos
hbase.regionserver.regions.num_regions
(gauge)
Número de regiones en el sistema métrico.
hbase.regionserver.replication.sink.applied_ops
(gauge)
Número de entradas de WAL aplicadas en el sumidero de replicación.
hbase.regionserver.replication.sink.age_of_last_applied_op
(gauge)
Demora de replicación de la última entrada de WAL aplicada entre la fuente y el sumidero.
Se muestra en milisegundos
hbase.regionserver.replication.sink.applied_batches
(gauge)
Número de operaciones de aplicación de WAL procesadas en el sumidero de replicación.
hbase.regionserver.server.region_count
(gauge)
Número de regiones
hbase.regionserver.server.store_count
(gauge)
Número de tiendas
hbase.regionserver.server.hlog_file_count
(gauge)
Número de archivos WAL
hbase.regionserver.server.hlog_file_size
(gauge)
Tamaño de todos los archivos WAL
Se muestra en bytes
hbase.regionserver.server.store_file_count
(gauge)
Número de archivos de la tienda
hbase.regionserver.server.mem_store_size
(gauge)
Tamaño del memstore
Se muestra en bytes
hbase.regionserver.server.store_file_size
(gauge)
Tamaño de los archivos de almacenamiento que se están proporcionando.
Se muestra en bytes
hbase.regionserver.server.total_request_count
(gauge)
Número total de solicitudes que ha respondido este RegionServer.
hbase.regionserver.server.read_request_count
(gauge)
Número de solicitudes de lectura que ha respondido este servidor regional.
hbase.regionserver.server.write_request_count
(gauge)
Número de solicitudes de mutación que ha respondido este servidor regional.
hbase.regionserver.server.check_mutate_failed_count
(gauge)
Número de llamadas de comprobación y mutación que no han pasado los checks.
hbase.regionserver.server.check_mutate_passed_count
(gauge)
Número de llamadas de comprobación y mutación que han pasado los checks.
hbase.regionserver.server.store_file_index_size
(gauge)
Tamaño de los índices en archivos de almacenamiento en disco.
Se muestra en bytes
hbase.regionserver.server.static_index_size
(gauge)
Tamaño sin comprimir de los índices estáticos.
Se muestra en bytes
hbase.regionserver.server.static_bloom_size
(gauge)
Tamaño sin comprimir de los filtros Bloom estáticos.
Se muestra en bytes
hbase.regionserver.server.mutations_without_wal_count
(count)
Número de mutaciones que han enviado los clientes con el registro de escritura anticipada desactivado.
hbase.regionserver.server.mutations_without_wal_size
(gauge)
Tamaño de los datos que han enviado los clientes con el registro de escritura anticipada desactivado.
Se muestra en bytes
hbase.regionserver.server.percent_files_local
(gauge)
Porcentaje de HFiles que se almacenan en el nodo de datos hdfs local.
Se muestra como porcentaje
hbase.regionserver.server.percent_files_local_secondary_regions
(gauge)
Porcentaje de HFiles utilizados por las regiones secundarias que se almacenan en el nodo de datos hdfs local.
Se muestra como porcentaje
hbase.regionserver.server.split_queue_length
(gauge)
Longitud de la cola para divisiones.
hbase.regionserver.server.compaction_queue_length
(gauge)
Longitud de la cola para compactaciones.
hbase.regionserver.server.flush_queue_length
(gauge)
Longitud de la cola para descargas de regiones.
hbase.regionserver.server.block_cache_free_size
(gauge)
Tamaño de la caché de bloques que no está ocupada.
Se muestra en bytes
hbase.regionserver.server.block_cache_count
(gauge)
Número de bloque en la caché de bloques.
hbase.regionserver.server.block_cache_size
(gauge)
Tamaño de la caché de bloques.
Se muestra en bytes
hbase.regionserver.server.block_cache_hit_count
(gauge)
Recuento de aciertos en la caché de bloques.
hbase.regionserver.server.block_cache_hit_count_primary
(gauge)
Recuento de aciertos en la réplica primaria en la caché de bloques.
hbase.regionserver.server.block_cache_miss_count
(gauge)
Número de solicitudes de un bloque que no ha acertado la caché de bloques.
hbase.regionserver.server.block_cache_miss_count_primary
(gauge)
Número de solicitudes de un bloque de la réplica primaria que no ha acertado la caché de bloques.
hbase.regionserver.server.block_cache_eviction_count
(gauge)
Recuento del número de bloques desalojados de la caché de bloques.
hbase.regionserver.server.block_cache_eviction_count_primary
(gauge)
Recuento del número de bloques desalojados de la réplica primaria en la caché de bloques.
hbase.regionserver.server.block_cache_hit_percent
(gauge)
Porcentaje de solicitudes de caché de bloques que son aciertos
Se muestra como porcentaje
hbase.regionserver.server.block_cache_express_hit_percent
(gauge)
Porcentaje de veces que las solicitudes con la caché activada aciertan la caché.
Se muestra como porcentaje
hbase.regionserver.server.block_cache_failed_insertion_count
(gauge)
Número de veces que ha fallado la inserción de una caché de bloques. Suele deberse a restricciones de tamaño.
Se muestra en milisegundos
hbase.regionserver.server.updates_blocked_time
(gauge)
Número de actualizaciones de MS que se han bloqueado para que se pueda vaciar el memstore.
Se muestra en milisegundos
hbase.regionserver.server.flushed_cells_count
(gauge)
Número de celdas vaciadas en disco.
hbase.regionserver.server.compacted_cells_count
(gauge)
Número de celdas procesadas durante las compactaciones menores.
hbase.regionserver.server.major_compacted_cells_count
(gauge)
Número de celdas procesadas durante las compactaciones mayores.
hbase.regionserver.server.flushed_cells_size
(gauge)
Cantidad total de datos vaciados al disco, en bytes
Se muestra en bytes
hbase.regionserver.server.compacted_cells_size
(gauge)
Cantidad total de datos procesados durante las compactaciones menores, en bytes
Se muestra en bytes
hbase.regionserver.server.major_compacted_cells_size
(gauge)
Cantidad total de datos procesados durante las compactaciones mayores, en bytes
Se muestra en bytes
hbase.regionserver.server.blocked_request_count
(gauge)
Número de solicitudes bloqueadas debido a que el tamaño del memstore es mayor que blockingMemStoreSize
hbase.regionserver.server.hedged_read
(gauge)
hbase.regionserver.server.hedged_read_wins
(gauge)
hbase.regionserver.server.pause_time_with_gc_num_ops
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_with_gc.min
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_with_gc.max
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_with_gc.mean
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_with_gc.median
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_with_gc.percentile.99
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.mutate.num_ops
(gauge)
hbase.regionserver.server.mutate.min
(gauge)
hbase.regionserver.server.mutate.max
(gauge)
hbase.regionserver.server.mutate.mean
(gauge)
hbase.regionserver.server.mutate.median
(gauge)
hbase.regionserver.server.mutate.percentile.99
(gauge)
hbase.regionserver.server.slow_append_count
(gauge)
Número de Anexos que han tardado más de 1000ms en completarse.
hbase.regionserver.server.pause_warn_threshold_exceeded
(gauge)
hbase.regionserver.server.slow_delete_count
(gauge)
Número de Eliminaciones que han tardado más de 1000ms en completarse.
hbase.regionserver.server.increment.num_ops
(gauge)
hbase.regionserver.server.increment.min
(gauge)
hbase.regionserver.server.increment.max
(gauge)
hbase.regionserver.server.increment.mean
(gauge)
hbase.regionserver.server.increment.median
(gauge)
hbase.regionserver.server.increment.percentile.99
(gauge)
hbase.regionserver.server.replay.num_ops
(gauge)
hbase.regionserver.server.replay.min
(gauge)
hbase.regionserver.server.replay.max
(gauge)
hbase.regionserver.server.replay.mean
(gauge)
hbase.regionserver.server.replay.median
(gauge)
hbase.regionserver.server.replay.percentile.99
(gauge)
hbase.regionserver.server.flush_time.num_ops
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.flush_time.min
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.flush_time.max
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.flush_time.mean
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.flush_time.median
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.flush_time.percentile.99
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_info_threshold_exceeded
(gauge)
hbase.regionserver.server.delete.num_ops
(gauge)
hbase.regionserver.server.delete.min
(gauge)
hbase.regionserver.server.delete.max
(gauge)
hbase.regionserver.server.delete.mean
(gauge)
hbase.regionserver.server.delete.median
(gauge)
hbase.regionserver.server.delete.percentile.99
(gauge)
hbase.regionserver.server.split_request_count
(gauge)
Número de divisiones solicitadas.
hbase.regionserver.server.split_success_count
(gauge)
Número de divisiones ejecutadas con éxito.
hbase.regionserver.server.slow_get_count
(gauge)
Número de Gets que han tardado más de 1000ms en completarse.
hbase.regionserver.server.get.num_ops
(gauge)
hbase.regionserver.server.get.min
(gauge)
hbase.regionserver.server.get.max
(gauge)
hbase.regionserver.server.get.mean
(gauge)
hbase.regionserver.server.get.median
(gauge)
hbase.regionserver.server.get.percentile.99
(gauge)
hbase.regionserver.server.scan_next.num_ops
(gauge)
hbase.regionserver.server.scan_next.min
(gauge)
hbase.regionserver.server.scan_next.max
(gauge)
hbase.regionserver.server.scan_next.mean
(gauge)
hbase.regionserver.server.scan_next.median
(gauge)
hbase.regionserver.server.scan_next.percentile.99
(gauge)
hbase.regionserver.server.pause_time_without_gc.num_ops
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_without_gc.min
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_without_gc.max
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_without_gc.mean
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_without_gc.median
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.pause_time_without_gc.percentile.99
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.slow_put_count
(gauge)
Número de Multis que han tardado más de 1000ms en completarse.
hbase.regionserver.server.slow_increment_count
(gauge)
Número de Incrementos que han tardado más de 1000 ms en completarse.
hbase.regionserver.server.split_time.num_ops
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.split_time.min
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.split_time.max
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.split_time.mean
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.split_time.median
(gauge)

Se muestra en milisegundos
hbase.regionserver.server.split_time.percentile.99
(gauge)

Se muestra en milisegundos
hbase.regionserver.wal.append_size.num_ops
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.append_size.min
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.append_size.max
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.append_size.mean
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.append_size.median
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.append_size.percentile.99
(gauge)
Tamaño (en bytes) de los datos añadidos a WAL.
Se muestra en bytes
hbase.regionserver.wal.sync_time.num_ops
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.sync_time.min
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.sync_time.max
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.sync_time.mean
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.sync_time.median
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.sync_time.percentile.99
(gauge)
Tiempo que ha tardado sincronizar WAL con HDFS.
Se muestra en milisegundos
hbase.regionserver.wal.slow_append_count
(gauge)
Número de anexos lentos.
hbase.regionserver.wal.roll_request
(gauge)
Cantidad de veces que se ha solicitado un log roll en total
Se muestra en milisegundos
hbase.regionserver.wal.append_count
(gauge)
Número de anexos al registro de escritura anticipada.
hbase.regionserver.wal.low_replica_roll_request
(gauge)
Cantidad de veces se ha solicitado un log roll debido a que había muy pocos DN en el pipeline de escritura.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.num_ops
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.min
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.max
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.mean
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.median
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.regionserver.wal.append_time.percentile.99
(gauge)
Tiempo que ha tardado un anexo al log.
Se muestra en milisegundos
hbase.jvm_metrics.mem_non_heap_used_in_mb
(gauge)
Memoria no-heap utilizada en MB.
hbase.jvm_metrics.mem_non_heap_committed_in_mb
(gauge)
Memoria no-heap comprometida en MB.
hbase.jvm_metrics.mem_non_heap_max_in_mb
(gauge)
Máximo de memoria no-heap en MB.
hbase.jvm_metrics.mem_heap_used_in_mb
(gauge)
Memoria heap utilizada en MB.
hbase.jvm_metrics.mem_heap_committed_in_mb
(gauge)
Memoria heap comprometida en MB.
hbase.jvm_metrics.mem_heap_max_in_mb
(gauge)
Máximo de memoria heap en MB.
hbase.jvm_metrics.mem_max_in_mb
(gauge)
Tamaño máximo de memoria en MB.
hbase.jvm_metrics.gc_count_par_new
(gauge)
Recuento de recolección de basura para ParNew.
hbase.jvm_metrics.gc_time_millis_par_new
(gauge)
Tiempo de recolección de basura para ParNew
Se muestra en milisegundos
hbase.jvm_metrics.gc_count_concurrent_mark_sweep
(gauge)
Recuento de recolección de basura para ConcurrentMarkSweep.
hbase.jvm_metrics.gc_time_millis_concurrent_mark_sweep
(gauge)
Tiempo de recolección de basura para ConcurrentMarkSweep
Se muestra en milisegundos
hbase.jvm_metrics.gc_count
(gauge)
Recuento total de recolecciones de basura.
hbase.jvm_metrics.gc_time_millis
(gauge)
Tiempo total de recolección de basura en milisegundos
Se muestra en milisegundos

Eventos

El check de HBase RegionServer check no incluye eventos.

Checks de servicio

El check de HBase RegionServer check no incluye checks de servicio.

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog