Supported OS Linux Windows Mac OS

Versión de la integración3.0.0

Dashboard predeterminado de Cassandra

Información general

Obtén métricas de Cassandra en tiempo real para:

  • Visualizar y monitorizar estados de Cassandra.
  • Recibir notificaciones sobre conmutaciones por error y eventos de Cassandra.

Configuración

Instalación

El check de Cassandra está incluido en el paquete del Datadog Agent, por lo que no necesitas instalar nada más en tus nodos Cassandra. Se recomienda utilizar el JDK de Oracle para esta integración.

Nota: Este check tiene un límite de 350 métricas por instancia. El número de métricas devueltas se indica en la página de estado. Puedes especificar las métricas que te interesen editando la siguiente configuración. Para saber cómo personalizar las métricas que debes recopilar, consulta la documentación de JMX para obtener instrucciones detalladas. Si necesitas monitorizar más métricas, ponte en contacto con el servicio de asistencia de Datadog.

Configuración

Recopilación de métricas
  1. La configuración predeterminada de tu archivo cassandra.d/conf.yaml activa la recopilación de tus métricas de Cassandra. Para conocer todas las opciones de configuración disponibles, consulta el ejemplo de cassandra.d/conf.yaml

  2. Reinicia el Agent.

Recopilación de logs

Disponible para las versiones 6.0 o posteriores del Agent

Para los entornos de contenedores, sigue las instrucciones de las páginas Recopilación de logs de Kubernetes o Recopilación de logs de Docker.

  1. La recopilación de logs está desactivada en forma predeterminada en el Datadog Agent, actívala en tu archivo datadog.yaml:

    logs_enabled: true
    
  2. Añade este bloque de configuración a tu archivo cassandra.d/conf.yaml para empezar a recopilar tus logs de Cassandra:

      logs:
        - type: file
          path: /var/log/cassandra/*.log
          source: cassandra
          service: myapplication
          log_processing_rules:
             - type: multi_line
               name: log_start_with_date
               # pattern to match: DEBUG [ScheduledTasks:1] 2019-12-30
               pattern: '[A-Z]+ +\[[^\]]+\] +\d{4}-\d{2}-\d{2}'
    

    Cambia los valores de los parámetros path y service y configúralos para tu entorno. Consulta el ejemplo de cassandra.d/conf.yaml para conocer todas las opciones de configuración disponibles.

    Para asegurarte de que los stacktraces se agregan correctamente como un único log, se puede añadir una regla de procesamiento multilínea.

  3. Reinicia el Agent.

Validación

Ejecuta el subcomando de estado del Agent y busca cassandra en la sección Checks.

Datos recopilados

Métricas

cassandra.active_tasks
(gauge)
Número de tareas que el grupo de subprocesos está ejecutando activamente.
Se muestra como tarea
cassandra.bloom_filter_false_ratio
(gauge)
Proporción de falsos positivos del filtro Bloom respecto del total de checks.
Se muestra como fracción
cassandra.bytes_flushed.count
(gauge)
Cantidad de datos descargados desde el (re)inicio.
Se muestra como byte
cassandra.cas_commit_latency.75th_percentile
(gauge)
Latencia de la ronda de commits de Paxos - p75.
Se muestra como microsegundo
cassandra.cas_commit_latency.95th_percentile
(gauge)
Latencia de la ronda de commits de Paxos - p95.
Se muestra como microsegundo
cassandra.cas_commit_latency.one_minute_rate
(gauge)
Número de rondas de commits de Paxos por segundo.
Se muestra como operación
cassandra.cas_prepare_latency.75th_percentile
(gauge)
Latencia de la ronda de preparación de Paxos- p75.
Se muestra como microsegundo
cassandra.cas_prepare_latency.95th_percentile
(gauge)
Latencia de la ronda de preparación de Paxos- p95.
Se muestra como microsegundo
cassandra.cas_prepare_latency.one_minute_rate
(gauge)
Número de rondas de preparación de Paxos por segundo.
Se muestra como operación
cassandra.cas_propose_latency.75th_percentile
(gauge)
Latencia de la ronda de proposición de Paxos- p75.
Se muestra como microsegundo
cassandra.cas_propose_latency.95th_percentile
(gauge)
Latencia de la ronda de proposición de Paxos- p95.
Se muestra como microsegundo
cassandra.cas_propose_latency.one_minute_rate
(gauge)
Número de rondas de proposición de Paxos por segundo.
Se muestra como operación
cassandra.col_update_time_delta_histogram.75th_percentile
(gauge)
Tiempo de actualización de la columna delta - p75.
Se muestra como microsegundo
cassandra.col_update_time_delta_histogram.95th_percentile
(gauge)
Tiempo de actualización de la columna delta - p95.
Se muestra como microsegundo
cassandra.col_update_time_delta_histogram.min
(gauge)
Tiempo de actualización de la columna delta - min.
Se muestra como microsegundo
cassandra.compaction_bytes_written.count
(gauge)
Cantidad de datos compactados desde el (re)inicio.
Se muestra como byte
cassandra.compression_ratio
(gauge)
Relación de compresión para todas las SSTables. /!\ Un valor bajo significa una compresión elevada, al contrario de lo que sugiere su nombre. La fórmula utilizada es: ’tamaño de la SSTable comprimida / tamaño de la original’
Se muestra como fracción
cassandra.currently_blocked_tasks
(gauge)
Número de tareas bloqueadas actualmente para el grupo de subprocesos.
Se muestra como tarea
cassandra.currently_blocked_tasks.count
(gauge)
Número de tareas bloqueadas actualmente para el grupo de subprocesos.
Se muestra como tarea
cassandra.db.droppable_tombstone_ratio
(gauge)
Estimación de la proporción de lápidas descartables.
Se muestra como fracción
cassandra.dropped.one_minute_rate
(gauge)
Tareas descartadas durante la ejecución del grupo de subprocesos.
Se muestra como subproceso
cassandra.exceptions.count
(gauge)
Número de excepciones lanzadas desde las métricas de ‘Almacenamiento’.
Se muestra como error
cassandra.key_cache_hit_rate
(gauge)
Porcentaje de aciertos en la caché de claves.
Se muestra como fracción
cassandra.latency.75th_percentile
(gauge)
Latencia de la solicitud del cliente - p75.
Se muestra como microsegundo
cassandra.latency.95th_percentile
(gauge)
Latencia de la solicitud del cliente - p95.
Se muestra como microsegundo
cassandra.latency.one_minute_rate
(gauge)
Número de solicitudes de clientes.
Se muestra como solicitud
cassandra.live_disk_space_used.count
(gauge)
Espacio en disco utilizado por SSTables “activas” (sólo cuenta en archivos en uso).
Se muestra como byte
cassandra.live_ss_table_count
(gauge)
Número de SSTables “activas” (en uso).
Se muestra como archivo
cassandra.load.count
(gauge)
Espacio en disco utilizado por los datos activos en un nodo.
Se muestra como byte
cassandra.max_partition_size
(gauge)
Tamaño de la mayor partición compactada.
Se muestra como byte
cassandra.max_row_size
(gauge)
Tamaño de la mayor fila compactada.
Se muestra como byte
cassandra.mean_partition_size
(gauge)
Tamaño medio de la partición compactada.
Se muestra como byte
cassandra.mean_row_size
(gauge)
Tamaño medio de las filas compactadas.
Se muestra como byte
cassandra.net.down_endpoint_count
(gauge)
Número de nodos no saludables en el clúster. Representan la vista de cada nodo individual del clúster y, por lo tanto, no deben sumarse entre los nodos informantes.
Se muestra como nodo.
cassandra.net.up_endpoint_count
(gauge)
Número de nodos saludables en el clúster. Representan la vista de cada nodo individual del clúster y, por lo tanto, no deben sumarse entre los nodos informantes.
Se muestra como nodo.
cassandra.pending_compactions
(gauge)
Número de compactaciones pendientes.
Se muestra como tarea
cassandra.pending_flushes.count
(gauge)
Número de descargas pendientes.
Se muestra como descarga
cassandra.pending_tasks
(gauge)
Número de tareas pendientes para el grupo de subprocesos.
Se muestra como tarea
cassandra.range_latency.75th_percentile
(gauge)
Latencia de solicitud de alcance local - p75.
Se muestra como microsegundo
cassandra.range_latency.95th_percentile
(gauge)
Latencia de solicitud de alcance local - p95.
Se muestra como microsegundo
cassandra.range_latency.one_minute_rate
(gauge)
Número de solicitudes de alcance local.
Se muestra como solicitud
cassandra.read_latency.75th_percentile
(gauge)
Latencia de lectura local - p75.
Se muestra como microsegundo
cassandra.read_latency.95th_percentile
(gauge)
Latencia de lectura local - p95.
Se muestra como microsegundo
cassandra.read_latency.99th_percentile
(gauge)
Latencia de lectura local - p99.
Se muestra como microsegundo
cassandra.read_latency.one_minute_rate
(gauge)
Número de solicitudes locales de lectura.
Se muestra como lectura
cassandra.row_cache_hit.count
(gauge)
Número de aciertos en la caché de filas.
Se muestra como acierto
cassandra.row_cache_hit_out_of_range.count
(gauge)
Número de aciertos en la caché de filas que no satisfacen el filtro de consulta y han ido al disco.
Se muestra como acierto
cassandra.row_cache_miss.count
(gauge)
Número de fallos en la caché de filas de la tabla.
Se muestra como fallo
cassandra.snapshots_size
(gauge)
Espacio en disco realmente utilizado por los snapshots.
Se muestra como byte
cassandra.ss_tables_per_read_histogram.75th_percentile
(gauge)
Número de archivos de datos SSTable a los que se accede por lectura - p75.
Se muestra como archivo
cassandra.ss_tables_per_read_histogram.95th_percentile
(gauge)
Número de archivos de datos SSTable a los que se accede por lectura - p95.
Se muestra como archivo
cassandra.timeouts.count
(gauge)
Recuento de solicitudes no confirmadas dentro del tiempo de espera configurable.
Se muestra como tiempo de espera
cassandra.timeouts.one_minute_rate
(gauge)
Tasa de tiempo de espera reciente, como media móvil ponderada exponencialmente en un intervalo de un minuto.
Se muestra como tiempo de espera
cassandra.tombstone_scanned_histogram.75th_percentile
(gauge)
Número de lápidas analizadas por lectura - p75.
Se muestra como registro
cassandra.tombstone_scanned_histogram.95th_percentile
(gauge)
Número de lápidas analizadas por lectura - p95.
Se muestra como registro
cassandra.total_blocked_tasks
(gauge)
Total de tareas bloqueadas
Se muestra como tarea
cassandra.total_blocked_tasks.count
(count)
Recuento total de tareas bloqueadas
Se muestra como tarea
cassandra.total_commit_log_size
(gauge)
Tamaño en el disco utilizado por logs de commits.
Se muestra como byte
cassandra.total_disk_space_used.count
(gauge)
Espacio total utilizado en el disco por SSTables, incluidas las obsoletas a la espera de ser recolectadas como basura.
Se muestra como byte
cassandra.view_lock_acquire_time.75th_percentile
(gauge)
Tiempo que se tarda en adquirir un bloqueo de partición para actualizaciones de vistas materializadas - p75.
Se muestra como microsegundo
cassandra.view_lock_acquire_time.95th_percentile
(gauge)
Tiempo que se tarda en adquirir un bloqueo de partición para actualizaciones de vistas materializadas - p95.
Se muestra como microsegundo
cassandra.view_lock_acquire_time.one_minute_rate
(gauge)
Número de solicitudes para adquirir un bloqueo de partición para actualizaciones de vistas materializadas.
Se muestra como solicitud
cassandra.view_read_time.75th_percentile
(gauge)
Tiempo empleado durante la lectura local de una actualización de vista materializada - p75.
Se muestra como microsegundo.
cassandra.view_read_time.95th_percentile
(gauge)
Tiempo empleado durante la lectura local de una actualización de vista materializada - p95.
Se muestra como microsegundo.
cassandra.view_read_time.one_minute_rate
(gauge)
Número de lecturas locales de actualizaciones de vistas materializadas.
Se muestra como solicitud
cassandra.waiting_on_free_memtable_space.75th_percentile
(gauge)
Tiempo transcurrido a la espera de espacio memtable libre dentro o fuera del montón - p75.
Se muestra como microsegundo
cassandra.waiting_on_free_memtable_space.95th_percentile
(gauge)
Tiempo transcurrido a la espera de espacio memtable libre dentro o fuera del montón - p95.
Se muestra como microsegundo
cassandra.write_latency.75th_percentile
(gauge)
Latencia de escritura local - p75.
Se muestra como microsegundo
cassandra.write_latency.95th_percentile
(gauge)
Latencia de escritura local - p95.
Se muestra como microsegundo
cassandra.write_latency.99th_percentile
(gauge)
Latencia de escritura local - p99.
Mostrado como microsegundo
cassandra.write_latency.one_minute_rate
(gauge)
Número de solicitudes locales de escritura.
Se muestra como escritura

Eventos

El check de Cassandra no incluye ningún evento.

Checks de servicio

cassandra.can_connect

Devuelve CRITICAL si el Agent no puede conectarse y recopilar métricas de la instancia de Cassandra monitorizada, WARNING si no se recopilan métricas y OK en caso contrario.

Estados: ok, crítico, advertencia

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog.

Referencias adicionales