Dimensionamiento de clústeres

Este producto no es compatible con el sitio Datadog seleccionado. ().
CloudPrem está en vista previa

Únete a la vista previa de CloudPrem para acceder a las nuevas funciones de gestión de logs autoalojadas.

Request Access

Información general

Un dimensionamiento adecuado del clúster garantiza un rendimiento, una rentabilidad y una fiabilidad óptimos de tu despliegue de CloudPrem. Los requisitos de dimensionamiento dependen de varios factores, como el volumen de ingestión de logs, los patrones de consulta y la complejidad de los datos de tus logs.

Esta guía proporciona recomendaciones básicas para dimensionar los componentes de tu clúster CloudPrem: indexadores, buscadores, servicios de soporte y la base de datos PostgreSQL.

Utiliza el volumen diario previsto de logs y las frecuencias de ingestión máximas como puntos de partida, y a continuación monitoriza el rendimiento de tu clúster y ajusta el dimensionamiento según sea necesario.

Indexadores

Los indexadores reciben logs de los Datadog Agents, luego los procesan, indexan y almacenan como archivos de índice (llamados splits) en el almacenamiento de objetos. Un dimensionamiento adecuado es fundamental para mantener el rendimiento de la ingesta y garantizar que el clúster pueda gestionar el volumen de logs.

EspecificaciónRecomendaciónNotas
Performance (Rendimiento)5 MB/s por vCPURendimiento de referencia para determinar el dimensionamiento inicial. El rendimiento real depende de las características del log (tamaño, número de atributos, nivel de anidamiento).
Memoria4 GB de RAM por vCPU
Tamaño mínimo de pod2 vCPU, 8 GB RAMMínimo recomendado para pods de indexador
Capacidad de almacenamientoAl menos 200 GBNecesario para los datos temporales durante la creación y fusión de ficheros de índice
Tipo de almacenamientoSSD locales (preferido)También se pueden utilizar discos duros locales o almacenamiento en bloque conectado a la red (Amazon EBS, Azure Managed Disks).
E/S de disco~20 MB/s por vCPUEquivalente a 320 IOPS por vCPU para Amazon EBS (suponiendo 64 KB IOPS)

Para indexar 1 TB de logs por día (~11.6 MB/s), sigue los siguientes pasos:

  1. Calcular vCPU: 11.6 MB/s ÷ 5 MB/s per vCPU ≈ 2.3 vCPUs
  2. Calcular RAM: 2.3 vCPUs × 4 GB RAM ≈ 9 GB RAM
  3. Agregar headroom: Comienza con un pod de indexador configurado con 3 vCPU, 12 GB de RAM y un disco de 200 GB. Ajusta estos valores en función del rendimiento observado y las necesidades de redundancia.

Buscadores

Los buscadores gestionan las consultas de búsqueda desde la interfaz de usuario Datadog, leen metadatos del metastore y obtienen datos del almacenamiento de objetos.

Un punto de partida general es aprovisionar aproximadamente el doble del número total de vCPU asignadas a los Indexadores.

  • Rendimiento: El rendimiento de las búsquedas depende en gran medida de la carga de trabajo (complejidad de la consulta, simultaneidad, cantidad de datos analizados). Por ejemplo, las consultas de términos (status:error AND message:exception) suelen ser menos costosas computacionalmente que las agregaciones.
  • Memoria: 4 GB de RAM por vCPU de buscador. Proporciona más RAM, si esperas varias solicitudes de agregación simultáneas.

Otros servicios

Asigna los siguientes recursos a estos componentes ligeros:

ServiciovCPURAMRéplicas
Plano de control24 GB1
Metastore24 GB2
Janitor24 GB1

Base de datos PostgreSQL

  • Tamaño de la instancia: En la mayoría de los casos de uso, una instancia PostgreSQL con 1 vCPU y 4 GB de RAM es suficiente.
  • Recomendación de AWS RDS: Si utilizas AWS RDS, el tipo de instancia t4g.medium es un punto de partida adecuado.
  • Alta disponibilidad: Habilita el despliegue Multi-AZ con una réplica en espera para una alta disponibilidad.

Niveles de dimensionamiento del Helm chart

El Helm chart de CloudPrem proporciona niveles de dimensionamiento predefinidos a través de los parámetros indexer.podSize y searcher.podSize. Cada nivel establece los límites de recursos de vCPU y memoria para un pod, y configura automáticamente los ajustes específicos de los componentes.

TamañovCPUMemoria
medio14 GB
grande28 GB
xlarge416 GB
2xlarge832 GB
4xlarge1664 GB
6xlarge2496 GB
8xlarge32128 GB

Los siguientes valores se aplican automáticamente al configurar indexer.podSize en el Helm chart. Para obtener más detalles sobre cada parámetro, consulta la Configuración del indexador de Quickwit.

Tamañosplit_store_max_num_bytessplit_store_max_num_splits
medio200G10000
grande200G10000
xlarge200G10000
2xlarge200G10000
4xlarge200G10000
6xlarge200G10000
8xlarge200G10000

Los siguientes valores se aplican automáticamente al configurar indexer.podSize en el Helm chart. Para obtener más detalles sobre cada parámetro, consulta la Configuración de la API de ingesta de Quickwit.

Tamañomax_queue_memory_usagemax_queue_disk_usage
medio2GiB4GiB
grande4GiB8GiB
xlarge8GiB16GiB
2xlarge16GiB32GiB
4xlarge32GiB64GiB
6xlarge48GiB96GiB
8xlarge64GiB128GiB

Los siguientes valores se aplican automáticamente a la configuración del buscador cuando se configura searcher.podSize en el Helm chart. Para más detalles sobre cada parámetro, consulta la Configuración del buscador de Quickwit.

Tamañofast_field_cache_capacitysplit_footer_cache_capacitypartial_request_cache_capacitymax_num_concurrent_split_searchesaggregation_memory_limit
medio1GiB500MiB64MiB2500MiB
grande2GiB1GiB128MiB41GiB
xlarge4GiB2GiB256MiB82GiB
2xlarge8GiB4GiB512MiB164GiB
4xlarge16GiB8GiB1GiB328GiB
6xlarge24GiB12GiB1536MiB4812GiB
8xlarge32GiB16GiB2GiB6416GiB

Referencias adicionales