Dimensionamiento de clústeres

Documentos > CloudPrem > Operar CloudPrem > Dimensionamiento de clústeres

CloudPrem está en vista previa

Únete a la vista previa de CloudPrem para acceder a las nuevas funciones de gestión de logs autoalojadas.

Información general

Un dimensionamiento adecuado del clúster garantiza un rendimiento, una rentabilidad y una fiabilidad óptimos de tu despliegue de CloudPrem. Los requisitos de dimensionamiento dependen de varios factores, como el volumen de ingestión de logs, los patrones de consulta y la complejidad de los datos de tus logs.

Esta guía proporciona recomendaciones básicas para dimensionar los componentes de tu clúster CloudPrem: indexadores, buscadores, servicios de soporte y la base de datos PostgreSQL.

Utiliza el volumen diario previsto de logs y las frecuencias de ingestión máximas como puntos de partida, y a continuación monitoriza el rendimiento de tu clúster y ajusta el dimensionamiento según sea necesario.

Indexadores

Los indexadores reciben logs de los Datadog Agents, luego los procesan, indexan y almacenan como archivos de índice (llamados splits) en el almacenamiento de objetos. Un dimensionamiento adecuado es fundamental para mantener el rendimiento de la ingesta y garantizar que el clúster pueda gestionar el volumen de logs.

Especificación	Recomendación	Notas
Performance (Rendimiento)	5 MB/s por vCPU	Rendimiento de referencia para determinar el dimensionamiento inicial. El rendimiento real depende de las características del log (tamaño, número de atributos, nivel de anidamiento).
Memoria	4 GB de RAM por vCPU
Tamaño mínimo de pod	2 vCPU, 8 GB RAM	Mínimo recomendado para pods de indexador
Capacidad de almacenamiento	Al menos 200 GB	Necesario para los datos temporales durante la creación y fusión de ficheros de índice
Tipo de almacenamiento	SSD locales (preferido)	También se pueden utilizar discos duros locales o almacenamiento en bloque conectado a la red (Amazon EBS, Azure Managed Disks).
E/S de disco	~20 MB/s por vCPU	Equivalente a 320 IOPS por vCPU para Amazon EBS (suponiendo 64 KB IOPS)

Ejemplo: Dimensionamiento de 1 TB de logs por día

Para indexar 1 TB de logs por día (~11.6 MB/s), sigue los siguientes pasos:

Calcular vCPU: 11.6 MB/s ÷ 5 MB/s per vCPU ≈ 2.3 vCPUs
Calcular RAM: 2.3 vCPUs × 4 GB RAM ≈ 9 GB RAM
Agregar headroom: Comienza con un pod de indexador configurado con 3 vCPU, 12 GB de RAM y un disco de 200 GB. Ajusta estos valores en función del rendimiento observado y las necesidades de redundancia.

Buscadores

Los buscadores gestionan las consultas de búsqueda desde la interfaz de usuario Datadog, leen metadatos del metastore y obtienen datos del almacenamiento de objetos.

Un punto de partida general es aprovisionar aproximadamente el doble del número total de vCPU asignadas a los Indexadores.

Rendimiento: El rendimiento de las búsquedas depende en gran medida de la carga de trabajo (complejidad de la consulta, simultaneidad, cantidad de datos analizados). Por ejemplo, las consultas de términos (status:error AND message:exception) suelen ser menos costosas computacionalmente que las agregaciones.
Memoria: 4 GB de RAM por vCPU de buscador. Proporciona más RAM, si esperas varias solicitudes de agregación simultáneas.

Otros servicios

Asigna los siguientes recursos a estos componentes ligeros:

Servicio	vCPU	RAM	Réplicas
Plano de control	2	4 GB	1
Metastore	2	4 GB	2
Janitor	2	4 GB	1

Base de datos PostgreSQL

Tamaño de la instancia: En la mayoría de los casos de uso, una instancia PostgreSQL con 1 vCPU y 4 GB de RAM es suficiente.
Recomendación de AWS RDS: Si utilizas AWS RDS, el tipo de instancia t4g.medium es un punto de partida adecuado.
Alta disponibilidad: Habilita el despliegue Multi-AZ con una réplica en espera para una alta disponibilidad.

Niveles de dimensionamiento del Helm chart

El Helm chart de CloudPrem proporciona niveles de dimensionamiento predefinidos a través de los parámetros indexer.podSize y searcher.podSize. Cada nivel establece los límites de recursos de vCPU y memoria para un pod, y configura automáticamente los ajustes específicos de los componentes.

Tamaño	vCPU	Memoria
medio	1	4 GB
grande	2	8 GB
xlarge	4	16 GB
2xlarge	8	32 GB
4xlarge	16	64 GB
6xlarge	24	96 GB
8xlarge	32	128 GB

Configuración del indexador por nivel

Los siguientes valores se aplican automáticamente al configurar indexer.podSize en el Helm chart. Para obtener más detalles sobre cada parámetro, consulta la Configuración del indexador de Quickwit.

Tamaño	split_store_max_num_bytes	split_store_max_num_splits
medio	200G	10000
grande	200G	10000
xlarge	200G	10000
2xlarge	200G	10000
4xlarge	200G	10000
6xlarge	200G	10000
8xlarge	200G	10000

Configuración de la API de ingesta por nivel

Tamaño	max_queue_memory_usage	max_queue_disk_usage
medio	2GiB	4GiB
grande	4GiB	8GiB
xlarge	8GiB	16GiB
2xlarge	16GiB	32GiB
4xlarge	32GiB	64GiB
6xlarge	48GiB	96GiB
8xlarge	64GiB	128GiB

Configuración del buscador por nivel

Los siguientes valores se aplican automáticamente a la configuración del buscador cuando se configura searcher.podSize en el Helm chart. Para más detalles sobre cada parámetro, consulta la Configuración del buscador de Quickwit.

Tamaño	fast_field_cache_capacity	split_footer_cache_capacity	partial_request_cache_capacity	max_num_concurrent_split_searches	aggregation_memory_limit
medio	1GiB	500MiB	64MiB	2	500MiB
grande	2GiB	1GiB	128MiB	4	1GiB
xlarge	4GiB	2GiB	256MiB	8	2GiB
2xlarge	8GiB	4GiB	512MiB	16	4GiB
4xlarge	16GiB	8GiB	1GiB	32	8GiB
6xlarge	24GiB	12GiB	1536MiB	48	12GiB
8xlarge	32GiB	16GiB	2GiB	64	16GiB

Referencias adicionales

Más enlaces, artículos y documentación útiles:

Configurar el ingreso a CloudPremDOCUMENTACIÓN

Configurar el procesamiento de logs de CloudPremDOCUMENTACIÓN

Más información sobre la arquitectura de CloudPremDOCUMENTACIÓN