Este documento te guiará a través del proceso de configuración de tu entorno de Azure y la instalación de CloudPrem en Azure AKS.
Requisitos previos
Antes de instalar CloudPrem en Azure, debes configurar un conjunto de recursos de infraestructura de soporte. Estos componentes proporcionan los servicios básicos de computación, almacenamiento, bases de datos y redes de los que depende CloudPrem.
Requisitos de infraestructura
Estos son los componentes que debes aprovisionar:
Azure Kubernetes Service (AKS): un clúster de AKS en ejecución dimensionado para tu carga de trabajo prevista en CloudPrem.
PostgreSQL Flexible Server: una instancia de Azure Database para PostgreSQL que CloudPrem utilizará para almacenar sus metadatos.
NGINX Ingress Controller: instalado en el clúster de AKS para enrutar el tráfico externo a los servicios de CloudPrem.
Datadog Agent: desplegado en el clúster de AKS para recopilar y enviar logs a CloudPrem.
Azure Kubernetes Service (AKS)
CloudPrem se ejecuta íntegramente en Kubernetes. Necesitas un clúster de AKS con suficiente CPU, memoria y espacio en disco configurado para tu carga de trabajo. Consulta las recomendaciones de dimensionamiento de clústeres de Kubernetes para obtener orientación.
Para confirmar que se puede acceder al clúster y que los nodos están en el estado Ready, ejecuta el siguiente comando:
kubectl get nodes -o wide
Azure PostgreSQL Flexible Server
CloudPrem almacena sus metadatos y configuración en una base de datos PostgreSQL. Datadog recomienda Azure Database for PostgreSQL Flexible Server. Debe ser accesible desde el clúster de AKS, idealmente con la red privada habilitada. Consulta las recomendaciones de tamaño de Postgres para obtener más detalles.
Por motivos de seguridad, crea una base de datos y un usuario dedicados para CloudPrem, y concede al usuario derechos solo en esa base de datos, no en todo el clúster.
Conéctate a tu base de datos de PostgreSQL desde la red de AKS utilizando el cliente de PostgreSQL, psql. En primer lugar, inicia un pod interactivo en tu clúster de Kubernetes utilizando una imagen que incluya psql:
A continuación, ejecuta el siguiente comando directamente desde el intérprete de comandos, sustituyendo los valores de los parámetros por los valores reales:
CloudPrem utiliza Azure Blob Storage para persistir logs. Crea un contenedor dedicado para este fin.
Crear un contenedor de Blob Storage
Utiliza un contenedor dedicado por entorno (por ejemplo, cloudprem-prod, cloudprem-staging) y asigna los roles RBAC con menos privilegios a nivel de contenedor, en lugar de a nivel de cuenta de almacenamiento.
Se debe conceder a una aplicación Azure AD acceso de lectura/escritura al contenedor de Blob Storage. Registra una aplicación dedicada para CloudPrem y asigna a la entidad principal de servicio correspondiente el rol Contributor en el contenedor de Blob Storage creado anteriormente.
La entrada pública es esencial para permitir que el plano de control y el servicio de consulta de Datadog gestionen y consulten los clústeres de CloudPrem a través de la Internet pública. Proporciona acceso seguro a la API gRPC de CloudPrem a través de los siguientes mecanismos:
Crea un Azure Load Balancer orientado a Internet que acepte tráfico de los servicios de Datadog.
Implementa el cifrado TLS con terminación a nivel de controlador de entrada.
Utiliza HTTP/2 (gRPC) para la comunicación entre los clústeres de Datadog y CloudPrem.
Requiere autenticación TLS mutua (mTLS), en la que los servicios de Datadog deben presentar certificados de cliente válidos.
Configura el controlador en modo TLS passthrough para reenviar certificados de cliente a los pods de CloudPrem con el encabezado ssl-client-cert
Rechaza las solicitudes en las que falten certificados de cliente válidos o el encabezado del certificado.
Utiliza el siguiente archivo de valores Helm NGINX-public.yaml para crear el controlador de entrada público NGINX:
Comprueba que el pod del controlador está en funcionamiento:
kubectl get pods -n nginx-ingress-public -l app.kubernetes.io/component=controller
Comprueba que el servicio expone una IP externa:
kubectl get svc -n nginx-ingress-public -l app.kubernetes.io/component=controller
Controlador de entrada interno NGINX
La entrada interna permite la ingesta de logs desde Datadog Agents y otros recopiladores de logs dentro de tu entorno a través de HTTP. Utiliza el siguiente archivo de valores Helm nginx-internal.yaml para crear el controlador de entrada público NGINX:
Comprueba que el pod del controlador está en funcionamiento:
kubectl get pods -n nginx-ingress-internal -l app.kubernetes.io/component=controller
Comprueba que el servicio expone una IP externa:
kubectl get svc -n nginx-ingress-internal -l app.kubernetes.io/component=controller
DNS
Opcionalmente, puedes añadir una entrada DNS que apunte a la IP del equilibrador de carga público, de forma que futuros cambios de IP no requieran actualizar la configuración en el lado de Datadog.
Crea un espacio de nombres de Kubernetes para el chart:
kubectl create namespace <NAMESPACE_NAME>
Por ejemplo, para crear un espacio de nombres cloudprem:
kubectl create namespace cloudprem
Nota: Puedes establecer un espacio de nombres predeterminado para tu contexto actual para evitar tener que escribir -n <NAMESPACE_NAME> con cada comando:
Almacena la cadena de conexión de la base de datos PostgreSQL como secreto de Kubernetes:
Para recuperar los detalles de tu conexión de PostgreSQL, ve al portal de Azure, navega a All resources (Todos los recursos) y, a continuación, haz clic en tu instancia Azure Database for PostgreSQL flexible server (Servidor flexible de Azure Database para PostgreSQL). Finalmente, en la pestaña Getting started (Introducción), haz clic en el enlace View connection strings (Ver cadenas de conexión) en Connect card (Tarjeta de conexión).
Crea un archivo datadog-values.yaml para sustituir los valores predeterminados por tu configuración personalizada. Aquí es donde se definen los ajustes específicos del entorno, como la etiqueta de imagen, el ID de inquilino de Azure, la cuenta de servicio, la configuración de entrada, las solicitudes y los límites de recursos, etc.
Cualquier parámetro que no se haya sobrescrito explícitamente en datadog-values.yaml vuelve a los valores por defecto definidos en el values.yaml del chart.
# Show default values helm show values datadog/cloudprem
A continuación, verás un ejemplo de archivo datadog-values.yaml con anulaciones para Azure:
datadog-values.yaml
# Configuración de Datadogdatadog:# El sitio de Datadog (https://docs.datadoghq.com/getting_started/site/) al que conectarte. Por defecto es `datadoghq.com`.# site: datadoghq.com# El nombre del secreto existente que contiene la clave de API de Datadog. El nombre de la clave secreta debe ser `api-key`.apiKeyExistingSecret:datadog-secretazure:tenantId:<TENANT_ID># requiredclientId:<CLIENT_ID># required when using AD App to authenticate with Blob StorageclientSecretRef:name:<SECRET_NAME>key:<SECRET_KEY>storageAccount:name:<STORAGE_ACCOUNT_NAME># required# Si estás utilizando una clave de acceso de cuenta de almacenamiento para autenticarte con Blob Storage,# comenta la sección `clientSecretRef` arriba,# y descomenta la sección `storageAccount` a continuación:# accessKeySecretRef:# name: <SECRET_NAME># key: <SECRET_KEY># Configuración de la cuenta de servicio# Si `serviceAccount.create` se establece en `true`, se crea una cuenta de servicio con el nombre especificado.# Se pueden añadir anotaciones adicionales utilizando serviceAccount.extraAnnotations.serviceAccount:create:truename:cloudprem# Configuración del nodo de CloudPremconfig:# El URI raíz donde se almacenan los datos del índice. Debe ser una ruta de Azure.# Todos los índices creados en CloudPrem se almacenan en esta ubicación.default_index_root_uri:azure://<CONTAINER_NAME>/indexes# Configuración de entrada interna# El NLB de entrada interno se crea en subredes privadas.## Se pueden añadir anotaciones adicionales para personalizar el comportamiento del ALB.ingress:# La entrada interna es utilizada por Datadog Agents y otros recopiladores que se ejecutan fuera del# clúster de Kubernetes para enviar sus logs a CloudPrem.internal:enabled:trueingressClassName:nginx-internalhost:cloudprem.acme.internalextraAnnotations:{}# Configuración de metastore# El metastore se encarga de almacenar y gestionar los metadatos de los índices.# Requiere una cadena de conexión de base de datos de PostgreSQL proporcionada por un secreto de Kubernetes.# El secreto debe contener una clave llamada `QW_METASTORE_URI` con un valor en el formato:# postgresql://<username>:<password>@<host>:<port>/<database>## La cadena de conexión de metastore se monta en los pods utilizando extraEnvFrom para hacer referencia al secreto.metastore:extraEnvFrom:- secretRef:nombre:cloudprem-metastore-uri# Configuración del indexador# El indexador es responsable de procesar e indexar los datos entrantes que recibe de diversas fuentes (por ejemplo, Datadog Agents, recopiladores de logs)# y los transforma en archivos de búsqueda llamados "splits" almacenados en S3.## El indexador es escalable horizontalmente: puedes aumentar `replicaCount` para gestionar un mayor rendimiento de indexación.# El parámetro `podSize` establece automáticamente los ajustes específicos de vCPU, memoria y componentes.# Consulta la guía de dimensionamiento para conocer los niveles disponibles y sus configuraciones.indexer:replicaCount:2podSize:xlarge# Configuración del buscador# El buscador es responsable de ejecutar las consultas de búsqueda contra los datos indexados almacenados en S3.# Gestiona las solicitudes de búsqueda del servicio de consulta de Datadog y devuelve los resultados coincidentes.## El buscador es escalable horizontalmente; puedes incrementar `replicaCount` para manejar más búsquedas concurrentes.# Las necesidades de recursos de los buscadores dependen en gran medida de la carga de trabajo y deben determinarse empíricamente.# Entre los factores clave que influyen en el rendimiento de las búsquedas se encuentran:# - Complejidad de la consulta (por ejemplo, número de términos, uso de comodines o expresiones regulares)# - Concurrencia de consultas (número de búsquedas simultáneas)# - Cantidad de datos escaneados por consulta# - Patrones de acceso a los datos (tasas de aciertos de caché)## La memoria es especialmente importante para los buscadores, ya que almacenan en memoria los datos de índice a los que se accede con frecuencia.searcher:replicaCount:2podSize:xlarge