Monitoriza tus HDFS NameNodes primarios y de reserva para saber cuándo tu clúster entra en un estado precario: cuando te queda un NameNode, o cuando es el momento de añadir más capacidad al clúster. Este check del Agent recopila métricas de la capacidad restante, bloques corruptos/faltantes, DataNodes inactivos, carga del sistema de archivos, bloques insuficientemente replicados, fallos de volumen totales (en todos los DataNodes) y mucho más.
Utiliza este check (hdfs_namenode) y su check homólogo (hdfs_datanode), no el antiguo check dos en uno (hdfs); ese check está obsoleto.
Configuración
Sigue las instrucciones a continuación para instalar y configurar este check para un Agent que se ejecute en un host. Para entornos en contenedores, consulta las Plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de estas instrucciones.
Instalación
El check de HDFS NameNode está incluido en el paquete del Datadog Agent, por lo que no necesita instalar nada más en tus NameNodes.
Configuración
Conexión del Agent
host
Para configurar este check para un Agent que se ejecuta en un host:
init_config:instances:## @param hdfs_namenode_jmx_uri - string - required## The HDFS NameNode check retrieves metrics from the HDFS NameNode's JMX## interface via HTTP(S) (not a JMX remote connection). This check must be installed on## a HDFS NameNode. The HDFS NameNode JMX URI is composed of the NameNode's hostname and port.#### The hostname and port can be found in the hdfs-site.xml conf file under## the property dfs.namenode.http-address## https://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml#- hdfs_namenode_jmx_uri:http://localhost:9870
Para entornos en contenedores, consulta las Plantillas de integración de Autodiscovery para obtener orientación sobre la aplicación de los parámetros que se indican a continuación.