Microsoft Azure Machine Learning

Información general

El servicio Azure Machine Learning ofrece a los desarrolladores y científicos de datos una amplia gama de experiencias productivas para crear, entrenar y desplegar modelos de machine learning más rápido. Utiliza Datadog para monitorizar el rendimiento y el uso de Azure Machine Learning en contexto con el resto de tus aplicaciones e infraestructura.

Obtén métricas de Azure Machine Learning para:

  • Rastrear el número y el estado de las ejecuciones y los despliegues de modelos
  • Monitorizar la utilización de tus nodos de machine learning
  • Optimizar el rendimiento frente al coste

Configuración

Instalación

Si aún no lo has hecho, primero configura la integración de Microsoft Azure. No es necesario realizar ningún otro paso de instalación.

Datos recopilados

Métricas

azure.machinelearningservices_workspaces.completed_runs
(gauge)
El número de ejecuciones completadas con éxito para este espacio de trabajo.
Se muestra como operación
azure.machinelearningservices_workspaces.started_runs
(gauge)
El número de ejecuciones iniciadas para este espacio de trabajo.
Se muestra como operación
azure.machinelearningservices_workspaces.failed_runs
(gauge)
El número de ejecuciones fallidas para este espacio de trabajo.
Se muestra como operación
azure.machinelearningservices_workspaces.model_register_succeeded
(gauge)
Número de registros de modelos que han tenido éxito en este espacio de trabajo.
azure.machinelearningservices_workspaces.model_register_failed
(gauge)
Número de registros de modelos que fallaron en este espacio de trabajo.
azure.machinelearningservices_workspaces.model_deploy_started
(gauge)
Número de despliegues de modelos iniciados en este espacio de trabajo.
azure.machinelearningservices_workspaces.model_deploy_succeeded
(gauge)
Número de despliegues de modelos que han tenido éxito en este espacio de trabajo.
azure.machinelearningservices_workspaces.moddel_deploy_failed
(gauge)
Número de despliegues de modelos que han fallado en este espacio de trabajo.
azure.machinelearningservices_workspaces.total_nodes
(gauge)
El número de nodos totales. Este total incluye algunos de los Nodos activos, Nodos inactivos, Nodos inutilizables, Nodos reemplazados, Nodos salientes.
Se muestra como nodo
azure.machinelearningservices_workspaces.active_nodes
(gauge)
El número de nodos acitvos. Estos son los nodos que están ejecutando activamente un trabajo.
Se muestra como nodo
azure.machinelearningservices_workspaces.idle_nodes
(gauge)
El número de nodos inactivos. Los nodos inactivos son los nodos que no están ejecutando ningún trabajo pero que pueden aceptar nuevos trabajos si están disponibles.
Se muestra como nodo
azure.machinelearningservices_workspaces.unusable_nodes
(gauge)
El número de nodos inutilizables. Los nodos inutilizables no son funcionales debido a algún problema sin resolver. Azure reciclará estos nodos.
Se muestra como nodo
azure.machinelearningservices_workspaces.preempted_nodes
(gauge)
Número de nodos reemplazados. Estos nodos son los nodos de baja prioridad que se quitan de la reserva de nodos disponibles.
Se muestra como nodo
azure.machinelearningservices_workspaces.leaving_nodes
(gauge)
Número de nodos salientes. Los nodos salientes son los nodos que acaban de terminar de procesar un trabajo y pasarán al estado inactivo.
Se muestra como nodo
azure.machinelearningservices_workspaces.total_cores
(gauge)
El número total de núcleos.
Se muestra como núcleo
azure.machinelearningservices_workspaces.active_cores
(gauge)
El número de núcleos activos.
Se muestra como núcleo
azure.machinelearningservices_workspaces.idle_cores
(gauge)
El número de núcleos inactivos.
Se muestra como núcleo
azure.machinelearningservices_workspaces.unusable_cores
(gauge)
El número de núcleos inutilizables.
Se muestra como núcleo
azure.machinelearningservices_workspaces.preempted_cores
(gauge)
El número de núcleos reemplazados.
Se muestra como núcleo
azure.machinelearningservices_workspaces.leaving_cores
(gauge)
El número de núcleos salientes.
Se muestra como núcleo
azure.machinelearningservices_workspaces.quota_utilization_percentage
(gauge)
El porcentaje de cuota utilizado.
Se muestra como porcentaje
azure.machinelearningservices_workspaces.cpuutilization
(gauge)
Utilización de la CPU
Se muestra en porcentaje
azure.machinelearningservices_workspaces.gpuutilization
(gauge)
Utilización de la GPU
Se muestra en porcentaje

Eventos

La integración Azure Machine Learning no incluye eventos.

Checks de servicio

La integración Azure Machine Learning no incluye checks de servicios.

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el soporte de Datadog.

Referencias adicionales