Google Cloud ML

Información general

Google Cloud Machine Learning es un servicio gestionado que permite crear fácilmente modelos de Machine Learning, que funcionen con cualquier tipo de datos, de cualquier tamaño.

Obtén métricas de Google Machine Learning para:

  • Visualizar el rendimiento de tus servicios de ML.
  • Correlacionar el rendimiento de tus servicios de ML con tus aplicaciones.

Configuración

Instalación

Si aún no lo ha hecho, configura primero la integración de Google Cloud Platform. No es necesario realizar ningún otro paso de instalación.

Recopilación de logs

Los logs de Google Cloud Machine Learning se recopilan con Google Cloud Logging y se envían a un trabajo de Dataflow a través de un tema Cloud Pub/Sub. Si aún no lo has hecho, configura la generación de logs con la plantilla de Datadog Dataflow.

Una vez hecho esto, exporta tus logs de Google Cloud Machine Learning de Google Cloud Logging al tema Pub/Sub:

  1. Ve a la página de Google Cloud Logging y filtra los logs de Google Cloud Machine Learning.
  2. Haz clic en Create Export (Crear exportación) y asigna un nombre al sumidero.
  3. Elige “Cloud Pub/Sub” como destino y selecciona el tema Pub/Sub creado para tal fin. Nota: El tema Pub/Sub puede encontrarse en un proyecto diferente.
  4. Haz clic en Create (Crear) y espera a que aparezca el mensaje de confirmación.

Datos recopilados

Métricas

gcp.ml.prediction.error_count
(count)
Recuento acumulado de errores de predicción.
gcp.ml.prediction.latencies.avg
(count)
Latencia media de un determinado tipo.
Se muestra en microsegundos
gcp.ml.prediction.latencies.samplecount
(count)
Recuento de muestras de la latencia de un determinado tipo.
Se muestra en microsegundos
gcp.ml.prediction.latencies.sumsqdev
(count)
Suma de la desviación al cuadrado de la latencia de un determinado tipo.
Se muestra en microsegundos
gcp.ml.prediction.online.accelerator.duty_cycle
(gauge)
Fracción media de tiempo durante el último periodo de muestreo en el que el o los aceleradores estuvieron procesando activamente.
gcp.ml.prediction.online.accelerator.memory.bytes_used
(gauge)
Cantidad de memoria del acelerador asignada por la réplica del modelo.
Se muestra en bytes
gcp.ml.prediction.online.cpu.utilization
(gauge)
Fracción de CPU asignada por la réplica del modelo y actualmente en uso. Puede superar el 100% si el tipo de máquina tiene varias CPU.
gcp.ml.prediction.online.memory.bytes_used
(gauge)
Cantidad de memoria asignada por la réplica del modelo y actualmente en uso.
Se muestra en bytes
gcp.ml.prediction.online.network.bytes_received
(count)
Número de bytes recibidos a través de la red por la réplica del modelo.
Se muestra en bytes
gcp.ml.prediction.online.network.bytes_sent
(count)
Número de bytes enviados a través de la red por la réplica del modelo.
Se muestra en bytes
gcp.ml.prediction.online.replicas
(gauge)
Número de réplicas activas del modelo.
gcp.ml.prediction.online.target_replicas
(gauge)
Número deseado de réplicas activas del modelo.
gcp.ml.prediction.prediction_count
(count)
Recuento acumulado de predicciones.
gcp.ml.prediction.response_count
(count)
Recuento acumulado de diferentes códigos de respuesta.
gcp.ml.training.accelerator.memory.utilization
(gauge)
Fracción de la memoria del acelerador asignada que está actualmente en uso. Los valores son números entre 0.0 y 1.0. Los gráficos muestran los valores como un porcentaje entre 0% y 100%.
gcp.ml.training.accelerator.utilization
(gauge)
Fracción del acelerador asignado que está actualmente en uso. Los valores son números entre 0.0 y 1.0. Los gráficos muestran los valores como un porcentaje entre 0% y 100%.
gcp.ml.training.cpu.utilization
(gauge)
Fracción de la CPU asignada que está actualmente en uso. Los valores son números entre 0.0 y 1.0. Los gráficos muestran los valores como un porcentaje entre 0% y 100%.
gcp.ml.training.memory.utilization
(gauge)
Fracción de memoria asignada que está actualmente en uso. Los valores son números entre 0.0 y 1.0. Los gráficos muestran los valores como un porcentaje entre 0% y 100%.
gcp.ml.training.network.received_bytes_count
(count)
Número de bytes recibidos por el trabajo de entrenamiento a través de la red.
Se muestra en bytes
gcp.ml.training.network.sent_bytes_count
(count)
Número de bytes enviados por el trabajo de entrenamiento a través de la red.
Se muestra en bytes

Eventos

La integración Google Cloud Machine Learning no incluye eventos.

Checks de servicio

La integración Google Cloud Machine Learning no incluye checks de servicio.

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con el servicio de asistencia de Datadog.

Referencias adicionales