Google Cloud Run para Anthos

Información general

Google Cloud Run para Anthos es una plataforma flexible de desarrollo serverless para entornos híbridos y multicloud. Cloud Run para Anthos es la oferta gestionada y totalmente compatible de Google Knative. Si utilizas Google Cloud totalmente gestionado, consulta la documentación de Google Cloud Run.

Utiliza la integración de Google Cloud Platform con Datadog para recopilar métricas de Google Cloud Run para Anthos.

Configuración

Recopilación de métricas

Instalación

Si aún no lo has hecho, configura la integración de Google Cloud Platform.

Si ya autenticas tus servicios Cloud Run para Anthos utilizando Workload Identity, entonces no es necesario realizar más pasos.

Si no has habilitado Workload Identity, debes migrar para utilizar Workload Identity y empezar a recopilar métricas de Knative. Esto implica vincular una cuenta de servicio de Kubernetes a una cuenta de servicio de Google y configurar cada servicio del que quieres recopilar métricas para que utilice Workload Identity.

Para obtener instrucciones detalladas de configuración, consulta Identidad de cargas de trabajo de Google Cloud.

Recopilación de logs

Google Cloud Run para Anthos expone logs de servicio. Los logs de Google Cloud Run pueden recopilarse con Google Cloud Logging y enviarse a un job (generic) de Dataflow a través de un tema de Cloud Pub/Sub. Si aún no lo has hecho, configura el registro con la plantilla Datadog Dataflow.

Una vez hecho esto, exporta tus logs de Google Cloud Run de Google Cloud Logging al tema Pub/Sub:

  1. Ve a Cloud Run para Anthos, haz clic en los servicios que desees y ve a la pestaña Logs.

  2. Haz clic en View in Logs Explorer (Ver en el Explorador de logs) para ir a la Page (página) de generación de logs de Google Cloud.

  3. Haz clic en Create sink (Crear sumidero) y asigna al sumidero el nombre correspondiente.

  4. Elige “Cloud Pub/Sub” como destino y selecciona el tema Pub/Sub creado para tal fin. Nota: El tema Pub/Sub puede encontrarse en un proyecto diferente.

    Exportar logs de Google Cloud Pub/Sub a Pub Sub
  5. Haz clic en Create (Crear) y espera a que aparezca el mensaje de confirmación.

Rastreo y métricas personalizadas

Utiliza el Datadog Admission Controller para configurar automáticamente los rastreadores de APM y los clientes de DogStatsD. Inserta las variables de entorno DD_AGENT_HOST y DD_ENTITY_ID mediante uno de los siguientes métodos:

  • Añade la etiqueta admission.datadoghq.com/enabled: "true" a tu pod.
  • Configura el Controlador de admisión del Cluster Agent definiendo mutateUnlabelled: true.

Para evitar que los pods reciban variables de entorno, añade la etiqueta admission.datadoghq.com/enabled: "false". Esto funciona incluso si estableces mutateUnlabelled: true. Para obtener más información, consulta la documentación del Datadog Admission Controller.

Datos recopilados

Métricas

gcp.knative.eventing.broker.event_count
(count)
Número de eventos recibidos por un corredor.
gcp.knative.eventing.trigger.event_count
(count)
Número de eventos recibidos por un activador.
gcp.knative.eventing.trigger.event_dispatch_latencies.avg
(gauge)
Media de tiempo empleado en enviar un evento a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.eventing.trigger.event_dispatch_latencies.p99
(gauge)
Percentil 99 del tiempo empleado en enviar un evento a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.eventing.trigger.event_dispatch_latencies.p95
(gauge)
Percentil 95 del tiempo empleado en enviar un evento a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.eventing.trigger.event_processing_latencies.avg
(gauge)
Media de tiempo empleado en procesar un evento antes de que se envíe a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.eventing.trigger.event_processing_latencies.p99
(gauge)
Percentil 99 del tiempo empleado en procesar un evento antes de que se envíe a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.eventing.trigger.event_processing_latencies.p95
(gauge)
Percentil 95 del tiempo empleado en procesar un evento antes de que se envíe a un suscriptor de activación.
Mostrado como milisegundo
gcp.knative.serving.activator.request_count
(count)
El número de solicitudes que se dirigen al activador.
Mostrado como solicitud
gcp.knative.serving.activator.request_latencies.avg
(gauge)
Media de los tiempos de solicitud de servicio en milisegundos para las solicitudes que pasan por el activador.
Mostrado como milisegundo
gcp.knative.serving.activator.request_latencies.p99
(gauge)
Percentil 99 de los tiempos de solicitud de servicio en milisegundos para las solicitudes que pasan por el activador.
Mostrado como milisegundo
gcp.knative.serving.activator.request_latencies.p95
(gauge)
Percentil 95 de los tiempos de solicitud de servicio en milisegundos para las solicitudes que pasan por el activador.
Mostrado como milisegundo
gcp.knative.serving.autoscaler.actual_pods
(gauge)
Número de pods asignados actualmente.
gcp.knative.serving.autoscaler.desired_pods
(gauge)
Número de pods que el autoescalador desea asignar.
gcp.knative.serving.autoscaler.panic_mode
(gauge)
Se configura en 1 si el autoescalador está en modo de pánico para la revisión, en caso contrario 0.
gcp.knative.serving.autoscaler.panic_request_concurrency
(gauge)
Media de concurrencia de solicitudes observada por pod durante la ventana de autoescalado de pánico más corta.
Mostrado como solicitud
gcp.knative.serving.autoscaler.requested_pods
(gauge)
Número de pods de autoescalador solicitados a Kubernetes.
gcp.knative.serving.autoscaler.stable_request_concurrency
(gauge)
Media de concurrencia de solicitudes observada por pod durante la ventana estable de autoescalado.
Mostrado como solicitud
gcp.knative.serving.autoscaler.target_concurrency_per_pod
(gauge)
La concurrencia media deseada de solicitudes por pod durante la ventana estable de autoescalado.
Mostrado como soiicitud
gcp.knative.serving.revision.request_count
(count)
El número de solicitudes que llegan a la revisión.
Mostrado como solicitud
gcp.knative.serving.revision.request_latencies.avg
(gauge)
Media de los tiempos de solicitud de servicio en milisegundos para las solicitudes que llegan a la revisión.
Mostrado como milisegundo
gcp.knative.serving.revision.request_latencies.p99
(gauge)
Percentil 99 de los tiempos de solicitud de servicio en milisegundos para las solicitudes que llegan a la revisión.
Mostrado como milisegundo
gcp.knative.serving.revision.request_latencies.p95
(gauge)
Percentil 95 de los tiempos de solicitud de servicio en milisegundos para las solicitudes que llegan a la revisión.
Mostrado como milisegundo

Eventos

La integración de Google Cloud Run para Anthos no incluye eventos.

Checks de servicio

La integración de Google Cloud Run para Anthos no incluye checks de servicio.

Solucionar problemas

¿Necesitas ayuda? Ponte en contacto con asistencia técnica de Datadog.

Referencias adicionales

Más enlaces, artículos y documentación útiles: