Vespa
Rapport de recherche Datadog : Bilan sur l'adoption de l'informatique sans serveur Rapport : Bilan sur l'adoption de l'informatique sans serveur

Vespa

Agent Check Check de l'Agent

Supported OS: Linux

Présentation

Recueillez des métriques de votre système Vespa en temps réel pour :

  • Visualiser et surveiller l’état et les performances de Vespa
  • Envoyer des alertes sur l’état et la disponibilité

Implémentation

Le check Vespa n’est pas inclus avec le paquet de l’Agent Datadog.

Installation

Pour installer le check sur votre host :

  1. Installez le kit de développement sur n’importe quelle machine.
  2. Exécutez ddev release build vespa pour générer le paquet.
  3. Téléchargez l’Agent Datadog.
  4. Importez l’artefact du build sur tous les hosts avec un Agent et exécutez datadog-agent integration install -w chemin/vers/vespa/dist/<NOM_ARTEFACT>.whl.

Configuration

Pour configurer le check Vespa :

  1. Créez un dossier vespa.d/ dans le dossier conf.d/ à la racine du répertoire de configuration de l’Agent.
  2. Créez un fichier conf.yaml dans le dossier vespa.d/ précédemment créé.
  3. Consultez le fichier d’exemple vespa.d/conf.yaml et copiez son contenu dans le fichier conf.yaml.
  4. Modifiez le fichier conf.yaml pour configurer le consumer, qui détermine l’ensemble de métriques transmises par le check :
    • consumer : consommateur pour lequel recueillir les métriques. Peut être défini sur default ou un consommateur personnalisé à partir du services.xml de votre application Vespa.
  5. Redémarrez l’Agent.

Validation

Lancez la sous-commande status de l’Agent et cherchez vespa dans la section Checks.

Données collectées

Métriques

vespa.http.status.1xx.rate
(gauge)
Number of responses with a 1xx status
Shown as response
vespa.http.status.2xx.rate
(gauge)
Number of responses with a 2xx status
Shown as response
vespa.http.status.3xx.rate
(gauge)
Number of responses with a 3xx status
Shown as response
vespa.http.status.4xx.rate
(gauge)
Number of responses with a 4xx status
Shown as response
vespa.http.status.5xx.rate
(gauge)
Number of responses with a 5xx status
Shown as response
vespa.jdisc.gc.ms.average
(gauge)
Time spent in GC
Shown as millisecond
vespa.mem.heap.free.average
(gauge)
Free heap size
Shown as byte
vespa.queries.rate
(gauge)
Number of search queries
Shown as query
vespa.feed.operations.rate
(gauge)
Number of feed operations
Shown as operation
vespa.query_latency.average
(gauge)
Total query processing time
Shown as millisecond
vespa.query_latency.95percentile
(gauge)
95 percentile total query processing time
Shown as millisecond
vespa.query_latency.99percentile
(gauge)
99 percentile total query processing time
Shown as millisecond
vespa.hits_per_query.average
(gauge)
Hits in the returned result, per query
Shown as hit
vespa.totalhits_per_query.average
(gauge)
Estimated total number of hits per query
Shown as hit
vespa.degraded_queries.rate
(gauge)
Queries with degraded results due to timeout
Shown as query
vespa.failed_queries.rate
(gauge)
Failed queries
Shown as query
vespa.serverActiveThreads.average
(gauge)
Threads that are active processing requests
Shown as thread
vespa.content.proton.search_protocol.docsum.requested_documents.rate
(gauge)
Requested document summaries
Shown as document
vespa.content.proton.search_protocol.docsum.latency.average
(gauge)
Docsum request latency on content node
Shown as second
vespa.content.proton.search_protocol.query.latency.average
(gauge)
Query request latency on content node
Shown as second
vespa.content.proton.documentdb.documents.total.last
(gauge)
Total documents in this document db (ready + not-ready)
Shown as document
vespa.content.proton.documentdb.documents.ready.last
(gauge)
Ready documents in this document db
Shown as document
vespa.content.proton.documentdb.documents.active.last
(gauge)
Active/searchable documents in this document db
Shown as document
vespa.content.proton.documentdb.disk_usage.last
(gauge)
Total disk usage for this document db
Shown as byte
vespa.content.proton.documentdb.memory_usage.allocated_bytes.last
(gauge)
Total memory usage for this document db
Shown as byte
vespa.content.proton.resource_usage.disk.average
(gauge)
Relative amount of disk space used by this process
Shown as fraction
vespa.content.proton.resource_usage.memory.average
(gauge)
Relative amount of memory used by this process
Shown as fraction
vespa.content.proton.resource_usage.feeding_blocked.last
(gauge)
Whether feeding is blocked due to resource limitations (value is 0 or 1)
vespa.content.proton.documentdb.matching.docs_matched.rate
(gauge)
Number of documents matched
Shown as document
vespa.content.proton.documentdb.matching.docs_reranked.rate
(gauge)
Number of documents re-ranked (second phase)
Shown as document
vespa.content.proton.documentdb.matching.rank_profile.query_latency.average
(gauge)
Total latency when matching and ranking a query
Shown as second
vespa.content.proton.documentdb.matching.rank_profile.query_setup_time.average
(gauge)
Average time spent setting up and tearing down queries
Shown as second
vespa.content.proton.documentdb.matching.rank_profile.rerank_time.average
(gauge)
Time spent on 2nd phase ranking
Shown as second
vespa.content.proton.transactionlog.disk_usage.last
(gauge)
Disk usage of the transaction log
Shown as byte

Checks de service

vespa.metrics_health :
Renvoie CRITICAL en cas d’absence de réponse de l’API Node metrics Vespa. Renvoie WARNING si une réponse est renvoyée par l’API Node metrics Vespa, mais qu’une erreur de traitement est survenue. Si ce n’est pas le cas, renvoie OK.

vespa.process_health :
Pour chaque processus Vespa, renvoie CRITICAL si le processus semble être inactif (l’API Node metrics Vespa n’a pas pu se connecter au processus). Renvoie WARNING si le statut du processus est inconnu (l’API Node metrics Vespa peut se connecter au processus, mais la réponse contient une erreur). Si ce n’est pas le cas, renvoie OK.

Événements

L’intégration Vespa n’inclut aucun événement.

Dépannage

Besoin d’aide ? Contactez l’assistance Datadog.