概要

Spark ダッシュボードの OpenTelemetry Apache Spark メトリクス

Apache Spark レシーバーは、Apache Spark メトリクスの収集と Spark Overview ダッシュボードへのアクセスを可能にします。apachesparkreceiver の最新バージョンの仕様に従ってレシーバーを構成してください。

詳しくは、OpenTelemetry プロジェクトドキュメントの Apache Spark レシーバーを参照してください。

セットアップ

Datadog で使用するために OpenTelemetry で Apache Spark メトリクスを収集するには:

  1. OpenTelemetry Collector の構成で Apache Spark レシーバーを構成します。
  2. OpenTelemetry Collector が Datadog にエクスポートするように構成されていることを確認します。

詳細な構成オプションと要件については、Apache Spark レシーバーのドキュメントを参照してください。

収集されたデータ

OTELDESCRIPTIONFILTER
spark.driver.block_manager.disk.usageDisk space used by the BlockManager.
spark.driver.block_manager.memory.usageMemory usage for the driver’s BlockManager.
spark.driver.dag_scheduler.stage.countNumber of stages the DAGScheduler is either running or needs to run.
spark.executor.disk.usageDisk space used by this executor for RDD storage.
spark.executor.memory.usageStorage memory used by this executor.
spark.job.stage.activeNumber of active stages in this job.
spark.job.stage.resultNumber of stages with a specific result in this job.job_result: failed
spark.job.stage.resultNumber of stages with a specific result in this job.job_result: skipped
spark.job.stage.resultNumber of stages with a specific result in this job.job_result: completed
spark.job.task.activeNumber of active tasks in this job.
spark.job.task.resultNumber of tasks with a specific result in this job.job_result: completed
spark.job.task.resultNumber of tasks with a specific result in this job.job_result: failed
spark.job.task.resultNumber of tasks with a specific result in this job.job_result: skipped
spark.stage.io.recordsNumber of records written and read in this stage.direction: in
spark.stage.io.recordsNumber of records written and read in this stage.direction: out
spark.stage.io.sizeAmount of data written and read at this stage.direction: in
spark.stage.io.sizeAmount of data written and read at this stage.direction: out
spark.stage.shuffle.io.read.sizeAmount of data read in shuffle operations in this stage.
spark.stage.shuffle.io.recordsNumber of records written or read in shuffle operations in this stage.direction: in
spark.stage.shuffle.io.recordsNumber of records written or read in shuffle operations in this stage.direction: out

詳細は OpenTelemetry メトリクス マッピング を参照してください。

参考資料

お役に立つドキュメント、リンクや記事: