Amazon EMR

概要

Data Jobs Monitoring は、EMR クラスター上の Spark ジョブの観測、トラブルシューティング、コスト最適化を支援します。

Amazon EMR は、膨大な量のデータを迅速かつコスト効率よく簡単に処理できる Web サービスです。

このインテグレーションを有効にすると、EMR メトリクスを Datadog に表示できます。

Amazon Web Services インテグレーションをまだセットアップしていない場合は、最初にセットアップします。

Amazon EMR のメトリクスを収集するには、次のアクセス許可を Datadog IAM ポリシーに追加します。詳細については、AWS ウェブサイト上の EMR ポリシーを参照してください。

AWS アクセス許可	説明
`elasticmapreduce:ListClusters`	使用できるクラスターを一覧表示します。
`elasticmapreduce:DescribeCluster`	CloudWatch EMR メトリクスにタグを追加します。

Amazon EMR から S3 バケットまたは CloudWatch のいずれかにログを送信するよう構成します。

注: S3 バケットにログを送る場合は、Target prefix が amazon_emr に設定されているかを確認してください。

Datadog Forwarder Lambda 関数をまだセットアップしていない場合は、セットアップします。
Lambda 関数がインストールされたら、AWS コンソールから、Amazon EMR ログを含む S3 バケットまたは CloudWatch のロググループに手動でトリガーを追加します。
- S3 バケットに手動トリガーを追加
- CloudWatch ロググループに手動トリガーを追加

AWS から取得される各メトリクスには、ホスト名やセキュリティグループなど、AWS コンソールに表示されるのと同じタグが割り当てられます。

Amazon EMR インテグレーションには、イベントは含まれません。

Amazon EMR インテグレーションには、サービスのチェック機能は含まれません。

ご不明な点は、Datadog のサポートチームまでお問合せください。