Supported OS Linux Mac OS

インテグレーションバージョン6.0.0

概要

このチェックは、Datadog Agent を通じて Ambari を監視します。

セットアップ

インストール

Ambari チェックは Datadog Agent パッケージに含まれています。サーバーに追加でインストールする必要はありません。

構成

ホスト

ホストで実行中の Agent に対してこのチェックを構成するには

メトリクスの収集
  1. Ambari のパフォーマンスデータの収集を開始するには、Agent のコンフィギュレーションディレクトリのルートにある conf.d/ フォルダーの ambari.d/conf.yaml ファイルを編集します。使用可能なすべてのコンフィギュレーションオプションの詳細については、サンプル ambari.d/conf.yaml を参照してください。

    init_config:
    
    instances:
      ## @param url - string - required
      ## The URL of the Ambari Server, include http:// or https://
      #
      - url: localhost
    
  2. Agent を再起動します

ログ収集

Agent バージョン 6.0 以降で利用可能

  1. Datadog Agent で、ログの収集はデフォルトで無効になっています。以下のように、datadog.yaml ファイルでこれを有効にします。

    logs_enabled: true
    
  2. 下部にある logs 行のコメントを解除して、ambari.d/conf.yaml を編集します。ログの path を Ambari ログファイルの正しいパスで更新してください。

      logs:
        - type: file
          path: /var/log/ambari-server/ambari-alerts.log
          source: ambari
          service: ambari
          log_processing_rules:
              - type: multi_line
                name: new_log_start_with_date
                # 2019-04-22 15:47:00,999
                pattern: \d{4}\-(0?[1-9]|1[012])\-(0?[1-9]|[12][0-9]|3[01])
      ...
    
  3. Agent を再起動します

コンテナ化

コンテナ環境の場合は、オートディスカバリーのインテグレーションテンプレートのガイドを参照して、次のパラメーターを適用してください。

メトリクスの収集
パラメーター
<INTEGRATION_NAME>ambari
<INIT_CONFIG>空白または {}
<INSTANCE_CONFIG>{"url": "http://%%host%%"}
ログ収集

Agent バージョン 6.0 以降で利用可能

Datadog Agent で、ログの収集はデフォルトで無効になっています。有効にする方法については、Kubernetes ログ収集を参照してください。

パラメーター
<LOG_CONFIG>`{“source”: “ambari”, “service”: “<サービス名>”, “log_processing_rules”:{“type”:“multi_line”,“name”:“new_log_start_with_date”,“pattern”:"\d{4}-(0?[1-9]

検証

Agent の status サブコマンドを実行し、Checks セクションで ambari を探します。

収集データ

このインテグレーションは、以下のシステムメトリクスをすべてのクラスター内のホストごとに収集します。

  • boottime
  • cpu
  • disk
  • memory
  • load
  • ネットワーク
  • process

collect_service_metrics を使用してサービスメトリクスの収集が有効にされている場合、このインテグレーションは、含まれるサービスコンポーネントごとに、インクルードリスト内のヘッダーを持つメトリクスを収集します。

メトリクス

ambari.boottime
(gauge)
Host boot time.
Shown as millisecond
ambari.cpu.cpu_idle
(gauge)
Host Idle CPU.
Shown as percent
ambari.cpu.cpu_nice
(gauge)
Host Nice CPU.
Shown as percent
ambari.cpu.cpu_num
(gauge)
Host Idle CPU.
ambari.cpu.cpu_system
(gauge)
Host System CPU.
Shown as percent
ambari.cpu.cpu_user
(gauge)
Host User CPU.
Shown as percent
ambari.cpu.cpu_wio
(gauge)
Host CPU waiting for IO.
Shown as percent
ambari.disk.disk_free
(gauge)
Free disk space.
Shown as byte
ambari.disk.disk_total
(gauge)
Total disk size.
Shown as byte
ambari.disk.read_bytes
(gauge)
Read bytes.
Shown as byte
ambari.disk.read_count
(gauge)
Read count.
ambari.disk.read_time
(gauge)
Disk read time.
Shown as millisecond
ambari.disk.write_bytes
(gauge)
Written bytes.
Shown as byte
ambari.disk.write_count
(gauge)
Written count.
ambari.disk.write_time
(gauge)
Disk write time.
Shown as millisecond
ambari.load_fifteen
(gauge)
Load fifteen.
Shown as percent
ambari.load_five
(gauge)
Load Five.
Shown as percent
ambari.load_one
(gauge)
Load one.
Shown as percent
ambari.memory.mem_cached
(gauge)
Cached Memory.
Shown as byte
ambari.memory.mem_free
(gauge)
Free Memory.
Shown as byte
ambari.memory.mem_shared
(gauge)
Shared Memory.
Shown as byte
ambari.memory.mem_total
(gauge)
Total Memory
Shown as byte
ambari.memory.swap_free
(gauge)
Free Swap
Shown as byte
ambari.memory.swap_total
(gauge)
Total Swap
Shown as byte
ambari.network.bytes_in
(gauge)
Network bytes in.
Shown as byte
ambari.network.bytes_out
(gauge)
Network bytes out.
Shown as byte
ambari.network.pkts_in
(gauge)
Network packets in.
Shown as byte
ambari.network.pkts_out
(gauge)
Network packets out.
Shown as byte
ambari.process.proc_run
(gauge)
Process run.
ambari.process.proc_total
(gauge)
Process total.

イベント

Ambari には、イベントは含まれません。

サービスチェック

ambari.can_connect
Returns OK if the cluster is reachable, CRITICAL otherwise.
Statuses: ok, critical

ambari.state
Returns OK if the service is installed or running, WARNING if the service is stopping or uninstalling, CRITICAL if the service is uninstalled or stopped.
Statuses: ok, warning, critical

トラブルシューティング

ご不明な点は、Datadog のサポートチームまでお問合せください。