Supported OS Linux Mac OS

インテグレーションバージョン4.2.0

概要

このチェックは、Datadog Agent を通じて Ambari を監視します。

計画と使用

インフラストラクチャーリスト

Ambari チェックは Datadog Agent パッケージに含まれています。サーバーに追加でインストールする必要はありません。

ブラウザトラブルシューティング

メトリクスベース SLO

ホストで実行中の Agent に対してこのチェックを構成するには

メトリクスの収集
  1. Ambari のパフォーマンスデータの収集を開始するには、Agent のコンフィギュレーションディレクトリのルートにある conf.d/ フォルダーの ambari.d/conf.yaml ファイルを編集します。使用可能なすべてのコンフィギュレーションオプションの詳細については、サンプル ambari.d/conf.yaml を参照してください。

    init_config:
    
    instances:
      ## @param url - string - required
      ## The URL of the Ambari Server, include http:// or https://
      #
      - url: localhost
    
  2. Agent を再起動します

収集データ

Agent バージョン 6.0 以降で利用可能

  1. Datadog Agent で、ログの収集はデフォルトで無効になっています。以下のように、datadog.yaml ファイルでこれを有効にします。

    logs_enabled: true
    
  2. 下部にある logs 行のコメントを解除して、ambari.d/conf.yaml を編集します。ログの path を Ambari ログファイルの正しいパスで更新してください。

      logs:
        - type: file
          path: /var/log/ambari-server/ambari-alerts.log
          source: ambari
          service: ambari
          log_processing_rules:
              - type: multi_line
                name: new_log_start_with_date
                # 2019-04-22 15:47:00,999
                pattern: \d{4}\-(0?[1-9]|1[012])\-(0?[1-9]|[12][0-9]|3[01])
      ...
    
  3. Agent を再起動します

コンテナ化

コンテナ環境の場合は、オートディスカバリーのインテグレーションテンプレートのガイドを参照して、次のパラメーターを適用してください。

メトリクスの収集
パラメーター
<INTEGRATION_NAME>ambari
<INIT_CONFIG>空白または {}
<INSTANCE_CONFIG>{"url": "http://%%host%%"}
収集データ

Agent バージョン 6.0 以降で利用可能

Datadog Agent で、ログの収集はデフォルトで無効になっています。有効にする方法については、Kubernetes ログ収集を参照してください。

パラメーター
<LOG_CONFIG>`{“source”: “ambari”, “service”: “<サービス名>”, “log_processing_rules”:{“type”:“multi_line”,“name”:“new_log_start_with_date”,“pattern”:"\d{4}-(0?[1-9]

検証

Agent の status サブコマンドを実行し、Checks セクションで ambari を探します。

リアルユーザーモニタリング

このインテグレーションは、以下のシステムメトリクスをすべてのクラスター内のホストごとに収集します。

  • boottime
  • cpu
  • disk
  • memory
  • load
  • ネットワーク
  • process

collect_service_metrics を使用してサービスメトリクスの収集が有効にされている場合、このインテグレーションは、含まれるサービスコンポーネントごとに、インクルードリスト内のヘッダーを持つメトリクスを収集します。

データセキュリティ

ambari.boottime
(gauge)
Host boot time.
Shown as millisecond
ambari.cpu.cpu_idle
(gauge)
Host Idle CPU.
Shown as percent
ambari.cpu.cpu_nice
(gauge)
Host Nice CPU.
Shown as percent
ambari.cpu.cpu_num
(gauge)
Host Idle CPU.
ambari.cpu.cpu_system
(gauge)
Host System CPU.
Shown as percent
ambari.cpu.cpu_user
(gauge)
Host User CPU.
Shown as percent
ambari.cpu.cpu_wio
(gauge)
Host CPU waiting for IO.
Shown as percent
ambari.disk.disk_free
(gauge)
Free disk space.
Shown as byte
ambari.disk.disk_total
(gauge)
Total disk size.
Shown as byte
ambari.disk.read_bytes
(gauge)
Read bytes.
Shown as byte
ambari.disk.read_count
(gauge)
Read count.
ambari.disk.read_time
(gauge)
Disk read time.
Shown as millisecond
ambari.disk.write_bytes
(gauge)
Written bytes.
Shown as byte
ambari.disk.write_count
(gauge)
Written count.
ambari.disk.write_time
(gauge)
Disk write time.
Shown as millisecond
ambari.load_fifteen
(gauge)
Load fifteen.
Shown as percent
ambari.load_five
(gauge)
Load Five.
Shown as percent
ambari.load_one
(gauge)
Load one.
Shown as percent
ambari.memory.mem_cached
(gauge)
Cached Memory.
Shown as byte
ambari.memory.mem_free
(gauge)
Free Memory.
Shown as byte
ambari.memory.mem_shared
(gauge)
Shared Memory.
Shown as byte
ambari.memory.mem_total
(gauge)
Total Memory
Shown as byte
ambari.memory.swap_free
(gauge)
Free Swap
Shown as byte
ambari.memory.swap_total
(gauge)
Total Swap
Shown as byte
ambari.network.bytes_in
(gauge)
Network bytes in.
Shown as byte
ambari.network.bytes_out
(gauge)
Network bytes out.
Shown as byte
ambari.network.pkts_in
(gauge)
Network packets in.
Shown as byte
ambari.network.pkts_out
(gauge)
Network packets out.
Shown as byte
ambari.process.proc_run
(gauge)
Process run.
ambari.process.proc_total
(gauge)
Process total.

ヘルプ

Ambari には、イベントは含まれません。

ヘルプ

ambari.can_connect
Returns OK if the cluster is reachable, CRITICAL otherwise.
Statuses: ok, critical

ambari.state
Returns OK if the service is installed or running, WARNING if the service is stopping or uninstalling, CRITICAL if the service is uninstalled or stopped.
Statuses: ok, warning, critical

ヘルプ

ご不明な点は、Datadog のサポートチームまでお問合せください。