Supported OS Linux

概要

Shoreline のインシデント自動化により、DevOps と Site Reliability Engineer (SRE) は、大規模なデバッグをインタラクティブに行い、迅速に修復を構築して反復作業を排除することができます。

デバッグ・修復機能により、サーバーに個別に SSH 接続することなく、サーバーファーム全体でリアルタイムにコマンドを実行することができます。Linux コマンド、シェルスクリプト、クラウドプロバイダー API の呼び出しなど、Linux コマンドプロンプトに入力できるものはすべて実行し、これらのデバッグセッションを Datadog モニターに接続したオートメーションにします。

Shoreline アプリは、モニターがトリガーされると自動的に自動化を実行し、平均修復時間 (MTTR) と手作業を大幅に削減します。

Shoreline は、待機中の全員が最高の SRE と同等の能力を発揮できるよう支援します。Shoreline は、オンコールチームにデバッグツールと承認された修復アクションを提供し、エスカレーションを減らしてインシデントを迅速に修正し、ミスを減らして初回で正しくインシデントを修正できるよう支援します。

まずは、Shoreline でトライアルアカウントを設定してください。

計画と使用

インフラストラクチャーリスト

以下の手順でインテグレーション構成を行います。

  1. Shoreline Agent をダウンロードします。
  2. このタイルから Datadog インテグレーションをインストールすると、アプリにアクセスできるようになります。
  3. Datadog-Shoreline アプリを構成します。

Shoreline Agent

Agent は、監視対象のホストのバックグラウンドで実行される効率的で非侵入型のプロセスです。Agent は、ホストと接続されているすべてのポッドとコンテナからデータを収集、集計して Shoreline のバックエンドに送信し、バックエンドはそのデータを使用してメトリクスを作成します。

Agent は、Shoreline とお客様の環境のリソースをつなぐ安全なリンクとして機能します。Agent は、単純な Linux コマンドから修復のためのプレイブックまで、お客様に代わってアクションを実行することができます。操作言語ステートメントは、API リクエストを Shoreline のバックエンドに渡し、関連する Agent に渡して、対象リソースにコマンドを実行させます。

Agent は Shoreline のバックエンドからコマンドを受け取り、構成されたアラーム、アクション、ボットに基づいて自動的に修復のステップを踏みます。これらのオブジェクトは、お客様のフリートを監視し、何か問題が発生した場合に適切な対応を行うために連動して動作します。

Shoreline Agent を、Shoreline の監視対象としたいすべてのホストにインストールします。

Shoreline Agent をインストールするには、次の 3 つの方法のいずれかを実行します。

  1. Kubernetes
  2. Kubernetes と Helm
  3. 仮想マシン

アプリの構成

Shoreline で Datadog-Shoreline アプリを構成するには、Datadog の API キーとアプリケーションキーが必要です。また、ダッシュボード名と Webhook 名を定義する必要があります。

例: integration_example

アプリの詳細な構成方法については、Datadog-Shoreline のドキュメントを参照してください。

Agent

ご不明な点は、Datadog のサポートチームまでお問い合わせください。

その他の参考資料

詳細については、Shoreline のドキュメントを参照してください。