エラー外れ値
エラー外れ値は、現在のクエリに一致するエラーの特性を含むファセットタグまたは属性などのフィールドを表示します。エラー間で統計的に過大評価されている key:value
ペアは、問題の根本原因へのヒントになります。
典型的なエラー外れ値の例として、env:staging
、docker_image:acme:3.1
、http.useragent_details.browser.family:curl
が挙げられます。
バナーカードビューでは、次のことがわかります。
- フィールド名
- フィールドが寄与するエラーと全体的なログの割合
フルサイドパネルビューでは、次のことがわかります。
- フィールドを含むエラーログの時系列
- エラーログに関連付けられることが多いタグ
- ログパターンの包括的なリスト
APM の外れ値は、Watchdog Insights カルーセルが利用可能なすべての APM ページで利用できます。
エラー外れ値
エラー外れ値は、現在のクエリに一致するエラーの特性を含むタグなどのフィールドを表示します。エラー間で統計的に過大評価されている key:value
ペアは、問題の根本原因へのヒントになります。
典型的なエラー外れ値には、env:staging
、availability_zone:us-east-1a
、cluster_name:chinook
、version:v123456
などがあります。
バナーカードビューでは、次のことがわかります。
- フィールド名
- フィールドが寄与するエラーと全体的なトレースの割合
フルサイドパネルビューでは、次のことがわかります。
- フィールドを含むエラートレースの時系列
- エラートレースに関連付けられることが多いタグ
- 関連するエラー追跡の問題と失敗スパンの包括的なリスト
レイテンシー外れ値
レイテンシー外れ値は、現在の検索クエリに一致する、パフォーマンスのボトルネックに関連付けられているタグなどのフィールドを表示します。ベースラインよりもパフォーマンスが悪い key:value
ペアは、APM スパンのサブセット間のパフォーマンスのボトルネックへのヒントになります。
レイテンシー外れ値は、スパン期間に対して計算されます。
バナーカードビューでは、次のことがわかります。
- フィールド名
- タグを含むスパンのレイテンシー分布と残りのデータのベースライン
- 外れ値タグの対象レイテンシー値のパーセンタイルと、残りのデータのベースラインとの差
フルサイドパネルでは、タグとベースラインのレイテンシー分布グラフを見ることができます。X 軸には p50
、p75
、p99
、max
の増分と、フィールドを含む APM イベントのリストが表示されます。
ロック競合外れ値
バナーカードビューでは、次のことがわかります。
- 影響を受けるサービスの名前
- 影響を受けるスレッドの数
- 潜在的な CPU の節約 (および推定コスト節約)
フルサイドパネルでは、ロック競合を解消する方法を確認できます。
ガベージコレクション外れ値
バナーカードビューでは、次のことがわかります。
- 影響を受けるサービスの名前
- ガベージコレクションの実行に使用される CPU 時間
フルサイドパネルでは、ガベージコレクションをより適切に構成して CPU 時間を解放する方法を確認できます。
正規表現コンパイル外れ値
バナーカードビューでは、次のことがわかります。
- 影響を受けるサービスの名前
- 正規表現のコンパイルに使用される CPU 時間
フルサイドパネルでは、正規表現のコンパイル時間を改善する方法や、コード内で改善できる関数の例を確認できます。
Database Monitoring では、Watchdog は以下のメトリクスに関するインサイトを表面化します。
CPU
Commits
IO
Background
Concurrency
Idle
インサイトカルーセルを使用して、1 つまたは複数の外れ値の影響を受けたデータベースを発見します。
そして、データベースにオーバーレイが設定され、さまざまなインサイトをハイライトするピンクの錠剤が表示され、何が起こったかを詳細に確認することができます。
エラー外れ値
エラー外れ値は、現在の検索クエリに一致するエラーの特徴を含むファセット化されたタグまたは属性のようなフィールドを表示します。エラーの中で統計的に多く出現する key:value
のペアは、問題の根本的な原因を探るヒントを与えてくれます。エラーの外れ値の典型的な例としては、env:staging
や version:1234
、browser.name:Chrome
などがあります。
バナーカードビューでは、次のことがわかります。
- フィールド名
- フィールドが寄与する総エラーと全体的な RUM イベントの割合
- 関連タグ
フルサイドパネルでは、そのフィールドを含む RUM エラーの総数に関する時系列グラフと、影響度を示す円グラフおよびそのフィールドを含む RUM イベントのリストが表示されます。
レイテンシー外れ値
レイテンシー外れ値は、現在の検索クエリに一致する、パフォーマンスのボトルネックに関連付けられているファセットタグまたは属性などのフィールドを表示します。ベースラインよりもパフォーマンスが悪い key:value
ペアは、実際のユーザーのサブセット間のパフォーマンスのボトルネックへのヒントになります。
レイテンシー外れ値は、First Contentful Paint、First Input Delay、Cumulative Layout Shift などの Core Web Vitals、および Loading Time に対して計算されます。詳しくは、ページのパフォーマンスの監視をご覧ください。
バナーカードビューでは、次のことがわかります。
- フィールド名
- フィールドと残りのデータのベースラインを含むパフォーマンスメトリクス値
フルサイドパネルでは、パフォーマンスメトリクスに関する時系列グラフが表示されます。X 軸には p50
、p75
、p99
、max
の増分と、フィールドを含む RUM イベントのリストが表示されます。
サーバーレスインフラストラクチャーに対して、Watchdog は以下のようなインサイトを提示します。
Cold Start Ratio Up/Down
Error Invocation Ratio Up/Down
Memory Usage Up/Down
OOM Ratio Up/Down
Estimated Cost Up/Down
Init Duration Up/Down
Runtime Duration Up/Down
インサイトカルーセルを使用して、1 つまたは複数の外れ値の影響を受けたサーバーレス関数を発見します。
そして、関数にオーバーレイが設定され、ピンクのハイライトがさまざまなインサイトを強調し、何が起こったかについての詳細情報を提供します。
プロセスエクスプローラーの場合、Watchdog インサイトカルーセルには、プロセスエクスプローラーの現在のコンテキストのすべてのプロセスの異常が反映されます。
Kubernetes エクスプローラーの場合、Watchdog インサイトカルーセルには、Kubernetes エクスプローラーの現在のコンテキストのすべての Kubernetes の異常が反映されます。