Tag Spotlight を使用してエラーの根本原因を見つける
この Splunk APM の例では、APM の Tag Spotlight を使用して根本原因エラーを見つける方法を説明します。
Deepu はサイト信頼性エンジニアの Kai から通知を受け取りました。この通知には、/PaymentService/Charge エンドポイントの高い根本原因エラー率が、お客様の Buttercup Games ウェブサイトでのショッピングを妨げているとあります。通知には、Splunk APM サービスマップ上のエンドポイントへのリンクも含まれています。
この問題を解決するために、Deepuは次の手順を踏みます:
DeepuがTag Spotlightを開き、影響を受けるサービスを選択する
Deepu は検索を使って Tag Spotlight を検索し、ナビゲーションの結果を選択して Tag Spotlight に移動します。そして決済サービスを選択します。
Deepuは、バージョンタグによってエラー数が異なることに気が付く
Deepu は、[version] タグを除くすべてのタグ値でエラーが均等に分散していることに気づきます。すべてのエラーは、サービスの最近のコードリリースであるバージョン 350.10 で発生しています。Deepu は以前のリリースのバージョン 350.9 にロールバックして、エンジニアが問題を解決するのを待ちながら、サイトを実行し続けます。
Deepuがトレースの例を開く
Deepu は、/PaymentService/Charge エンドポイントのバージョン 350.10 のコードに調査を絞り込み、[Request/Errors] のチャートを選択してトレースの例を取得し、エラーの内容を確認します。
DeepuがSplunk Log Observerに切り替えて、さらなるトラブルシューティングを実行する
Deepu は Splunk APM で Related Content を有効にしているため、[Logs for trace] を選択して Splunk Log Observer に切り替え、さらなるトラブルシューティングを実行できます。
概要
Deepu は Tag Spotlight を使用して、顧客の Buttercup Games ウェブサイトでのショッピングを妨げているエラーの原因として、最近のコードリリースを迅速に分離しました。Tag Spotlight 内のトレース例へのリンクを使用して、トレース例とそれに対応するログにすばやく移動し、さらなるトラブルシューティングを実行します。
さらに詳しく
-
Tag Spotlight の詳細については、「Tag Spotlight を使用してサービスパフォーマンスを分析する」を参照してください。
-
Related Content の使用方法については、「Splunk Observability Cloud の関連コンテンツ」を参照してください。
-
Splunk Log Observer Connect を使用して問題の原因を検出する方法の詳細については、「Splunk Log Observer Connect の概要」を参照してください。