サービスがビジネストランザクションにどのような影響を与えているかを追跡する

この Splunk APM の例では、APM のサービスマップと分析機能を使用して、サービスがビジネストランザクションにどのような影響を与えているかを調査する方法を説明します。

Buttercup Games のサイト信頼性エンジニアである Kai は、アプリケーションのマイクロサービスが Buttercup Games のビジネス KPI にどのような影響を与えているかを知りたいと考えています。

マイクロサービスがビジネスKPIにどのような影響を与えているかを追跡するために、Kaiは以下の手順を踏みます:

  1. KaiがAPMの概要を確認する

  2. Kaiがサービスマップを開き、根本原因エラーを持つサービスを見つける

  3. Kai がビジネストランザクションごとにサービスを分割して、ビジネストランザクションごとにエラーの詳細を表示する

KaiがAPMの概要を確認する

Kai は [APM Overview] を開きます。ここには、エラー率または遅延にすべてのサービスおよびビジネストランザクションのチャートが生成され、上位のサービスおよびビジネストランザクションがハイライトされます。Kai は、Buttercup games のビジネス KPI を追跡する 2 つのビジネストランザクションで、異常なエラー率が発生していることを発見しました。

このスクリーンショットは APM [Overview] ページを示すもので、すべてのビジネストランザクションの遅延とリクエスト数/エラー数のチャートが表示されています。

Kaiがサービスマップを開き、根本原因エラーを持つサービスを見つける

Kai は [Service Map] カードを選択してサービスマップを開きます。Kai は、根本原因エラーのあるサービスを示す赤い点が付いたノードを選択します。この場合、[paymentservice] および [checkoutservice] ノードは根本原因エラーを示しています。

Kai がビジネストランザクションごとにサービスを分割して、ビジネストランザクションごとにエラーの詳細を表示する

Kai は、[Breakdown] メニューを使用して各サービスを [Transaction] ごとに分類し、各ビジネストランザクションノードを選択して、エラーと遅延の詳細を示すチャートを表示します。Kai は、[paymentservice] が [PaymentService/Charge] および [frontend/chart/checkout] ビジネストランザクションのエラーの原因となり、[checkoutservice] はどのビジネストランザクションにも影響を与えないことを発見しました。Kai は、全体的なビジネス KPI に影響を与えるエラーを解決するために、この情報を決済サービスのオーナーに送信します。

このスクリーンショットは、ビジネストランザクションノードのリクエスト、エラー、根本原因のチャートと数値データを示しています。

概要

Kai はビジネストランザクションを使用して、Buttercup Games のビジネス KPI に影響を与えるサービスを監視し、分離しました。

さらに詳しく

ビジネストランザクションの情報については、「トレースを関連付けてビジネストランザクションを追跡する」を参照してください。