特定のトレースを検索してエッジケースをトラブルシュートする

この Splunk APM の例では、トラブルシューティングのために APM のトレースビューで特定のトレースをフィルタリングする方法を説明します。

Buttercup Gamesのサイト信頼性エンジニアであるKaiは、Buttercup Gamesのウェブサイトでクーポンを利用する際に「無効なリクエスト」のエラーが発生したというある顧客からのチケットを受け取りました。

この問題をトラブルシューティングするために、Kaiは次の手順を踏みます:

  1. KaiがAPMの概要ダッシュボードでサービスを確認する

  2. Kaiがトレースビューに移動して、顧客のエラーが発生したトレースを見つける

  3. Kaiがウォーターフォールビューでトレースとスパンのパフォーマンスを確認する

  4. Kaiがデータリンクを使って関連するダッシュボードに移動する

KaiがAPMの概要ダッシュボードでサービスを確認する

KaiはSplunk APMの概要ダッシュボードを見て、すべてのサービスのエラー率が最小であることを確認します。

Kaiがトレースビューに移動して、顧客のエラーが発生したトレースを見つける

Kai は [Traces] を選択し、トレースビューに入ります。このビューは、チケットに対応する特定のトレースを見つけるための完全忠実トレース機能を備えています。

[Tags] ドロップダウンで customer.id インデックスタグを選択し、チケットに顧客 ID を入力します。Kai はタグを使用して、エラーが発生した正確なトレースを見つけました。

Kaiがウォーターフォールビューでトレースとスパンのパフォーマンスを確認する

Kai は [Trace ID] を選択して、[Waterfall] ビューでトレースのサービス、タグ、プロセスを調べます。[Span Performance] もチェックして、トレース内のすべてのスパンのパフォーマンスを把握します。

概要

Kaiはトレースビューを使って、顧客から報告されたエッジケースの問題をトラブルシューティングするために、特定のトレースに素早く移動することができました。

さらに詳しく

グローバルデータリンクの作成の詳細については、「Use Data Links to connect APM properties to relevant resources」を参照してください。