特定のトレースを検索してエッジケースをトラブルシュートする
この Splunk APM の例では、トラブルシューティングのために APM のトレースビューで特定のトレースをフィルタリングする方法を説明します。
Buttercup Gamesのサイト信頼性エンジニアであるKaiは、Buttercup Gamesのウェブサイトでクーポンを利用する際に「無効なリクエスト」のエラーが発生したというある顧客からのチケットを受け取りました。
この問題をトラブルシューティングするために、Kaiは次の手順を踏みます:
KaiがAPMの概要ダッシュボードでサービスを確認する
KaiはSplunk APMの概要ダッシュボードを見て、すべてのサービスのエラー率が最小であることを確認します。
Kaiがトレースビューに移動して、顧客のエラーが発生したトレースを見つける
Kai は [Traces] を選択し、トレースビューに入ります。このビューは、チケットに対応する特定のトレースを見つけるための完全忠実トレース機能を備えています。
[Tags] ドロップダウンで customer.id インデックスタグを選択し、チケットに顧客 ID を入力します。Kai はタグを使用して、エラーが発生した正確なトレースを見つけました。
Kaiがウォーターフォールビューでトレースとスパンのパフォーマンスを確認する
Kai は [Trace ID] を選択して、[Waterfall] ビューでトレースのサービス、タグ、プロセスを調べます。[Span Performance] もチェックして、トレース内のすべてのスパンのパフォーマンスを把握します。
Kaiがデータリンクを使って関連するダッシュボードに移動する
タグに基づいて Splunk Observability Cloud の他のツールにリダイレクトされるようにグローバルデータリンクを設定します。[Waterfall] ビューに戻り、データリンクを含むタグを選択して関連するダッシュボードに移動し、お客様の問題をさらにトラブルシューティングして解決します。
概要
Kaiはトレースビューを使って、顧客から報告されたエッジケースの問題をトラブルシューティングするために、特定のトレースに素早く移動することができました。
さらに詳しく
グローバルデータリンクの作成の詳細については、「Use Data Links to connect APM properties to relevant resources」を参照してください。