異常の詳しい調査
- [Alert & RespondAnomaly Detection] で、[Anomalies] タブを表示します
- 異常をダブルクリックして詳細ビューを開きます。
最初は、異常の開始時間中に発生しているすべての情報がページに表示されます。異常のライフサイクルで起きた変化を後で確認するには、タイムラインに沿ってイベントをクリックします。
異常の説明確認
異常の説明では、エンティティ(ビジネストランザクション、データベース、ベースページの体験、またはネットワークリクエスト)に関連する異常が説明されます。選択した異常の状態遷移イベントのシビラティ(重大度)レベルと、エンティティに関連する上位逸脱メトリックが示されます。
この例では、次のことを分析します。
- ビジネストランザクション:
/web-api/getDepositSummary - シビラティ(重大度):Critical
- 上位の偏差メトリック:平均応答時間
逸脱メトリックは、チェックアウトの応答が遅いことが問題であることを示す Average Response Time です。
タイムラインの確認
タイムラインでは、異常が最初に検出されてから解決されるまでのさまざまな段階が視覚的に表されます。異常を検出するためにデータがアクティブに分析されている期間は、評価ウィンドウを示すグレーで強調表示されます。評価期間は、異常を検出するためにデータが分析される期間です。このタイムラインを使用すると、異常が始まった正確な時点を特定できます。タイムライン上の特定のマーカーにより、異常の状態が移行する各タイミング(警告から重大への移行など)が示され、ユーザーは問題の進行状況を詳細に追跡できます。
たとえば、このタイムラインは「重大」状態から始まり、その 35 分後に「警告」状態に移行し、10 分間だけこの状態が続きます。
対照的に、より複雑なタイムラインで表示されるパターンは、異常を理解するのに役立ちます。たとえば、別の異常に関するこのタイムラインは、短時間の「警告」状態から長い「重大」状態に繰り返し切り替わっています。
このような場合は、いくつかの状態変更イベントを調査して、アプリケーションの問題について、状態間の遷移によってどのような手掛かりが提供されるかを確認する必要があります。
フローマップの調査
フローマップの例には、次が含まれます。
- [START] ラベルにより、ビジネストランザクションが
web-api階層から始まることが示されます。 web-api階層とその多数の依存関係の間には、疑わしい原因が検出された赤色の階層があります。
これで、異常の根本原因が含まれている赤色の階層に重点を置くことができます。
最も疑わしい原因の調査
[Suspected root causes] タブには、ビジネストランザクションおよびデータベースに関連付けられたパフォーマンス上の問題の考えられる根本原因が表示されます。異常の原因を特定するため、コールパスにおいて以下のエンティティまで遡って確認できます。
-
支払いサービス、注文サービスなどのサービス
-
データベースバックエンド、HTTP バックエンドなどのバックエンド
-
クロスアプリケーション
-
インフラストラクチャ マシン エンティティ サーバー
この例では、ビジネストランザクション /web-api/getDepositSummary がエラーを発している理由を知りたいとします。[Summary| AI-generated] には、影響を受けるビジネストランザクション、異常の開始時刻と終了時刻、異常の状態(重大、警告など)、逸脱しているメトリックの詳細など、問題の簡単な説明が表示されます。AppDynamics SaaS では、人工知能により、異常に関連するすべてのメトリックが相互に関連付けられ、サマリーが生成されます。この包括的なサマリーを活用すれば、問題をより深く理解できます。
[View suspected cause]