正常性ルール違反の検証

特定の正常性ルール違反の詳細を表示するには
  1. リストから正常性ルール違反の行を選択します。
  2. [Details] をクリックして正常性ルール違反の詳細を表示します。

ビジネストランザクション以外のエンティティに対する正常性ルール違反

[Health Rule Violation] ページには、違反の詳細情報が表示されます。

  • 違反状態

  • 違反ウィンドウ

  • 全違反期間

  • 違反のタイムライン

  • 違反イベント

  • 実行されたアクション

次の画像は、ノードの正常性ルール違反の詳細を表示しています。

[Affects] リンクをクリックすると、正常性ルールの影響を受けたエンティティのダッシュボードを表示できます。または、[View Dashboard During Health Rule Violation] ボタンをクリックすると、違反が発生した時間のダッシュボードを表示します。

注: 正常性ルール違反が発生した場合、影響を受けるエンティティのダッシュボードにアクセスするためのハイパーリンクは、エンティティタイプ Machine_Instance のサーバー正常性ルールには表示されません。[Health Rule] ウィンドウの [Affected Entities] タブに移動して、影響を受けるエンティティのリストを表示します。

UIの正常性インジケータから正常性ルール違反の詳細にアクセスすることも可能です。たとえば、ビジネストランザクションの正常性またはサーバーの正常性が重大な状態であることを示す赤色のインジケータがダッシュボードに表示されていたら、クリックしてビジネストランザクションまたはティアのリストを表示し、リストの正常性コラムのアイコンをクリックします。

[Health Rule Violation Window] フィールドは、正常性ルールの評価に使用される期間を指します。AppDynamics では、データ収集とそのデータが利用可能になるまでの時間遅延により数分前のデータが処理されることがあるため、この期間は実際の評価時間とわずかに異なる場合があります。

[Summary] タブには、正常性ルール違反の詳細が表示されます。正常性ルール条件で [Trigger only when violation occurs x times in last y minute(s)] オプションを選択すると、違反しているメトリック値の平均が表示されます。

たとえば、 [1分あたりのコール数(Calls Per Minute)] の値が 6 を超えた 場合にアラートがトリガー、過去 5 分間に 3 回この条件が発生する必要があるという条件を作成します。この場合、コントローラは最後の 5 分間の各分について Calls Per Minute の値をチェックします。最初の 1 分間の 1 分あたりのコール数の値が 7、2 分目の 1 分あたりのコール数の値が 9、3 分目の 1 分あたりのコール数の値が 8 、4 分目の 1 分あたりのコール数の値が不明で(メトリックは報告されませんでした)、5 分目の 1 分あたりのコール数 の値が 3 だとします。このシナリオでは、1 分あたりのコール数の値が 3 回 6 を超えており、条件を満たしています。したがって、アラートがトリガーされ、正常性ルール違反の概要で、違反しているメトリックの平均値が 8、つまり (7+9+8)/3 として表示されます。

ビジネストランザクションの正常性ルール違反

ビジネストランザクションに関連する正常性ルール違反については、問題と疑わしい根本原因について AI が生成したサマリーを表示できます。

[Summary | AI-generated] セクションでは、影響を受けるビジネストランザクションの詳細、違反の開始時刻と終了時刻、違反状態(Critical(重大)や Warning(注意)など)、逸脱しているメトリックに関する情報など、問題の簡潔な概要が提供されます。Splunk AppDynamics SaaS は、AI を活用して正常性ルール違反に関連するすべてのメトリックを分析して関連付け、有益なサマリーを生成します。この包括的なサマリーによって、問題の性質とコンテキストをすばやく理解できます。

警告: AI が生成した推奨事項を実行する前に、それらを検証して有効性を確認することが重要です。AI の出力には、不正確さ、不完全な情報、または意図しないバイアスが含まれている場合があります。ユーザー自身の判断に基づいて AI の提案を照合し、特定の要件とコンプライアンス基準を満たしていることを確認する必要があります。

この例では、特定の期間における 1 分あたりのエラー率が正常範囲よりも高いため、ビジネストランザクション /web-api/selectReward の正常性ルールに違反します。

正常性ルール違反の発生時にビジネストランザクションのダッシュボードを表示する場合は、[View Dashboard During Violation] をクリックします。

[Suspected Root Causes] タブには、正常性ルール違反の背後にある最も可能性の高い理由が表示されます。最大 3 つの疑わしい根本原因を表示でき、それぞれに根底にある問題を説明する AI が生成したサマリーが伴います。このセクションでは、特定された問題の解決に役立つ、AI が生成した推奨事項も提供します。[Sources] リストで、ビジネストランザクションのスナップショットをクリックして、各違反に関連する潜在的な問題を調べることができます。

次の例では、疑わしい根本原因が 1 つだけあります。これは、データベース関連の例外です。

ビジネストランザクションのスナップショット [bf553848-8a86-4f0d-9686-d8f0f91ee4cc] をクリックして、問題を調べます。フローマップを分析して、誤ったノードを特定できます。

[Violation Events] タブには、各イベントが発生した時期、シビラティレベル、現在のステータス、イベントの説明など、正常性ルール違反イベントに関する詳細情報が表示されます。各違反の開始時刻と、解決またはキャンセルされた時刻を表示することもできます。