Splunk APMの内蔵アラートのメトリクスと条件を使用する

Splunk APMの内蔵アラート条件について学習します。

Splunk APM メトリックの組み込みのアラート条件を使用して、一般的な問題のシナリオのアラートをトリガーするアラートルールを作成します。これらのアラート条件を使用することで、シグナルを静的しきい値と比較する標準的な方法ではなく、シグナルの監視を調整できます。APM ディテクタを設定する手順については、「Splunk APM でディテクタとアラートを設定する」を参照してください。

注: このトピックでは、Splunk APM のディテクタを作成する際に使用できる、遅延、リクエスト率、エラー率に関する組み込みのアラート条件について説明します。インフラストラクチャあるいはカスタムメトリックのディテクタのアラート条件については、「Built-in alert conditions」を参照してください。Splunk Observability Cloud のアラートとディテクタに関する一般的な情報については、「Splunk Observability Cloud のアラートとディテクタの概要」を参照してください。

以下は Splunk APM のディテクタで利用可能な組み込みのアラート条件です。APM ディテクタを設定する手順については、「Splunk APM でディテクタとアラートを設定する」を参照してください。

条件

説明

利用可能なメトリクス

静的閾値

リクエスト率が、最小リクエスト数に対して指定したパーセンテージを超えた場合にアラートを発します。

  • サービス、エンドポイント、またはビジネストランザクションのリクエスト率

  • サービス、エンドポイント、またはビジネストランザクションのエラー率

  • サービス、エンドポイント、またはビジネストランザクションの遅延

過去10分間のリクエスト率、エラー率、またはレイテンシが、少なくとも50回のリクエストにわたって10%を超えている。

急激な変化

リクエスト率が急激に上昇した場合にアラートを発します。

  • サービス、エンドポイント、またはビジネストランザクションのリクエスト率

  • サービス、エンドポイント、またはビジネストランザクションのエラー率

  • サービス、エンドポイント、またはビジネストランザクションの遅延

直近5分間のリクエスト率、エラー率、またはレイテンシが、少なくとも100回のリクエストにわたって直前1時間のリクエスト率、エラー率、またはレイテンシよりも5%以上大きい。

履歴的異常

リクエスト率が過去の同じ期間と比較して異常に急増した場合にアラートを出します(周期的データまたは季節的データの場合)。異常は、過去の標準値からの偏差の数、または過去の標準値と比較した変化率のいずれかにあたります。

  • サービス、エンドポイント、またはビジネストランザクションのリクエスト率

  • サービス、エンドポイント、またはビジネストランザクションの遅延

過去 10 分間のリクエスト率または遅延が、1 週間の周期で、過去の標準値を 5 上回っている。過去 10 分間のリクエスト率または遅延の 90% が、1 週間の周期で、過去の標準値を 30% 上回っている。