急激な変化
「急激な変化」条件は、直近の時間窓で受信した値が、その前の時間窓で受信した値と比較して異常である場合にアラートを発します。
急激な変化では、直近の(短い)時間枠(現在の時間枠と呼ばれる)で受信した値が、その前の(一般的に長い)時間枠(過去の時間枠)で受信した値と比較して異常である場合にアラートがトリガーされます。この条件を使用すると、比較のための静的なベースラインがない場合に、メトリックの急激な変化を検出できます。
例
-
コードプッシュの結果、アプリケーションの応答時間が増加するという場合、応答時間を測定するシグナルにこの条件を使用すると、アラートがトリガーされます。
-
あるサーバーのログイン数が突然大幅に減少した場合、そのサーバーに問題がある可能性があります。
基本的な設定
|
パラメータ |
値 |
備考 |
|---|---|---|
|
Alert when |
|
アラートは、シグナルがしきい値を超えたとき、しきい値を下回ったとき、または指定した範囲外にあるときにトリガーされます(例:直前の時間枠の平均値を 3.5 標準偏差を超えて上回る、または下回る場合、または直前の時間枠の 95 パーセンタイルより高い場合など)。[Custom sensitivity] を選択してから [Normal based on] パラメータを選択し、異常の基準を平均値からの標準偏差とするか、パーセンタイル値とするか、または平均値に変化率を加えたものとするかを指定します。 |
|
Trigger Sensitivity |
|
アラートのトリガー頻度の目安。[Low] を選択するとアラートのトリガー頻度は低下しり、アラートが解除されるまでの時間が長くなります(フラッピングが最小)。トリガーと解除の感度を決定する設定を変更するには、 |
詳細な設定
|
パラメータ |
値 |
備考 |
|---|---|---|
|
Normal based on |
|
履歴ウィンドウとの比較における異常の定義方法。 アプリケーションの応答時間や遅延など、小さくとも一貫した増減を示す可能性の高いシグナルには |
|
Current window |
>= 1 の整数の後に時間を表す指標(s、m、h、d、w)を付けます。例:30s、10m、2h、5d、1w |
監視対象の時間範囲。たとえば、値が 10m の場合、直近 10 分間に発生した異常を探すことを示します。 |
|
Historical window |
>= 1 の整数の後に時間を表す指標(s、m、h、d、w)を付けます。例:30s、10m、2h、5d、1w 現在の時間枠よりも大きな値にする必要があります。 |
最近の傾向を定義するために使用する時間範囲。たとえば、値が 8h の場合、現在の時間枠で受信した値と、前の 8 時間に受信した値を比較することを示します。 |
|
[Trigger threshold] および [Clear threshold]([Normal based on] が |
>= 0の数値。解除の閾値はトリガーの閾値より低くする必要があります |
アラートをトリガーまたは解除するために必要になる、過去の平均値との差を標準偏差の倍数で表した値。トリガーの値が大きいほど感度が低下し、アラートが少なくなる可能性があります。解除の値が大きいほど、アラートの解除が早くなります。 |
|
[Trigger threshold] および [Clear threshold]([Normal based on] が |
0 ~ 100 の数値(両端を含む)。これらの値の相互関係の詳細については、次の「Specifying trigger and clear thresholds」を参照してください。 |
アラートをトリガーまたは解除するしきい値として使用する過去の時間枠のパーセンタイル。トリガーの値が大きいほど感度が低下し、アラートが少なくなる可能性があります。解除の値が大きいほど、アラートの解除が早くなります。 |
|
[Trigger threshold] および [Clear threshold]([Normal based on] が |
0~100の数値(0と100を含む)。解除の閾値はトリガーの閾値より低くする必要があります。 |
アラートのトリガーまたは解除に必要な変化のパーセンテージ。 たとえば、トリガーの値が 30 の場合、比較対象の値との差が 30% 以上になるとアラートがトリガーされます。値が大きいほど感度が低下し、アラートが少なくなる可能性があります。 解除の値が 20 の場合、比較対象の値との差が 20% 以下になるとアラートが解除されます。値が大きいほど、アラートの解除に必要な時間が長くなります。 |
|
[Ignore historical extremes]([Normal based on] が |
|
一般的に、シグナルの測定基準となる「正常な」動作の定義が異常値による影響を受けることを防ぐためには、 |
|
[Use EWMA]([Normal based on] が |
|
|
トリガーの閾値と解除の閾値の指定
前述のように、[Normal based on] が Mean plus standard deviation または Mean plus percentage change の場合、解除しきい値の値はトリガーしきい値の値よりも小さくする必要があります。ただし、[Normal based on] が Percentile の場合、2 つの値の間の関係は多少複雑になります。
後者の場合は、以下の条件が存在する必要があります:
|TriggerThreshold - 50| >= |ClearThreshold - 50|
この条件が満たされない場合、ディテクタは期待通りに動作しません。
ただし、比較のタイプに合わせてしきい値を変化させる必要はないことに注意してください。つまり、トリガーのしきい値として「99」を指定した場合、[Alert when] が Too low であれば、自動的に 1 に変換されます。
参考
|
パラメータ |
備考 |
|---|---|
|
アラートのタイミング |
設定 |
|
現在のウィンドウ、履歴ウィンドウ、ネイティブ解像度 |
Current window と Historical window は、共にネイティブ解像度より大幅に大きく設定します。 |
|
現在のウィンドウ |
アラート条件ではローリング最小値および最大値の変換が適用されますが(現在の時間枠で)、これはシグナルに関する他の分析に悪影響を与えることがあります。現在の時間枠または過去の時間枠のデータポイントが欠落していても、アラート条件は影響を受けません。つまり、受信したすべての値がしきい値を超えるか下回る必要があります。データポイントが欠落していても、アラートのトリガーが妨げられることはありません。同様に、しきい値の計算では欠落したデータポイントは無視されます。 |
|
トリガーの閾値と解除の閾値 |
これらによって動的しきい値が生成され、多少の混乱が生じることがあります。たとえば、あるアラートは、シグナル値が 31.4(偏差やパーセンタイルではなく、元のメトリックの単位)でトリガーされ、55.1 のときに解除される可能性があります(アラートがトリガーされてから発生した値の上昇によって動的しきい値が影響を受けたため)。解除イベントは、アラートがトリガーされたときに有効であったしきい値をシグナルが下回ったことを意味するものではありません。 |