リソースの枯渇

「リソースの枯渇」条件は、シグナルが枯渇する、または満杯になるまでに一定の時間があるときにアラートを発します。

リソースの枯渇では、シグナルが枯渇する(指定した最小値に達する)、または満杯になる(指定した容量に達する)までの残り時間が一定の時間に達した場合にアラートがトリガーされます。メモリの使用率が 80% になったときや、ディスクの空き容量が 10% 未満になったときにアラートをトリガーするといった、空の状態や容量を基準とする多くのタイプのシグナルには静的しきい値を使用するのが一般的です。ただし、リソースの枯渇条件は、シグナルの上昇傾向または下降傾向(安定して上昇または下降している)を考慮するため、このようなタイプのシグナルに関するアラートを受け取るためのより強力な方法となります。

メモリ使用率が 80% を超えたときにアラートをトリガーするディテクタを使用することで、アプリケーションが重大な影響を受ける前に問題を調査する時間を確保できます。実際に使用率 80% が問題になるのは、値が増加傾向にあり、100% に到達しようとしている場合に限られます。このシグナルのより優れた監視方法は、「リソース不足」のアラート条件を使用することです。この条件は、シグナルに上昇または下降傾向が見られた際にアラートを発生させます。

ここでは、シグナルが 15 分で 80% に達すると予測され(トリガーしきい値が 0.25 時間)、その状態が 3 分間(トリガー期間が 3m)続いた場合に通知を受信するものとします。この結果、エラー状態になる前にアラートがトリガーされるため、対応により多くの時間を確保できます。ただし、シグナルが 80% に急上昇し、その後急速に安全なレベルまで低下した場合は、アラートを誤送信することはありません。

基本的な設定

パラメータ

備考

Alert when nearing

EmptyCapacity

減少すると想定されるシグナルの場合は「Empty」、増加すると想定されるシグナルの場合は「Capacity」を選択します。

Minimum value/Capacity

>= 0の数値

[Minimum value] はシグナルが「空」の状態を表し(空に近付いたときにアラートをトリガーする場合)、デフォルト値は 0 です。[Capacity] はシグナルが「満杯」の状態を表し(その容量に近付いたときにアラートをトリガーする場合)、デフォルト値はありません。シグナルがパーセントの場合は、たとえば「100」と入力します。*

Trigger Sensitivity

LowMediumHighCustom

アラートのトリガー頻度の目安。[Low] を選択するとアラートのトリガー頻度は低くなり、アラートが解除されるまでの時間が長くなります(フラッピングが最小)。トリガーと解除の感度を決定する設定を変更するには、Custom を選択します(以下にリスト)。

* シグナルのプロット設定パネルでメトリック単位を指定する場合、[Capacity] に入力する値は指定した単位と一致させる必要があります。たとえば、バイトを指定した場合、100 ギガバイトを指定するには 100000000000(100 億)と指定する必要があります。詳細については、「Specify the metric unit」および「Set options in the plot configuration panel」を参照してください。

詳細な設定

パラメータ

備考

Trigger threshold

> 0の数値

リソースが指定した容量に達するまでの推定残り時間数。値が小さいほど感度が低下し、アラートが少なくなる可能性があります。

Trigger duration

パーセンテージ:1 ~ 100 の整数。時間の指標:>= 1 の整数の後に時間を表す指標(s、m、h、d、w)を付けます。例:30s、10m、2h、5d、1w

導出シグナル(残り時間)がトリガーしきい値を満たす必要がある回数と、予想されるデータポイントの数の比。パーセンテージを高くするほど、または期間を長くするほど、感度が低くなり、アラートが少なくなる可能性があります。このオプションの詳細については、「Using the Duration option」を参照してください。

Clear threshold

> 0の数値。トリガーの閾値より高く設定する必要があります。

リソースが指定した容量に達するまでの推定残り時間数。値が小さいほど、アラートの解除に必要な時間が長くなります。

例えば、「トリガーの閾値」が24で「解除の閾値」が36の場合、リソースが24時間以内に容量に達すると予測されたときにアラートがトリガーされ、容量に達するまでの予測時間が36時間まで増えると解除されます。

Clear duration

パーセンテージ:1 ~ 100 の整数。時間の指標:>= 1 の整数の後に時間を表す指標(s、m、h、d、w)を付けます。例:30s、10m、2h、5d、1w

導出シグナル(残り時間)が解除しきい値を満たす必要がある回数と、予想されるデータポイントの数の比。パーセンテージが高く期間が長いほど、アラートの解除に必要な時間が長くなり、実際にアラート状態が解除されたという信頼度が向上します。このオプションの詳細については、「Using the Duration option」を参照してください。

Use Double EWMA

YesNo

Yes では、二重指数移動平均を使用して予測します。No では線形外挿を使用します。一般的に、ネイティブ解像度よりもやや粗い解像度で表れる傾向を扱うには Yes を使用するのが適切です。

継続期間のオプションの使用

指定された時間枠に条件が満たされる頻度に基づいてアラートをトリガーまたは解除するには、[Trigger duration] オプションと [Clear Duration] オプションを使用します。このアラートでは、評価対象の条件は予測される残り時間に関係します。また、データが欠落している場合は予想値を推定します。このため、たとえば値が空に近づくとアラートがトリガーされるといった場合は、値が短時間減少した後にデータ欠落が長時間発生すると、アラートがトリガーされる可能性があります。

参考

パラメータ

備考

トリガーの継続期間と解除の継続期間

このパラメータは、ネイティブ解像度より大幅に大きく設定します。

トリガーの閾値とトリガーの継続期間

これらのパラメータは必然的に対になります。たとえば、「残り時間が 72 時間未満の状態が 4 時間のうちの 100%」、「48 時間未満が 2 時間のうちの 100%」、「24 時間未満が 1 時間のうちの 100%」(重大度レベルが徐々に上がる)になった場合にアラートをトリガーするといった 3 つのルールを持つトリガー戦略を検討します。

シグナル

シグナルがあまり変化しない場合、変化は検出されない可能性があります(トリガーの継続期間に必要な「パーセント」による)。

シグナル

アラート条件は変化率の変換に適用するため、これは他の分析(特にローリング最小値、平均値、最大値の変換)との相互作用が悪くなる可能性があります。

シグナル

変換されたシグナルは「残り時間」です。シグナルが指定された最小値を下回る([Empty] の場合)、または指定された容量を超える([Capacity] の場合)と、この数量は負の値になります。これは、ディテクタのチャートの「残り時間」に負の値が表示される可能性があることを意味します。