条件の作成および設定

アプリケーションのパフォーマンスメトリックを評価する条件または条件のセットを定義できます。

条件を評価するには、次のオプションを使用します。

  • 正常性ルールウィザードに埋め込まれている式ビルダーを使用して、相互依存の複数のメトリックからなる複雑な式に基づいた条件を作成できます。
  • 正常性ルール内の複数の条件を評価するためのカスタムブール式。ブール式では および 演算子を使用できます。

条件を作成する

条件を作成する
  1. [Critical Condition] または [Warning Condition] ウィンドウで、[+ Add Condition] をクリックして新しい条件コンポーネントを追加します。条件を定義する行が表示されます。
  2. 必要に応じて、条件を設定します。
  3. 必要に応じて、条件の追加を続行します。最大 8 つの条件を追加できます。条件は、A、B、C などと指定されます。
  4. 条件の上にあるドロップダウンリストから、以下を選択します。
    • All:ルール違反を構成するすべての条件が true に評価される場合。
    • Any:ルール違反を構成するいずれかの条件が true に評価される場合。正常性ルールは、指定されたすべての条件を 1 つずつ評価し、1 つ以上の条件が true と評価されると、アラートがトリガーされます。[Health Rule Violation Events Summary] には、違反しているすべての条件が表示されます。たとえば、4 つの条件 A、B、C、D を指定したとします。正常性ルールは 4 つの条件すべてを評価し、条件 A と C に違反すると、アラートがトリガーされます。[Health Rule Violation Events Summary] には、違反してアラートをトリガーした条件 A と条件 C が表示されます。
    • Custom:ルール違反を構成するブール式で定義された条件の組み合わせが true に評価される場合。カスタムブール式の作成方法については、「カスタムブール式の作成」を参照してください。
  5. 次の正常性ルールのタイプに基づく正常性ルールについては、以下を選択します。
    • ビジネストランザクション
    • ノードの正常性ハードウェア
    • ノードの正常性トランザクション パフォーマンス
    [Critical Criteria] および [Warning Criteria] パネルで評価範囲を指定する必要があります。
    注: アラート感度の調整を使用すると、ビジネストランザクション、サービスエンドポイント、またはリモートサービスの正常性ルール条件を設定できます。正常性ルールの評価基準は「すべてのノードの平均」に設定する必要があります。詳細については、「アラート感度の調整」を参照してください。
    ノードの割合を選択した場合は、パーセンテージを入力します。ノードの数を選択する場合は、絶対数を入力します。

サーバーレスティアの評価

AWS Lambda のティアを構成するサーバレスエンティティをモニタすると、次に示すように正常性ルールが評価されます。

正常性ルールのタイプ影響を受けるエンティティ条件評価基準評価
  • ビジネストランザクション
  • サービスエンドポイント
  • エラー率
サーバレスティアBT 平均メトリックはティアレベルで集約されます。
サーバレスノード
  • すべてのノード
  • ノードの割合(%)
  • ノードの数
サーバレスティアのメトリックはティアレベルで集約され、他のティアのメトリックは定義された基準に従って評価されます。
ティア/ノードの正常性(トランザクション パフォーマンス)サーバレスティア
  • ティア平均(ティア内のすべてのノードの平均)
  • すべてのノード
  • ノードの割合(%)
  • ノードの数
サーバーレスティアのメトリックは、定義されている評価基準に関係なく、ティアレベルで集約されます。
サーバレスノード
  • ティア平均(ティア内のすべてのノードの平均)
  • すべてのノード
  • ノードの割合(%)
  • ノードの数
サーバーレスティアのパフォーマンスは、[Tier/Node Health (Hardware)] 正常性ルールについては評価されません。サーバーレスプラットフォームのランタイムインスタンスがオンデマンドでアップ/ダウンするため、AWS はノードレベルのダッシュボードやメトリックを提供しません。
ティア/ノードの正常性(ハードウェア)
  • サーバレスティア
  • サーバレスノード
-サーバーレスティアのパフォーマンスは、[Tier/Node Health (Hardware)] 正常性ルールについては評価されません。サーバーレスプラットフォームのランタイムインスタンスがオンデマンドでアップ/ダウンするため、AWS はノードレベルのダッシュボードやメトリックを提供しません。

Configure a Condition

To configure a condition:
  1. In the first field of the condition row, enter a name for the condition.This name is used in the generated notification text and in the Splunk AppDynamics console to identify the violation.
    注: Ensure that you enter a unique name for each condition you define.
  2. From the drop-down list below the Add Condition button, define metrics to evaluate the condition, select:
    • Single metric to specify a single metric:
    1. From the Value drop-down list, select a qualifier for the metric from the following options:
      Qualifier TypeDescription
      MinimumThe minimum value reported across the configured evaluation time length. Not all metrics have this type.
      MaximumThe maximum value reported across the configured evaluation time length. Not all metrics have this type.
      注: For the metrics related to Event Storage- Overage Monitoring, the supported qualifier type is Maximum.
      ValueThe arithmetic average of all metric values reported across the configured evaluation time length. This value is based on the type of the metric.
      注: If you select the time rollup as SUM for custom metrics, the Value is the arithmetic sum of all metric values reported across the configured evaluation time length.
      SumThe sum of all the metric values reported across the configured evaluation time length.
      CountThe number of times the metric value has been measured across the configured evaluation time length.
      Group CountThe number of nodes contributing to a metric value, generally relevant for application or tier level metrics.
      CurrentThe value for the current minute.
    2. To specify a simple metric, click Select a Metric. Metric Selection window is displayed. The metric browser in the Metric Selection window displays metrics appropriate to the health rule type. Alternatively, you can define a relative metric path.
    3. Select a metric to monitor and click Select Metric.
      注: You can use Alert Sensitivity Tuning to fine-tune metric evaluation for a health rule (that monitors BT, service endpoint or remote service). You must select a single metric to evaluate the condition. See Create a Health Rule and Fine-tune Metric Evaluation for more information.
    • Metric Expression to build a metric expression.
  3. From the drop-down list after the metric, select the type of comparison to evaluate the metric.
    • To limit the effect of the health rule to conditions during which the metric is within a defined range- standard deviations or percentages- from the baseline, select Within Baseline from the menu. To limit the effect of the health rule to when the metric is not within that defined range, select Not Within Baseline. Then select the baseline to use, the numeric qualifier of the unit of evaluation and the unit of evaluation. For example:

      Within Baseline of the Default Baseline by 3 Baseline Standard Deviations
    • To compare the metric with a static literal value, select < Specific value, > Specific Value, = Specific Value, or!= Specific Value. And enter the specific value in the text field. For example:

      Value of Errors per Minute > 100
    • To compare the metric with a baseline, select < Baseline or > Baseline from the drop-down list, and then select the baseline to use, the numeric qualifier of the unit of evaluation and the unit of evaluation. You can use the Baseline Standard Deviation or Baseline Percentage as the unit of evaluation. For example:

      Maximum of Average Response Time is > Baseline of the Daily Trend by 3 Baseline Standard Deviations
      注: Baseline Percentages: The baseline percentage is the percentage above or below the established baseline at which the condition will trigger. For example, if you have a baseline value of 850 and you have defined a baseline percentage of > 1%, the condition is true if the value is > [850+(850x0.01)] or 859.  To prevent health rule violations from being triggered when the sample sets are too small, these rules are not evaluated if the load- the number of times the value has been measured- is less than 1000. For example, if a very brief time slice is specified, the rule may not violate even if the conditions are met, because the load is not large enough.
      The following baseline options are available:
      • Default baseline

      • Adaptive Weekly Trend- Last 3 months (Beta)

      • All data- Last 15 days

      • Daily Trend- Last 30 days

      • Monthly Trend- Last 1 year

      • Weekly Trend- Last 3 months

    See Dynamic Baselines for information about the baseline options.

  4. If you want to define a 'Persistence Threshold' for the condition to reduce false alerts:
    注: You can define a persistence threshold for a condition only if you have defined an evaluation time frame of 30 minutes or less.
    1. Select Trigger only when a violation occurs __ times in the last __ min(s).
    2. Define the number of times metric performance data should exceed the defined threshold to constitute a violation.
    3. If required, adjust the evaluation time frame by setting an alternate evaluation time frame.
      注: You can define a persistence threshold for a condition only if you have defined an evaluation time frame of 30 minutes or less.
  5. If you want to control the health rule status when metric data is unavailable for evaluation, use one of following options for Evaluation for "no data" scenarios:
    • Critical or Warning: The health rule considers this no data scenario as Critical or Warning condition and the health rule status is shown in Red or Yellow respectively.
    • Unknown: The health rule considers the no data scenario as unknown and the health status is shown in Grey.
    • Healthy: The health rule considers the no data scenario as healthy and the heath rule status is shown in Green.
  6. Click Save when done.

エージェント可用性メトリックの評価

正常性ルール条件を使用してエージェント可用性メトリックを評価した結果、誤検知が発生する可能性があります。例:

  • 通信エラーのため、エージェントが数分間、コントローラに接続していない可能性があります。
  • 待機時間の問題によってデータが数分間遅れる場合があります。
ネットワークの問題や、エージェントがコントローラと通信できない場合に発生する 1〜2 分のメトリック損失が通知されるように、正常性ルールを構成できます。正常性ルールを次のように構成します。
  1. 正常性ルールが影響を与えるノードを選択します。また、階層を設定することもできますが、ノードを設定することをお勧めします。
  2. [Node Health - Hardware, JVM, CLR] を正常性ルールの [Type] として選択します。
  3. 最後の5分間と10分の待機時間を使用します。
  4. 3 つの [< Specific Value] の合計になるように条件を設定します。

この構成では、過去 5 分間にエージェントが 2 分を超えてダウンした場合に違反が生成されます。

エージェント可用性メトリックの正常性ルール違反

可用性メトリックの目的は、エージェントによってモニターされているアプリケーションが使用可能かどうかを確認することです。

何らかの理由でエージェントがダウンした場合、コントローラは対応するアプリケーションのステータスを取得しません。

可用性メトリックに正常性ルールが作成されている場合、エージェントがダウンしているときに正常性ルールに違反し、アラートが生成されます。これは、ソースからデータを受信していないと見なされ、正常性ルールが評価されるためです。このような場合、正常性ルール違反は、アプリケーションがダウンしていることを示すものではありません。このようなアラートを無視し、正常性ルールを無効にすることができます。

オプションの Evaluate to True on No Data は、このような正常性ルールに影響を与えません。

Build an expression

To access the expression builder to create a complex expression as the basis of a condition, select the Metric Expression option from the drop-down list and click Add Expression. The Metric Expression window is displayed that allows you to construct a mathematical expression to use as a metric.

For example, the following expression is created to measure the percent of slow business transactions.

  1. In the Variable Declarationpane of the Mathematical Expression builder, click + Add variable to add a variable.
  2. In the Variable Name field enter a name for the variable.
  3. From the drop-down list, select the qualifier for the metric from the following options:

    Minimum

    The minimum value reported across the configured evaluation time length. This qualifier is not available for all the metrics.

    Maximum

    The maximum value reported across the configured evaluation time length. This qualifier is not available for all the metrics.

    Value

    The arithmetic average of all metric values reported across the configured evaluation time length. This value is based on the type of the metric.

    注: If you select the time rollup as SUM for custom metrics, the Value is the arithmetic sum of all metric values reported across the configured evaluation time length.

    Sum

    The sum of all the metric values reported across the configured evaluation time length.

    Count

    The number of times the metric value has been measured across the configured evaluation time length.

    Group CountThe number of nodes contributing to a metric value, generally relevant for application or tier level metrics.

    Current

    The value for the current minute.

  4. Click Select a metric to open an embedded metric browser.
    注:

    Health Rule Evaluation Condition: A health rule is not evaluated if any metric in the expression has a null value. This is to avoid erroneous evaluations as shown in the following examples:

    ExpressionNull ValueEvaluation
    a-b-ca Entire expression is evaluated negative.
    a/bb The number 'a' is divided by zero, evaluates to an error
    a*ba or b Entire expression is evaluated as zero.
  5. Repeat steps 1 through 4 for each metric that you use in the expression.You can remove a variable by clicking the delete icon.
  6. In the Expression pane, build the expression by clicking Insert Variable to insert variables created in the Variable Declaration pane along with appropriate mathematical signs.
  7. When the expression is built, click Save.

カスタムブール式の作成

正常性ルールに必要なすべての条件を定義したら、正常性ルールを評価するためのカスタムブール式を作成できます。

  1. 条件の上にあるドロップダウンリストから、[Custom] オプションを選択します。
  2. 演算子を使用して条件の組み合わせを入力します。たとえば、(A OR B) AND C と入力します。
    注: および 演算子を使用して条件の有効な組み合わせを入力してください。入力しないと、評価は失敗します。
  3. Save をクリックします。

カスタムブール式の変更

  1. [Condition Combination] フィールドで式を選択します。
  2. 必要に応じてブール式を編集します。
  3. Save をクリックします。

条件の削除

削除([X])アイコンをクリックして、条件コンポーネントを削除します。

注: 条件を削除する場合は、それに応じてブール式を更新します。