疎なデータを考慮してディテクタに最小遅延を設定する
この Splunk のアラートおよびディテクタの例では、ディテクタに最小遅延を設定する方法を説明します。
Splunk Observability Cloudで、Buttercup Gamesのサイト信頼性エンジニアリング(SRE)チームは 「サービスエラー」 というディテクターを設定しています。このディテクターはButtercup Gamesのサービスを監視し、いずれかのサービスのエラー率が5%を超えたときにアラートを発します。
このアラートがあるにもかかわらず、Buttercup Gamesは、productcatalog サービスからのエラーに関する顧客からの苦情を受け取っています。
チームの SRE である Kai は、productcatalog を調査したところ、サービスのリクエストレートが低く、エラーのデータポイントがほとんど送信されない(1 日に 1 回しか送信されないこともある)ことに気づきました。このため、分析エンジンは疎なエラー追跡 MTS の遅延の増加を追跡できません。そのデータポイントはサービスエラーディテクタに含めるには遅延しすぎているため、ディテクタは productcatalog サービスでアラートを生成できません。
productcatalog からの遅延データポイントを考慮するため、Kai は /detector エンドポイントへの API コールを行うことにより、[Service error] の最小遅延値を設定します。最小遅延設定により、ディテクタは、計算を実行する前に設定された時間だけ待機します。
Kaiは、この疎なMTSからのラグをグラフ化し、通常は30秒未満であるが1分を超えたことはないと判断したため、「サービスエラー」 の「最小遅延」を1分に設定します。
概要
[Service error] に [Min Delay] しきい値を設定することで、Kai は疎なデータを含めることに成功し、顧客のエクスペリエンスに影響を与える前に productcatalog サービスからのエラーをキャッチできるようになりました。
さらに詳しく
ディテクタの [Min Delay] の詳細については、「最小遅延」を参照してください。
ディテクタ API の詳細については、「Detectors API reference」を参照してください。