CPU の問題を調査するためにアクティブなアラートを確認する

この Splunk のアラートおよびディテクタの例では、アクティブなアラートを見つける方法を説明します。

Buttercup Games のサイト信頼性エンジニアである Kai は、Buttercup Games のホストマシンの CPU 使用率の急激な変化を監視する「CPU ディテクタ」というディテクタを作成しました。Kai はこのディテクタから多くのアラートを受け取っており、これらのアラートのより詳細なビューを取得したいと考えています。

Splunk Observability Cloudの Detectors & SLOs ページを使用して、Kaiはこれらのアクティブなアラートを見つけて表示することができ、CPUの変化に対するトラブルシューティングを簡単に行うことができます。

検索リストを使用してアクティブなアラートを見つける

[Detectors & SLOs] ページから、Kai は検索リストを使ってアクティブなアラートを見つけることができます。以下の手順を実行します。

  1. アクティブなアラートを見つる必要があるため、Active Alerts タブを選択します。

  2. フィルタを入力して、アクティブなアラートをより見つけやすくします。以下のフィールドに希望する値を入力します。

フィールド

説明

Group By

host.name

同じホストマシン名からのアクティブなアラートを1つのカテゴリにグループ化します。

Team

Buttercup Games

Buttercup Gamesチームによって作成されたディテクターからのアクティブなアラートのみを表示します。

フィルターを適用した後、Kaiは彼らのディテクターによってトリガーされたアクティブなアラートのリストを見つけます:

このスクリーンショットは、アクティブなアラートのリストを示しています。

アクティブなアラートの詳細を表示する

検索リストでアクティブなアラートを見つけたので、Kaiはこのディテクターのアクティブなアラートを確認します。

アラート名を選択することにより、ディテクターに関連付けられている各アクティブアラートの詳細レポートを表示できるようになります。

このスクリーンショットはアラートの1つの詳細ビューを示しており、CPU値の急上昇が表示されています。

これらのアラートをいくつか見て、Kaiはホストマシンの1台がCPU使用率の急上昇を起こしたと判断しました。

概要

Kai は、ディテクタによってトリガーされたアクティブなアラートのリストを表示しました。これらのアクティブなアラートの詳細なレポートを見つけて表示することで、ホストマシンの 1 台で CPU 使用率が突然増加していることを発見し、問題のトラブルシューティングをより簡単に行えるようになりました。

さらに詳しく

アラートの表示方法の詳細については、「View alerts in Splunk Observability Cloud」を参照してください。

ディテクタの表示方法の詳細については、「ディテクタの表示」を参照してください。