アラート管理者として開始する

Splunk On-Call のアラート管理者ロールについて。

Splunk On-Call を初めて使用する場合は、「ユーザーとして開始する」というトピックを確認してください。ユーザーの権限について理解したら、アラート管理者ロールについて学習します。アラート管理者ロールでは、人やスケジュールの管理に必要な権限と、技術的な動作やリスクの高い動作の管理に必要な権限の 2 つの役割に分けて提供します。Splunk On-Call のユーザー権限の全リストには、以下が含まれます。

  • グローバル管理者:すべてのアクセス許可を保持します

  • チーム管理者:人員とスケジュールを管理します

  • アラート管理者:アラートの作成と最適化の技術的側面を管理します

  • ユーザー:アラート対応

アラート管理者は、アラート設定、インテグレーション、そのワークフローを管理する責任があります。権限は組織全体に及びます。インテグレーションの適切な管理と維持は、アラートワークフローに不可欠です。

アラート管理者には、以下のアクションを実行する権限があります:

  • インテグレーション設定

  • ルーティングキーとルールの管理

  • Webhookの作成と管理

  • メンテナンスモード

成功するアラート管理者になるための推奨事項

  • ルーティングキーを作成します:ルーティングキーは、適切なオンコールユーザーを呼び出すために、アラートを適切なエスカレーションポリシーに誘導する役割を担います。これらは、各アラートの「郵便」と考えてください。エスカレーションポリシーとルーティングキー名が同期されていて、簡単に識別できるように、チーム管理者に連絡してルーティングキーの命名規則をサポートしてもらいます。

  • インテグレーションを有効化して設定します:[Splunk On-Call インテグレーション] ページで必要なインテグレーションを検索します。インテグレーションのリストが表示されない場合は、ツールの機能に基づいて、汎用 REST エンドポイントまたはメールインテグレーションをいつでも使用できます。インテグレーションガイドを使用してインテグレーションを構成します。アラート疲れと混乱を避けるために、クリティカルで実行可能なアラートのみを Splunk On-Call に送信していることを確認します。

  • アラートが対応するチームに送信されることを確認します:インテグレーションを構成した後、テストアラートを送信して、インシデントがルーティングされ、適切に動作していることを確認します。

  • ルールエンジンのルールを作成する:特定のマッチング条件に基づいて、フィールドの変更、注釈の追加、アラートのリダイレクトを行うことができます。ルールエンジンには、フィールドの一部を解析したり、時間ベースのルールを作成したりする正規表現機能もあります。

  • カスタム発信 Webhook を設定します:Webhook を使用すると、トリガーされたインシデントやチャットなど、Splunk On-Call 内で実行されたアクションに基づいて Splunk On-Call の外部に情報を渡すことができます。ルールエンジンと組み合わせることで、条件付きで起動するように設定できます。

  • メンテナンスモード:インテグレーションのいずれかに対してメンテナンスを実行する必要がある場合は、特定のルーティングキーまたはすべてのルーティングキーに対してメンテナンスモードをオンにすることができます。メンテナンスモードでは、一定期間ページングがミュートされ、終了するとページングが再開されます。

注: メンテナンスモードでは、アラートがSplunk On-Callに送信されるのを停止することはなく、オンコールユーザーが着信したときにページングするだけです。