管理者クイックスタートガイド

Splunk On-Call の管理者としての開始について。

セットアップ

ユーザーを追加する

Splunk On-Call のセットアップで最も重要な最初のステップは、ユーザーの追加です。新しいユーザーを追加するには、主に次の 2 つの方法があります。

  1. ポータルのメールアドレスを利用する( [Users]、[Invite User] の順で選択します)。

  2. API を使用する(ID とキーが必要です。[Integrations]、[API] の順で選択します)。

チームの作成

チームは以下で構成されます:

  • ユーザーリスト

  • オンコールシフト

  • エスカレーションポリシー

チームを作成するには、上部のナビゲーションバーから [Teams] セクションに移動します。[Teams] ページから [Add Team] を選択し、名前を選択します。

チーム間で明確に区別するために、チーム名を標準化することをおすすめします。サービスや社内チーム名など、組織にとって分かりやすいチーム名を選んでください。

ユーザーの招待と管理者の決定

いくつかのチームを構築したら、次のステップは人を追加することです。招待されたユーザーを追加できます。次に、ユーザーロールに基づいてユーザーの階層を確立します(管理者、ユーザー、チーム管理者など)。

ローテーションを作成する

ローテーションとは、継続的なオンコールスケジュールで、オンコールシフトのグループです。シフトは複数の人で共有されます。
注: ローテーションがスケジュールされていても、自動的にオンコールになるわけではありません。ローテーションはエスカレーションポリシーと関連づける必要があります。

エスカレーションポリシーを作成する

エスカレーションポリシーは、どのインシデントを誰にルーティングし、どのようにエスカレーションするかを決定します。基本的に、エスカレーションポリシーは、トリガーされたイベントを Splunk On-Call がどのようにエスカレーションするかということです。

エスカレーションポリシーを設定する際のベストプラクティスは、勤務中のユーザー、ローテーションの前後のユーザー、マネージャーまたはチームリーダーの最低 3 つのエスカレーションパスを設定することです。

ルーティングキーを設定する

ルーティングキーは、モニタリングツールからのアラートを Splunk On-Call の特定のチーム(またはエスカレーションポリシー)に結び付けます。これにより、その問題に関して適切なユーザーにつながり、特定のインシデントと無関係なユーザーのアラートノイズを減らすことができます。ルーティングキーは、[Settings]、[Routing Keys] の順で選択して確認できます。

アラートを処理しているチームまたはポリシーの名前、アラートのサービスやホスト、アラートの送信元であるモニタリングツールの名前を使用します。ルーティングキーでは大文字と小文字は区別されませんが、アラートがデフォルトのルーティングチームに送信されないように、すべて小文字を使用することをおすすめします。

  • マッチングチーム名:CloudOps(チーム)=cloudops(ルーティングキー)

  • マッチング監視ツールSplunk (ツール) = splunk (ルーティングキー)

インテグレーション

最後に、カスタムインテグレーションを設定します。インテグレーションは、Splunk On-Call にアラートをフィードしてインシデントを作成し、ページアウトします。

アラートインテグレーションを設定する前に、チャットインテグレーションまたはアラート以外のインテグレーションを設定することをお勧めします。

ルールエンジン

ルールエンジンは、フルスタックのサービスレベルの機能です。特定の条件を設定し、その条件が満たされたときに、アラートに画像、リンク、メモの注釈を付けたり、アラートフィールドを上書きしたり、新しいフィールドを追加したりといったカスタムアクションをトリガーできるルールエンジンです。

チームアクティビティとパフォーマンスのレポート

継続的に改善するためには、管理者としてチームの活動とパフォーマンスを追跡し、報告できることが重要です。上部のナビゲーションメニューで [Reports] ページに移動します。

インシデント後のレビュー

インシデントの履歴インサイトを把握し、問題解決方法を文書化します。

  • パフォーマンス(MTTA、MTTR)レポート:Splunk On-Call への投資と DevOps の実践について説明します。

  • オンコールレポート:チームまたはユーザーごとのオンコールに費やされた時間とインシデントの数を確認できます。

  • インシデント頻度レポート:インシデントの流れを事後的に分析することで、システムで問題を引き起こしているインシデントを解決するための上流工程に進むことができます。

ライセンス番号の調整

Splunk On-Call ライセンス数の大幅な増減が必要な場合は、地域営業マネージャーまたはカスタマーサクセスマネージャーにご相談ください。担当者が不明の場合は、victorops-sales@splunk.com までお問い合わせください。