スタートアップガイド フェーズ 3:使用の拡大
「スタートアップガイド フェーズ 2:データ収集の設定」を完了すると、「フェーズ 3:使用の拡大」を受講する準備が整います。このフェーズでは、自動化、データ管理、ディテクタ、ダッシュボードを使用して、反復可能なオブザーバビリティのプラクティスを確立します。次のセクションでは、使用の拡大フェーズの主なセットアップ手順について説明します。
Splunk Observability Cloud の使用を開始するプロセスに関する概要を把握するには、「Get started guide for Splunk Observability Cloud admins」を参照してください。
ユーザーチーム全体での利用を増やし、自動化、データ管理、ディテクター、ダッシュボードを使用して反復可能なオブザーバビリティ実践を確立するには、以下のタスクを完了します:
Splunk Observability Cloudをデプロイメントのパイプラインに追加する
フェーズ 2 でのデータ収集の設定後、設定を制限して Collector インスタンスをデプロイしました。使用を拡大するには、より多くのコンポーネントとサービスで Collector パイプラインを拡大します。
-
Splunk Distribution of the OpenTelemetry Collector のインストール、設定、および使用に関する、使用可能なオプションの概要については、「Get started: Understand and use the Collector」を参照してください。
-
Collector パイプラインでのデータの処理方法については、「Process your data with pipelines」を参照してください。
-
Collector の設定に追加できるコンポーネントについては、「Collector components」のドキュメントを参照してください。
他にも、以下のような取り込み方法を使用することができます:
-
Splunk Observability Cloud REST API を使用してデータを送信するには、「Send metrics, traces, and events using Splunk Observability Cloud REST APIs」を参照してください。
-
クライアントライブラリを使用したメトリクス送信については、「SignalFlow client libraries 」を参照してください。
-
アップストリーム Collector の使用については、「OpenTelemetry Collector Contribプロジェクトを使用してテレメトリを送信する」を参照してください。
トークンのローテーションプロセスを自動化する
トークンは 1 年後に期限切れになるため、API コールを使用してトークンのローテーションを自動化する必要があります。特定のトークンについては、API が新しいトークンを作成すると、猶予期間で指定した期間が終了するまで、古いトークンは機能し続けます。古いトークンを使用している場合は、API 呼び出しを使用して、猶予期間内にトークンのローテーションを自動化します。
たとえば、API を使用して、Kubernetes クラスターがメトリクスとトレースデータを取り込むために使用するトークンをローテーションできます。API を使用して新しいトークンを生成する場合は、自動化の一部として、新しいトークンを Kubernetes クラスターのシークレットに直接保存できます。
詳細は、以下のトピックを参照してください:
メトリクスパイプライン管理ツールを使用して、メトリック時系列(MTS)のカーディナリティを削減する
Splunk Infrastructure Monitoring でメトリクスデータの使用量とカーディナリティが増加すると、コストが増加します。Splunk Infrastructure Monitoring 内でメトリクスパイプライン管理(MPM)ツールを使用してストレージと処理を合理化すると、全体的な監視コストを削減できます。MPM を使用すると、次の最適化を行うことができます。
-
ストレージと処理を合理化し、多層のメトリクス分析プラットフォームを作成する。
-
レポートを分析し、使用量を最適化すべき場所を特定する。
-
ルールベースのメトリクス集計とディメンションのフィルタリングを使用して、MTSの量を削減する。
-
不要なディメンションを除外する。
ディメンションは、ユーザーインターフェイス、API、Terraformで設定できます。
MPM に関する包括的なドキュメントについては、「Introduction to metrics pipeline management」を参照してください。
メトリクス名と取り込まれたデータを確認する
拡張デプロイメントを成功させるために、Splunk Observability Cloud のトークンとカスタム指標の命名規則を考慮してください。メトリクスに一貫した階層的な命名規則を使用すると、幅広いホストとノードで、メトリクスの検索、使用状況の特定、グラフとアラートの作成が容易になります。
-
組織の命名規則の作成に関するガイダンスについては、「Naming conventions for metrics and dimensions」を参照してください。
-
メトリクスデータを取り込んだ後、各チームが取り込んでいる名前とメトリクス量を確認します。取り込んだデータが、ディメンションとプロパティの命名規則と一致していることを確認してください。
カスタムダッシュボードとディテクターの構築
ダッシュボードは、メトリクスを可視化するグラフをグループ化したものです。ダッシュボードを使用して、システムに関する実用的なインサイトをチームが一目で把握できるようにします。ディテクタを使用して、指定した特定の条件に対してストリーミングデータを監視し、特定の基準が満たされたときにユーザーに通知するようにします。
カスタムダッシュボードの構築
-
Splunk Observability Cloud は、データポイントを 50,000 個取り込むと、使用する各インテグレーションに対して組み込みダッシュボードを自動的に追加します。これらの組み込みダッシュボードが使用可能になったら、確認してください。 「View dashboards in Splunk Observability Cloud」および「Dashboards available」を参照してください。
ダッシュボードの作成とカスタマイズについて説明します。チームが以下のタスクを完了できることを確認してください。
-
ダッシュボードの複製、共有、ミラーリング
-
ダッシュボードフィルターとダッシュボード変数の使用
-
ダッシュボードへのテキストメモおよびイベントフィードの追加
-
データリンクを使用した、ダッシュボードから別のダッシュボードや外部システム(Splunk APM、Splunkプラットフォーム、カスタムURL等 )への動的リンク
これらのタスクに関する包括的なドキュメントについては、「Dashboards in Splunk Observability Cloud」を参照してください。
-
カスタムディテクターの構築
-
Splunk Observability Cloud は、使用しているインテグレーションに対応する AutoDetect ディテクタを自動的に追加します。AutoDetect ディテクタは、コピーおよびカスタマイズすることができます。「Use and customize AutoDetect alerts and detectors」を参照してください。
-
カスタムディテクタを作成し、ユースケースに対処するアラートをトリガーします。「Introduction to alerts and detectors in Splunk Observability Cloud」を参照してください。
高度なディテクターを作成して、追加的な発動、アラートの解除条件、または、population_comparison関数を使用した2つの関数の比較といった、さまざまな種類の関数を考慮に入れてアラート条件の基本リストを強化します。
-
GitHub の「library of SignalFlow for detectors 」を参照してください。
-
SignalFlow の使用を開始するには、開発者ガイドの「Analyze data using SignalFlow 」を参照してください。
-
すべてのユーザーとチームをオンボードする
このフェーズの最後の手順は、すべてのユーザーとチームをオンボードし、Splunk Observability Cloud の各種の側面を表示および変更できるユーザーを設定することです。
-
ユーザー、チーム、およびロールの管理を開始するには、「Manage users and teams」を参照してください。
-
まだ行っていない場合は、セキュリティの強化をアクティブにして、チームマネージャを特定し、ダッシュボードとディテクタを表示および変更できるユーザーを管理します。「Turn on enhanced team security」を参照してください。
-
設定したディテクタによってトリガーされたアラートに対する、チーム固有の通知を割り当てます。チーム固有の通知は、アラートのさまざまなエスカレーション方法をチームに提供します。「Manage team notifications in Splunk Observability Cloud」を参照してください。
オプションの設定と高度な設定
以下に説明するオプションの設定や高度な設定を検討して、組織に適したセットアップのカスタマイズを行ってください。
グローバルデータリンクを使用して、プロパティを関連リソースにリンクさせる
グローバルデータリンクを作成して、Splunk Observability Cloud のダッシュボードを他のダッシュボード、外部システム、カスタム URL、または Splunk Cloud Platform のログにリンクさせます。詳細については、「Link metadata to related resources using global data links」を参照してください。
使用量、制限、スロットルの分析とトラブルシューティング
使用状況の分析とトラブルシューティングを行うには、以下のタスクの実行方法を必ず理解してください:
-
Infrastructure MonitoringにおけるホストベースのサブスクリプションとMTSベースのサブスクリプションの違いを理解する
-
APMにおけるホストベースのサブスクリプションとTAPM(trace-analyzed-per-minute)サブスクリプションの違いを理解する
-
製品ごとのシステム制限を理解する
-
月次および時間単位の使用状況レポート、ディメンションレポート、カスタムメトリクスレポートなどの利用可能なレポートを読む
詳細は、以下のトピックを参照してください:
教育リソース
-
OpenTelemetry エージェントの使用を拡大する前に、OpenTelemetry サイジングのガイドラインを検討してください。これは、さまざまな自動スケーリングサービスによって急激に増加する可能性がある、Kubernetes などのプラットフォームで特に重要です。サイジングのガイドラインの詳細については、「Sizing and scaling」を参照してください。
-
Splunk Observability Cloud ワークショップへのお申し込みは、Splunk セールスエンジニアにご相談ください。「Splunk Observability Cloud Workshops」を参照してください。
-
Splunk Observability Cloud エンドユーザー向けのトレーニングカリキュラムの作成を開始するには、「Curated training for end users」を参照してください。