モニターホスト

Splunk Observability Cloud でホストを監視する方法を学習します。

Splunk Observability Cloud でホストメトリクスを監視できます。ホストのモニタリングを開始する前に、管理者のクレデンシャルでサインインし、ホストからメトリクスをエクスポートする必要があります。次のリソースでは、サポートされているホストタイプからメトリクスをエクスポートする方法について説明します。

Splunk Observability Cloud は、Splunk Distribution of OpenTelemetry Collector を利用するインフラストラクチャ監視機能を提供します。

以下の表で説明されているように、ホストに関するデータをエクスポートして監視することもできます。

データを取り込む

モニター

説明

ホストが稼働しているクラウドサービスプロバイダーに接続します (ある場合)。

バックエンドアプリケーションをインストルメンテーションして、スパンを Splunk APM に送信する

Splunk APMの概要

ホスト上で実行されているアプリケーションからメトリクスとスパンを収集します。

Splunk Observability Cloud は、以下のホストとアプリケーションの監視に対しても、メトリクスとその他のデータを提供します。

インフラストラクチャページからホストを監視する

[Infrastructure] ページから、データセンター全体の状況を一目で確認できます。このページでは、各ホストの主要なパフォーマンス情報を一目で確認できます。

注:
  • My Data Center のホストインスタンスには、Splunk Distribution of OpenTelemetry Collector がインストールされているホストのみが含まれます。SmartAgent がインストールされているすべてのホスト(パブリッククラウドまたはそれ以外)のパフォーマンスを表示するには、[Navigation menu] > [Dashboard] > [Built-in] を選択し、[Hosts with agent installed] インデックスを選択します。

  • My Data Center のホストインスタンスには、Amazon EC2、GCP Compute Engine、Azure Virtual Machines、および Kubernetes インスタンスも含まれません。Amazon EC2、GCP Compute Engine、Azure Virtual Machines、および Kubernetes インスタンスを表示するには、「Splunk Infrastructure Monitoring でナビゲータを使用する」を参照し、各サービスのそれぞれのナビゲータに移動します

以下の手順に従って、Infrastructureページから問題のあるホストを解析してください:

  1. [Navigation menu > Infrastructure] を選択し、[Hosts] カテゴリを選択します。

  2. 次のメトリクスに沿ってホストを [Color by] ドロップダウンリストと比較します。ヒートマップでは、選択したメトリクスに基づいて、インスタンスの状況が色で示されます。たとえば、緑と赤で表示されるヒートマップでは、緑は正常なインスタンスを示し、赤は異常なインスタンスを示します。ヒートマップに複数の色がある場合、明るいグラデーションはより少ないアクティビティを表し、暗いグラデーションはより多くのアクティビティを表します。カスタムダッシュボードやチャート、Infrastructure Monitoring 全体に、視覚的にアクセス可能なカラーパレットを適用するには、[Account Settings] を選択し、次に [Color Accessibility] を選択します。

    メトリクス

    説明

    cpu.utilization

    CPU 使用率が 20% 未満のホストは緑色で表示されます。CPU 使用率が 80% を超えるホストは赤色で表示されます。

    memory.utilization

    メモリ使用率が 20% 未満のホストは緑色で表示されます。メモリ使用率が 80% を超えるホストは赤色で表示されます。

    disk.summary_utilization

    ディスク容量の使用率が 20% 未満のホストは緑色で表示されます。ディスク容量の使用率が 80% を超えるホストは赤色で表示されます。

    network.total

    ネットワークトラフィックが最も少ない20%のホストが緑色、最も多い20%のホストが赤色の相対比較。

    disk_ops.total

    ディスク操作の20%が最も少ないホストが緑色、20%が最も多いホストが赤色の相対比較。

  3. [Group by] ドロップダウンリストを使用して、各ホストに関するメタデータに基づいてホストをグループ化します。

    たとえば、実行中のリージョン、オペレーティングシステムのバージョン、または環境タグに従って、ホストをグループ化して見ることができます。これを活用して、インフラストラクチャのさまざまな部分とそのパフォーマンスの相関関係を確認します。

  4. [Find Outliers] 設定を使用してメトリクスの外れ値を見つけます。[Scope] および [Strategy] を指定します。

    [Scope] を設定すると、表示されているインスタンス全体から外れ値を分析するか、またはインスタンスをグループ化したディメンションまたはプロパティによって定義されたグループ内のみから外れ値を分析することができます。

    次の表で説明されているように、外れ値を見つけるために、2つの 戦略 のうちの1つを選択することができます。

    戦略

    説明

    Deviation from Mean

    赤で示されたホストは、少なくとも 3 つの標準偏差によってメトリクスの平均値を超えたものです。この設定を使用すると、最も極端な外れ値を見つけることができます。

    Deviation from Median

    赤で示されたホストは、中央絶対偏差値を少なくとも 3 倍の絶対偏差で超過したものです。この設定では、標準偏差程度の外れ値であれば重要視されません。

  5. さらに調査したい特定のホストを選択すると、ホストのすべてのメタデータと主要メトリクスが表示されます。すべてのホストインスタンスについて、Splunk Observability Cloud はホストインスタンスにドリルダウンするためのビルトインコンテンツを提供します。

ホストインスタンスにドリルダウンして調査またはトラブルシューティングする方法についてのインタラクティブなウォークスルーについては、「Splunk Infrastructure Monitoring Web サーバー トラブルシューティング シナリオ」および「Splunk Infrastructure Monitoring アプリケーション監視シナリオ」を参照してください。

使用可能なビルトインコンテンツについては、以下のセクションを参照してください。

ダッシュボードでメタデータを確認する

ホストインスタンスが実行されているクラウドサービス、ホスト自体、およびホストに関連付けられたカスタムタグに関するすべての利用可能なメタデータを分析するには、Infrastructure Monitoring が提供するダッシュボードを使用できます。デフォルトのダッシュボードには、次のメトリクスのメトリクス時系列(MTS)を表すさまざまなチャートが表示されます。

  • CPU使用率

  • メモリ使用率

  • ディスク使用率

  • ディスク操作

  • ネットワークI/O

詳細については、「内蔵ダッシュボード」を参照してください。

プロセスリストでプロセスを調査する

ホストインスタンスのドリルダウン表示では、ホスト上のプロセスの現在のステータスと完全なリストにアクセスして、CPU使用率、メモリ使用率などに基づいて潜在的な外れ値プロセスを探すことができます。

注: プロセスの完全なリストを表示するには、OpenTelemetry の設定にプロセスリスト モニタータイプを入れてください。
  • デフォルトでは、プロセスのリストはCPU使用率の降順でソートされます。

  • リストを別のプロパティで並べ替えたり、並べ替え順序を切り替えたりするには、並べ替えたいプロパティを表す列のヘッダーをクリックします。プロセスリストの列は、ご使用の *nix システムで top コマンドを実行すると表示されるプロパティと同じです。

  • [COMMAND] 列のいくつかのコマンドは切り捨てられていますが、切り捨てられたテキストにカーソルを合わせると、コマンドの全文を確認することができます。また、[Copy to Clipboard] アイコンをクリックして、全文をコピーすることもできます。