サーバダッシュボード
サーバーダッシュボードにアクセスするには、 の順に選択します。
リストからサーバを選択し、サーバ名をダブルクリックしてダッシュボードを表示します。このダッシュボードでは、次のことができます。
- 選択したモニタ対象サーバの主要パフォーマンスメトリックのチャートを確認する。
- サーバの可用性
- CPU、メモリ、およびネットワークの使用率
- サーバのプロパティ
- ディスク、パーティション、およびボリュームのメトリック
- CPU リソースとメモリを消費する上位 10 のプロセス
- 表示されるメトリックの期間を変更する。
- 正常性ルール違反に基づいて、サーバの全体的な正常性のアセスメントを確認する。「UI で正常性ルールのステータスを表示」を参照してください。
- machine-path 設定プロパティを使用して
controller-info.xmlで指定されているサーバの階層またはグループを確認する。 - チャート上の任意のポイントをクリックして、その時点のメトリック値を表示する。
- ソートキーとして列のいずれかを使用して、チャートをソートする。
- サーバ階層の横にあるドロップダウンから他のサーバダッシュボードを見つけてそれに切り替える。
- CPU 使用率が高い上位 10 のプロセス、およびメモリ使用率が高い別の上位 10 のプロセスをまとめて確認する。
サーバーダッシュボードのメトリック
ホスト ID、正常性、階層(上部ペイン)
上部ペイン)- Host Id:これは、Splunk AppDynamics コントローラに固有のサーバーの ID です。
- Health:サーバの全体的な正常性を示します。[health] アイコンにカーソルを合わせると詳細が表示されます。たとえば、赤いボックス内の感嘆符(!)にカーソルを合わせると、「There are Critical Health Rule Violations on this machine during the time range.」と表示されます。
- Hierarchy:これは、マシン階層プロパティで指定された、サーバーをグループ化するための任意の階層です。
負荷平均(Load Average)
CPU 負荷は、過去 1 分間、5 分間、および 15 分間の平均として表示されます。CPU 負荷は、現在実行されている、または実行を待機しているプロセスによって消費された CPU のパーセンテージです。これらのメトリックは、サーバーダッシュボードではパーセンテージとして表示され、メトリックブラウザでは 100 倍されます。
アベイラビリティ
- Availability:マシンエージェントがコントローラと通信できる時間のパーセンテージ。マシンエージェントは、エージェントが稼働していることを示すため、1 分に 1 回、ハートビートの形式で可用性情報を Splunk AppDynamics コントローラに送信します。このハートビートは、マシンエージェントとサーバの他の機能が失敗したときに使用可能として表示される場合があります。可用性は、マシンエージェントがコントローラと通信していることを示すだけであり、マシンエージェント内の機能の全体的な正常性を示すものではありません。
- time series chart:時間の経過に伴うマシンエージェントの可用性の傾向を表示します。マシンエージェントがコントローラと通信できる一方で、マシンエージェントの他の機能、またはサーバー上のプロセスが機能していない状況があります。時系列のメトリックを使用してサーバの全体的な可用性を示すことはできません。
CPU
- CPU Usage:選択した時間範囲における CPU の平均使用率。
- # of Cores:CPU のコアの数。
- time series chart:時間の経過に伴う CPU ビジー率の傾向を表示します。
メモリ
- Installed:サーバのメモリの合計容量(空き容量と使用済み用量)
- Memory Usage:使用されているメモリのパーセンテージ。
- Swap Usage:[Swap usage] では、スワップファイルの使用状況が追跡されます。スワップファイルにより、オペレーティングシステムはハードディスク領域を使用して追加のメモリをシミュレートできます。システムでメモリが不足している場合、システムはアイドル状態のプログラムが使用している RAM のセクションをハードディスクにスワップして、他の実行中のプログラムのためにメモリを解放します。アイドル状態のスワップアウトされたプログラムが再び実行開始すると、そのプログラムは RAM に戻され、他のアイドル状態のプログラムが置き換えられる場合があります。これにより、ハードディスクの読み取りと書き込みが大量に行われ、システムの速度が大幅に低下する可能性があります。
- time series chart:時間の経過に伴うメモリ使用率の傾向を示します。
GPU
GPU Utilization (%):選択した時間範囲の GPU 使用量のパーセンテージ。
GPU Memory Utilization (%):使用されている GPU メモリのパーセンテージ。
GPU Temperature (C):選択した時間範囲の GPU の温度。
GPU Power Usage (W):選択した時間範囲の GPU の電力使用量。
GPU PCIe Tx Throughput:選択した時間範囲における、PCI Express(PCIe)インターフェイスを介した GPU によるデータ転送の速度。
GPU PCIe Rx Throughput:選択した時間範囲における、PCIe インターフェイスを介した GPU によるデータ受信の速度。
- DRAM Active (%):デバイスのメモリインターフェイスがアクティブでデータを送受信しているサイクルの比率。
- Tensor Pipe Active (%):(ピーク持続経過サイクルを除く)Tensor パイプがアクティブなサイクルの比率。
ネットワーク
- Interfaces:サーバのネットワーク インターフェイスの数。
- Outgoing:モニター対象のすべてのネットワークデバイスで 1 秒あたりに送信されたデータのキロバイト数。
- Incoming:モニター対象のすべてのネットワークデバイスで 1 秒あたりに受信されたデータのキロバイト数。
- time series chart:時間の経過に伴うネットワークの受信量および送信量の傾向を示します。
ボリューム
- Total:ディスク、パーティション、またはボリュームのストレージ容量(空き容量と使用済み容量)。Linux システムの場合、これにはカーネルによって予約されているディスク容量は含まれません。
- Free:使用可能なストレージ容量の合計。Linux システムの場合、これにはカーネルによって予約されているディスク容量は含まれません。
- Usage(%):各ディスク、パーティション、およびボリュームで使用されているストレージ容量のパーセンテージ。
- time series chart:時間の経過に伴うストレージ使用率の傾向を示します。
CPU を消費する上位 10 のプロセス
- Count:このクラスのプロセスの数。
- CPU (%):このクラスのすべてのプロセスによって消費された CPU リソースのパーセンテージ。
- Memory (%):クラスのすべてのプロセスによって消費されたメモリのパーセンテージ。
- PID:プロセス ID。
- PPID:親プロセス ID。
メモリを消費する上位 10 のプロセス
- Count:このクラスでメモリリソースを消費しているプロセスの数。
- CPU (%):このクラスのすべてのプロセスによって消費された CPU のパーセンテージ。
- Memory (%):このクラスのすべてのプロセスによって消費されたメモリのパーセンテージ。
- PID:プロセス ID。
- PPID:親プロセス ID。