クラスタの正常性のモニタリング

クラスタダッシュボードでは、クラスタの正常性を可視化して、パフォーマンスへの影響を迅速に判断できます。各ダッシュボードインジケータは、クラスタパフォーマンスのさまざまな側面に対応します。

重要な注意事項

  • クラスタ インベントリ ダッシュボードにマスターノードが 0(ゼロ)と表示される場合がありますが、これは想定内の動作です。オンプレミスのクラスタとは異なり、クラウドプロバイダーは Kubernetes プロジェクトとは別のペースで開発およびリリースし、個別に進化します。このマスターノード、または Amazon EKS、AKS、およびその他のクラウドベース環境またはクラスタ内のマスターノードの数によって、クラスタのマスターノードが非表示になります。報告されたクラスタの結果は、 コマンドで生成された結果に似ています。

  • クラスタレベルのリソース使用率メトリックは、各ポッドによって消費されるリソースの合計です。クラスタエージェントでは個々のポッドの合計を報告するため、これらのメトリック値が数十万に達することがあります。
  • ポッド使用率メトリックは、ポッド内で実行されている各コンテナの合計です。
  • ポッドの数とポッドの状態(実行中、保留中、削除済み、および失敗したポッド)のメトリックには、指定した期間における平均履歴値ではなく、リアルタイムの値が表示されます。「今」実行中のすべてのポッドが報告されます。

クラスタダッシュボード

コントローラからクラスタにアクセスするには、次の手順を実行します。

  1. [サーバー(Servers)] > [クラスタ(Clusters)]を選択します。
  2. クラスタエージェントを選択し、ダブルクリックします。クラスタインターフェイスには、[Dashboard]、[Pods]、[Inventory]、および [Events] タブが表示されます。

ダッシュボード タブ

[ダッシュボード] タブ

  • Errors card各クラスタでモニタ対象となる名前空間の円グラフが表示されます。
    • Errors:個々のポッドの [Errors](エラーイベント数)、[Evictions](削除されたポッド数)、および [Threats](削除脅威数)の数。
    • Pods by phase:様々な状態([Failed]、[Pending]、[Running]、[Succeeded]、[Unknown])にあるポッドの数。
    • Activity over period:所定の期間における [Running] または [Pending] 状態のポッドの数を示す時系列グラフ。
  • Cluster Capacityスコアバーに [CPU]、[Memory]、および [Pods] を表示します。緑色の線は容量の使用量を示します。ダッシュボードには、このクラスタのリソース容量を計画するために使用できるクラスタの []、[]、[] の容量の使用率が表示されます。
  • Issues card:次の情報を表示します。
    • Pod Issues:クラスタエージェントがポッドの再起動とエラーを監視する場合に表示します。
    • Image issues:イメージの取得とエラー。
    • Storage:エラーやクォータ違反などのストレージ容量に関する問題。
  • Utilization card:次の情報が表示されます。
    • CPU:要求、制限、および使用済み。
    • Memory:要求、制限、および使用済み。
    • PVC:要求と容量。
  • :それぞれのクォータに関連するリソースの使用率(%)を表示します。エージェントは、次のリソースを追跡します。
    • 使用済みの CPU 制限クォータの割合。
    • 使用済みのクォータのメモリ制限。
    • 使用済みの PVC クォータの割合。
    • 使用済みの CPU 要求クォータの割合。
    • 使用済みのメモリ要求クォータの割合。
    • 使用済みのストレージクォータの割合。

数字はクラスタ全体で累積されます。これらのインジケータを使用して、課されたクォータに基づいて特定のリソースの可用性を追跡し、クラスタ容量の計画で使用します。

[Pods] タブ

[Pods] タブで、さまざまな状態のポッドを表示してステータスの概要を共有します。この例では、Amazon EKS で実行されているポッドを示しています。すべてのポッドは、登録済みの [] および [] に基づいて表示されます。

注: 終端されたポッドも Splunk AppDynamics コントローラから消去されるまで [Pods] リストに引き続き表示されますが、メトリックは更新されません。消去処理は定期的に自動実行されます。クラスタエージェントの管理

上部カードには、モニタ対象のポッドの概要と各クラスタでのポッドのステータスが表示されます。

  • :モニタ対象のクラスタ内にあるポッドの合計数。
  • :実行状態のポッドの数と割合。
  • :保留状態のポッドの数と割合。通常、保留中のステータスは問題を示します。Kubernetes のマニュアルを参照してください。
  • :消去されたポッドの数と割合。
  • :エラーが発生したポッドの数と割合。

[Namespace] または [Pod Name] に基づいて検索できます。

ポッドタグとラベルに基づいて、さらにフィルタ処理できます。

任意のポッドをダブルクリックして、[] パネルを表示します。[] パネルから、そのポッド、ポッドイベント、およびポッドのラベルおよびタグで実行されているコンテナを確認できます。ポッドの詳細パネル

クラスタエージェントは、ポッドを自動的に検出します。

  • ステータス
  • 名前空間
  • ポッド名
  • コンテナ ID
  • ホストまたはサーバ
  • CPU %(ポッド内で実行中のコンテナの合計)
  • メモリ MB(ポッド内で実行中のコンテナの合計)
  • 再始動

ポッドは、次の理由で削除されます。

  • 名前空間がモニタされていない場合。
  • ポッドがクラスタから削除された場合(失敗したポッドを除く)。
  • ポッド数がポッド制限を超えた場合。
  • ポッドがブロックリストに登録されている場合。

[Pod Details] パネル

[Pod Details] 画面には次が表示されます

  • :名前空間ではポッドが実行されています。
  • :名前空間またはポッド名。
  • Pod Eventskubectldescribe pods コマンドから生成された最新のイベントのリスト。
  • (数):このポッドのコンテナ ID によって表示される実行中コンテナのリスト。各コンテナをクリックすると、個々のコンテナメトリックが表示されます。
  • このポッドに指定される Kubernetes ラベル。

[Pod Details] パネル

[] をクリックすると、展開され、2 つのコンテナメトリック(CPU およびメモリの使用率)が表示されます。

コンテナのメトリック

[インベントリ(Inventory)] タブ

[Inventory] タブには、クラスタの高レベルのスナップショットまたはインベントリビューが表示されます。このタブにはクラスタの内容が表示されます。これにより、クラスタ内で実行されているアプリケーションのトラブルシューティングを行うことができます。

[Inventory] タブ

クラスタカードが次のように表示されます。

  • [Cluster Name]:クラスタに名前を付けます。
  • :クラスタで実行されているKubernetes のバージョン。
  • :クラスタエージェントのID。
  • :モニタ対象ポッドの数。
  • :モニタ対象名前空間の数。
  • :マスターノードの数。
  • :ワーカーノードの数。
  • :クラスタ内のディスク負荷傾向のスニペット。
  • :クラスタ内のメモリ負荷傾向のスニペット。

ポッドカードが次のように表示されます。

  • :ポッドが実行中、消去中、保留中、または失敗したかどうかを示します。この数は、[Pod] タブで「実行中」状態のポッドと同じ数になります。
  • Privileged Pods:ポッドはルートとして実行されます。
  • :開始するポッドに制限を指定できます。制限なしメトリックは、制限が定義されていないポッドの数を示します。
  • :準備状況をモニターするプローブを Kubernetes に設定した場合、値がここに表示されます。
  • :稼働状況をモニタするプローブを Kubernetes に設定した場合、値がここに表示されます。
  • :ポッドが [Config Maps & Secrets] に依存している場合、それらの依存関係は失われています。
  • :ポッドがいずれかのサービスに依存している場合、それらの依存関係は失われています。
  • :展開および ReplicaSets のスケールダウンの数。
  • :キルされたポッドの数。

:検索バーから検索できる名前空間のリスト。

オブジェクトカードには次が表示されます。

  • :モニタ対象となっている名前空間の合計ジョブ数、および失敗したジョブ数、アクティブなジョブ数、成功したジョブ数。
  • :モニタ対象となっている名前空間の展開数、および使用可能/使用不可の合計レプリカ数。
  • :モニタ対象となっている名前空間の ReplicaSets 数、および使用可能/使用不可の合計レプリカ数。
  • :モニタ対象となっている名前空間の DaemonSets 数、および使用可能/使用不可/実行されなかった合計ポッド数。
  • :モニタ対象となっている名前空間の StatefulSets 数、および準備完了/未準備の合計レプリカ数。

サービスカードには、クラスタ全体の正常性が表示されます。

  • :モニタ対象となっているサービスの合計数。
  • :モニタ対象となっているエンドポイントの合計数。
  • :準備完了の IP アドレスがないエンドポイントの数。
  • :IP アドレスがない孤立状態のエンドポイントの数。

[イベント(Events)] タブ

[Events] タブには、選択したクラスタに固有のクラスタイベントが表示されます。フィルタを使用して、特定のイベントを表示できます。

重要な注意事項

  • クラスタ インベントリ ダッシュボードにマスターノードが 0(ゼロ)と表示される場合がありますが、これは想定内の動作です。オンプレミスのクラスタとは異なり、クラウドプロバイダーは Kubernetes プロジェクトとは別のペースで開発およびリリースし、個別に進化します。このマスターノード、または Amazon EKS、AKS、およびその他のクラウドベース環境またはクラスタ内のマスターノードの数によって、クラスタのマスターノードが非表示になります。報告されたクラスタの結果は、 コマンドで生成された結果に似ています。

  • クラスタレベルのリソース使用率メトリックは、各ポッドによって消費されるリソースの合計です。クラスタエージェントでは個々のポッドの合計を報告するため、これらのメトリック値が数十万に達することがあります。
  • ポッド使用率メトリックは、ポッド内で実行されている各コンテナの合計です。
  • ポッドの数とポッドの状態(実行中、保留中、削除済み、および失敗したポッド)のメトリックには、指定した期間における平均履歴値ではなく、リアルタイムの値が表示されます。「今」実行中のすべてのポッドが報告されます。

クラスタダッシュボード

コントローラからクラスタにアクセスするには、次の手順を実行します。

  1. [サーバー(Servers)] > [クラスタ(Clusters)]を選択します。
  2. クラスタエージェントを選択し、ダブルクリックします。クラスタインターフェイスには、[Dashboard]、[Pods]、[Inventory]、および [Events] タブが表示されます。

ダッシュボード タブ

[ダッシュボード] タブ

  • Errors card各クラスタでモニタ対象となる名前空間の円グラフが表示されます。
    • Errors:個々のポッドの [Errors](エラーイベント数)、[Evictions](削除されたポッド数)、および [Threats](削除脅威数)の数。
    • Pods by phase:様々な状態([Failed]、[Pending]、[Running]、[Succeeded]、[Unknown])にあるポッドの数。
    • Activity over period:所定の期間における [Running] または [Pending] 状態のポッドの数を示す時系列グラフ。
  • Cluster Capacityスコアバーに [CPU]、[Memory]、および [Pods] を表示します。緑色の線は容量の使用量を示します。ダッシュボードには、このクラスターのリソース容量を計画するために使用できるクラスターの [CPU]、[Memory]、[Pod] の容量の使用率が表示されます。
  • Issues card:次の情報を表示します。
    • Pod Issues:クラスタエージェントがポッドの再起動とエラーを監視する場合に表示します。
    • Image issues:イメージの取得とエラー。
    • Storage:エラーやクォータ違反などのストレージ容量に関する問題。
  • Utilization card次の情報が表示されます。
    • CPU:要求、制限、および使用済み。
    • Memory:要求、制限、および使用済み。
    • PVC:要求と容量。
  • Quotas cardそれぞれのクォータに関連するリソースの使用率(%)を表示します。エージェントは、次のリソースを追跡します。
    • 使用済みの CPU 制限クォータの割合。
    • 使用済みのクォータのメモリ制限。
    • 使用済みの PVC クォータの割合。
    • 使用済みの CPU 要求クォータの割合。
    • 使用済みのメモリ要求クォータの割合。
    • 使用済みのストレージクォータの割合。

数字はクラスタ全体で累積されます。これらのインジケータを使用して、課されたクォータに基づいて特定のリソースの可用性を追跡し、クラスタ容量の計画で使用します。

[Pods] タブ

[Pods] タブで、さまざまな状態のポッドを表示してステータスの概要を共有します。この例では、Amazon EKS で実行されているポッドを示しています。すべてのポッドは、登録済みの [] および [] に基づいて表示されます。

注: 終端されたポッドも Splunk AppDynamics コントローラから消去されるまで [Pods] リストに引き続き表示されますが、メトリックは更新されません。消去処理は定期的に自動実行されます。クラスタエージェントの管理

上部カードには、モニタ対象のポッドの概要と各クラスタでのポッドのステータスが表示されます。

  • :モニタ対象のクラスタ内にあるポッドの合計数。
  • :実行状態のポッドの数と割合。
  • :保留状態のポッドの数と割合。通常、保留中のステータスは問題を示します。Kubernetes のマニュアルを参照してください。
  • :消去されたポッドの数と割合。
  • :エラーが発生したポッドの数と割合。

[Namespace] または [Pod Name] に基づいて検索できます。

ポッドタグとラベルに基づいて、さらにフィルタ処理できます。

任意のポッドをダブルクリックして、[] パネルを表示します。[] パネルから、そのポッド、ポッドイベント、およびポッドのラベルおよびタグで実行されているコンテナを確認できます。ポッドの詳細パネル

クラスタエージェントは、ポッドを自動的に検出します。

  • ステータス
  • 名前空間
  • ポッド名
  • コンテナ ID
  • ホストまたはサーバ
  • CPU %(ポッド内で実行中のコンテナの合計)
  • メモリ MB(ポッド内で実行中のコンテナの合計)
  • 再始動

ポッドは、次の理由で削除されます。

  • 名前空間がモニタされていない場合。
  • ポッドがクラスタから削除された場合(失敗したポッドを除く)。
  • ポッド数がポッド制限を超えた場合。
  • ポッドがブロックリストに登録されている場合。

[Pod Details] パネル

[Pod Details] 画面には次が表示されます

  • :名前空間ではポッドが実行されています。
  • :名前空間またはポッド名。
  • Pod Eventskubectldescribe pods コマンドから生成された最新のイベントのリスト。
  • (数):このポッドのコンテナ ID によって表示される実行中コンテナのリスト。各コンテナをクリックすると、個々のコンテナメトリックが表示されます。
  • Tags:このポッドに指定される Kubernetes ラベル。

[Pod Details] パネル

[] をクリックすると、展開され、2 つのコンテナメトリック(CPU およびメモリの使用率)が表示されます。

コンテナのメトリック

[インベントリ(Inventory)] タブ

[Inventory] タブには、クラスタの高レベルのスナップショットまたはインベントリビューが表示されます。このタブにはクラスタの内容が表示されます。これにより、クラスタ内で実行されているアプリケーションのトラブルシューティングを行うことができます。

[Inventory] タブ

クラスタカードが次のように表示されます。

  • [Cluster Name]:クラスタに名前を付けます。
  • :クラスタで実行されているKubernetes のバージョン。
  • :クラスタエージェントのID。
  • :モニタ対象ポッドの数。
  • :モニタ対象名前空間の数。
  • :マスターノードの数。
  • :ワーカーノードの数。
  • :クラスタ内のディスク負荷傾向のスニペット。
  • :クラスタ内のメモリ負荷傾向のスニペット。

ポッドカードが次のように表示されます。

  • :ポッドが実行中、消去中、保留中、または失敗したかどうかを示します。この数は、[Pod] タブで「実行中」状態のポッドと同じ数になります。
  • Privileged Pods:ポッドはルートとして実行されます。
  • :開始するポッドに制限を指定できます。制限なしメトリックは、制限が定義されていないポッドの数を示します。
  • :準備状況をモニターするプローブを Kubernetes に設定した場合、値がここに表示されます。
  • :稼働状況をモニタするプローブを Kubernetes に設定した場合、値がここに表示されます。
  • :ポッドが [Config Maps & Secrets] に依存している場合、それらの依存関係は失われています。
  • :ポッドがいずれかのサービスに依存している場合、それらの依存関係は失われています。
  • :展開および ReplicaSets のスケールダウンの数。
  • :キルされたポッドの数。

:検索バーから検索できる名前空間のリスト。

オブジェクトカードには次が表示されます。

  • :モニタ対象となっている名前空間の合計ジョブ数、および失敗したジョブ数、アクティブなジョブ数、成功したジョブ数。
  • :モニタ対象となっている名前空間の展開数、および使用可能/使用不可の合計レプリカ数。
  • :モニタ対象となっている名前空間の ReplicaSets 数、および使用可能/使用不可の合計レプリカ数。
  • :モニタ対象となっている名前空間の DaemonSets 数、および使用可能/使用不可/実行されなかった合計ポッド数。
  • :モニタ対象となっている名前空間の StatefulSets 数、および準備完了/未準備の合計レプリカ数。

サービスカードには、クラスタ全体の正常性が表示されます。

  • :モニタ対象となっているサービスの合計数。
  • :モニタ対象となっているエンドポイントの合計数。
  • :準備完了の IP アドレスがないエンドポイントの数。
  • :IP アドレスがない孤立状態のエンドポイントの数。

[イベント(Events)] タブ

[Events] タブには、選択したクラスタに固有のクラスタイベントが表示されます。フィルタを使用して、特定のイベントを表示できます。