収集方法
NVIDIA-SMI コレクタ:ネイティブ NVIDIA-SMI CLI を使用する軽量のゼロ依存アプローチ。「NVIDIA-SMI コレクタの構成」を参照してください。
- DCGM エクスポータ:
NVIDIA の Data Center GPU Manager(DCGM)Prometheus エクスポータ。
スタンドアロン ノード エージェントとして、また Kubernetes DaemonSet として使用できます。クラスタエージェントを使用して、Kubernetes 環境でエンドツーエンドの GPU モニタリングを提供し、ポッドおよびコンテナレベルで詳細なメトリックをキャプチャします。「DCGM エクスポータの構成」を参照してください。