NVIDIA-SMI コレクタの構成

  1. NVIDIA ドライババージョン 550.x 以降をインストールします。次のコマンドを使用して、ドライバのバージョンを確認します。
    注: GPU ドライバがインストールされていない場合は、互換性のあるドライバをインストールします。たとえば、次のコマンドは、Tesla GPU 用の Ubuntu 22.04 にドライバをインストールします。
    sudo apt-get update && sudo apt-get install -y build-essential
     
    BASE_URL=https://us.download.nvidia.com/tesla
    DRIVER_VERSION=550.54.14
    curl -fSsl -O $BASE_URL/$DRIVER_VERSION/NVIDIA-Linux-x86_64-$DRIVER_VERSION.run
    sudo sh NVIDIA-Linux-x86_64-$DRIVER_VERSION.run --dkms
    NVIDIA ドライバの詳細については、次のドキュメントを参照してください。
  2. GPU サポートを有効にするには、次のいずれかの方法を使用します。
    • コントローラ構成ファイル(controller-info.xml):
      <gpu-enabled>true</gpu-enabled>
    • システムプロパティ:
      -Dappdynamics.machine.agent.gpu.enabled=true
    • 環境変数:
      APPDYNAMICS_MACHINE_AGENT_GPU_ENABLED=true
  3. NVML ベースの収集をアクティブにするには、次のシステムプロパティを設定します。
    -Dappdynamics.machine.agent.gpu.collection.nvml.enabled=true
  4. 次のフラグを使用して、コントローラアカウントレベルで GPU モニタリングを有効にします。
    sim.cluster.gpu.enabled=true