在 GPU 主機安裝 Nvidia驅動(可省略)
參見:https://ubuntu.com/server/docs/nvidia-drivers-installation
可省略释液,后面安裝CUDA時也能安裝驅動
在 GPU 主機安裝 CUDA
- 安裝依賴包
apt install gcc make
- 下載和安裝CUDA式曲,參見:https://developer.nvidia.com/cuda-downloads ,使用 runfile 文件安裝
- 設置環(huán)境變量
cat >> /etc/profile <<EOF
# Nvidia CUDA
export PATH=/usr/local/cuda/bin\${PATH:+:\${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64\${LD_LIBRARY_PATH:+:\${LD_LIBRARY_PATH}}
EOF
在 GPU 主機安裝 NVIDIA Container Toolkit
參見:https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
注:把 nvidia 設為 containerd 的默認運行時
nvidia-ctk runtime configure --runtime=containerd --set-as-default