寫在前面:虛擬機用戶別試了小压,不適用于虛擬機壤靶。
更新日期:2023/04/05
顯卡配置:3080ti雙卡
一缚俏、下載驅(qū)動
https://www.nvidia.cn/Download/index.aspx?lang=cn
根據(jù)你的需要選擇驅(qū)動,然后點擊搜索贮乳,然后下載
下載完成后得到一個.run的包:
二忧换、安裝(最好在ssh界面或者tty進行,因為待會關(guān)掉GPU進程可能會黑屏)
1. 獲得超級用戶權(quán)限
sudo -i
2. 關(guān)閉所有使用 GPU 的進程
sudo systemctl isolate multi-user.target
sudo modprobe -r nvidia-drm
3. 安裝NVIDIA 驅(qū)動(運行之后向拆,里面的“X”表示的是勾選亚茬,根據(jù)自己的需求選擇)
sudo sh ./NVIDIA-Linux-x86_64-XX.sh
4. 打開圖形界面
這里有個小插曲:需要確定自己的ubuntu用的是什么圖形界面:gdm,gdm3還是lightdm
cat /etc/X11/default-display-manager
我的是gdm3浓恳,所以:
sudo systemctl start gdm3.service
5. 重啟系統(tǒng)
sudo reboot
三刹缝、驗證nvidia驅(qū)動是否裝好
nvidia-smi
能正常顯示
<center>分割線</center>
四、下載安裝cuda
1.確定自己能裝的cuda版本:
方法一:
nvidia-smi
右上角颈将,CUDA Version就是能裝的最高的版本號赞草,比如我這里是11.7
方法二:
在CUDA Downloads下面的Resources中點擊CUDA Documentation/Release Notes就可以查看想要下載的CUDA需要什么版本的驅(qū)動(這里的CUDA Downloads超鏈接默認(rèn)是最新版本的cuda,如果需要的不是最新版本吆鹤,看下面2的鏈接)
2.下載:
https://developer.nvidia.com/cuda-toolkit-archive
下圖左邊的框框是下載鏈接,點進去洲守,根據(jù)自己的電腦配置選擇疑务。
右邊是對應(yīng)版本的在線文檔,英文好的同學(xué)可以直接看英文文檔安裝梗醇。
cuda有好幾種安裝方式知允,在上面的官方文檔有提及到。我這里選擇的是和安裝驅(qū)動一樣叙谨,下載的是.run文件安裝温鸽,官方文檔如下:
3.安裝
sudo sh cuda_<version>_linux.run
取消勾選安裝驅(qū)動(這一句寫給我自己看的,因為我這篇文章的第一節(jié)已經(jīng)安裝驅(qū)動了,同學(xué)們根據(jù)自己的需求來)
安裝完了之后會顯示(圖是第一次裝11.8的時候截圖的涤垫,第二次我裝的是11.7):
提示我們添加環(huán)境變量:
sudo vim /etc/profile
末尾加上:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.7/lib64
export PATH=$PATH:/usr/local/cuda-11.7/bin
export CUDA_HOME=/usr/local/cuda-11.7
這其中版本號可以根據(jù)自己的實際版本來姑尺,或者直接不要版本號也行,因為/usr/local目錄下有個cuda目錄蝠猬,映射到cuda-xx.x文件夾切蟋。
然后
source /etc/profile
4.驗證cuda:
nvcc -V
如果出現(xiàn)重新打開終端不生效的問題:
vim ~/.bashrc
末尾加上:
source /etc/profile
然后:
source ~/.bashrc
<center>分割線</center> 有沒有人教教我文字居中怎么打?
五榆芦、卸載cuda(如果裝錯版本的話)
xx.x是版本號
cd /usr/local/cuda-xx.x/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-xx.x
六柄粹、下載安裝cudnn
1.兩種方法的選擇:
deb和tar方法
推薦deb方法,因為:
使用tar方法安裝不會有cudnn_samples_v8這個文件匆绣,無法使用官方的安裝完成驗證方式驻右。
deb方法簡單。
2崎淳、下載堪夭,根據(jù)官方文檔來安裝:
下載地址:
https://developer.nvidia.com/rdp/cudnn-download
官方文檔地址:
https://docs.nvidia.com/deeplearning/cudnn/index.html
最后三步有坑:
比如我下的是8.6.0.163,cuda是11.7凯力,按照官方文檔的說法茵瘾,應(yīng)該是:
sudo apt-get install libcudnn8=8.6.0.163-1+cuda11.7
但實際上,對應(yīng)的libcudnn8咐鹤,cuda版本號只有最新的拗秘,不信你查一下:
sudo apt-cache madison packageName
sudo apt-cache madison libcudnn8
寫這篇文章的時候,cuda已經(jīng)出到11.8了祈惶,不過沒事雕旨,向下兼容
所以我這里是
sudo apt-get install libcudnn8=8.6.0.163-1+cuda11.8
blabla此處省略剩下兩條命令
3.驗證:
(只有deb方法安裝的才能用)根據(jù)官方文檔驗證:
cp -r /usr/src/cudnn_samples_v8/ $HOME
cd $HOME/cudnn_samples_v8/mnistCUDNN
make clean && make
./mnistCUDNN
Test passed!
七、卸載cudnn(如果用的上的話)
sudo rm -rf /usr/local/cuda/include/cudnn*.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
sudo rm -rf /usr/include/cudnn*.h
sudo rm -rf /usr/lib/x86_64-linux-gnu/libcudnn*