CUDA
CUDA VISIBLE DEVICE http://www.reibang.com/p/22c0f8ec9a3e
CUDA_VISIBLE_DEVICES=2,3 python my_script.py # Uses GPUs 2 and 3.
代碼里設(shè)置可見(jiàn)顯卡
if args.gpu == 'None':
config.set_cuda(False)
else:
try:
os.environ['CUDA_VISIBLE_DEVICES'] = str(args.gpu)
except IndexError:
config.set_cuda(False)
如果要周期性的輸出顯卡的使用情況大年,可以用watch指令實(shí)現(xiàn):
watch -n 10 nvidia-smi
升級(jí)CUDA版本
看NVIDIA驅(qū)動(dòng)版本
sudo dpkg --list | grep nvidia-*
和nvidia-smi
差不多波势,以前者為準(zhǔn)场靴,然后到 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html 或 不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本 (mamicode.com) 找對(duì)應(yīng)的 CUDA 版本买鸽;
檢查linux版本 sudo dpkg --list | grep nvidia-*
選擇CUDA版本https://developer.nvidia.com/cuda-11.1.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=WSLUbuntu&target_version=20 或者 https://developer.nvidia.com/cuda-downloads?target_os=Linux
CUDA版本檢測(cè)https://zhuanlan.zhihu.com/p/48641682
當(dāng)CUDA9安裝完成后,需要進(jìn)行檢測(cè):
cat /usr/local/cuda/version.txt #這種方法不太準(zhǔn)镜雨,得到9.0.176
nvcc --version #這種方法準(zhǔn)乙嘀。如果nvcc沒(méi)有安裝当叭,則sudo apt install nvidia-cuda-toolkit。檢查出來(lái)是7.5.17
3)通過(guò)代碼來(lái)查:
cudaDriverGetVersion(&driver_version); #獲取cuda版本职祷。得到9.0
cudaRuntimeGetVersion(&runtime_version); #獲取cuda運(yùn)行時(shí)版本氏涩。得到7.5
4)檢測(cè)顯卡型號(hào)及NVIDIA驅(qū)動(dòng)版本
查看GPU型號(hào) lspci | grep -i nvidia 得到M4000
查看NVIDIA驅(qū)動(dòng)版本 sudo dpkg --list | grep nvidia-* 得到384.130
根據(jù)不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本(不同版本cuda對(duì)應(yīng)的NVIDIA驅(qū)動(dòng)版本 - LearnFromNow - 博客園),這個(gè)驅(qū)動(dòng)應(yīng)該對(duì)應(yīng)cuda9.0
5)進(jìn)一步查是否環(huán)境變量的問(wèn)題,參見(jiàn) Ubuntu16.04下安裝多版本cuda和cudnn - tunhuzhuang1836的博客 - CSDN博客
在~/.bashrc中查看有無(wú)類似的語(yǔ)句有梆,如有改成下面的樣子是尖,沒(méi)有則增加:
export PATH="$PATH:/usr/local/cuda/bin"
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export LIBRARY_PATH="$LIBRARY_PATH:/usr/local/cuda/lib64"
然后繼續(xù)nvcc --version還是得到7.5。
6)檢查nvcc
which nvcc泥耀,發(fā)現(xiàn)是/usr/bin/nvcc饺汹,而實(shí)際上nvcc是應(yīng)該在/usr/local/cuda/bin/nvcc。
所以痰催,sudo gedit /usr/bin/nvcc兜辞,把里面的內(nèi)容"exec /usr/lib/nvidia-cuda-toolkit/bin/nvcc" 改成"exec /usr/local/cuda/bin/nvcc"
然后繼續(xù)nvcc --version這次得到9.0
DGL安裝
https://www.dgl.ai/pages/start.html
安裝 base 包
- 更新pip
python -m pip install --upgrade pip - 安裝 sklearn
pip install -U scikit-learn - 1、使用Pip更新Pytorch和torchvision
列舉pip當(dāng)前可以更新的所有安裝包
pip list --outdated --format=legacy
更新pytorch和torchvision安裝包
pip install --upgrade pytorch torchvision
- 2夸溶、使用conda更新Pytorch和torchvision
建議將其添加soumith為您的Anaconda(或Miniconda)的源服務(wù)器
conda config --add channels soumith
更新pytorch和torchvision安裝包
conda update pytorch torchvision
檢查
import torch
print(torch.version)
torch.cuda.is_available()返回 False
torch.cuda.is_available()返回False,但nvidia-smi正常