配置深度學(xué)習(xí)主機(jī)與環(huán)境(TensorFlow+1080Ti):
(一)硬件選購(gòu)與主機(jī)組裝
(二)Win10&Ubuntu雙系統(tǒng)與顯卡驅(qū)動(dòng)安裝
(三)CUDA與CUDNN安裝
(四)基于Anaconda的TensorFlow安裝
0. 概念介紹
CUDA(Compute Unified Device Architecture 統(tǒng)一計(jì)算設(shè)備架構(gòu))
CUDA(Compute Unified Device Architecture),是英偉達(dá)公司推出的一種基于新的并行編程模型和指令集架構(gòu)的通用計(jì)算架構(gòu),它能利用英偉達(dá)GPU的并行計(jì)算引擎僧鲁,比CPU更高效的解決許多復(fù)雜計(jì)算任務(wù)厕诡。
使用CUDA的好處就是透明温艇。根據(jù)摩爾定律GPU的晶體管數(shù)量不斷增多肠虽,硬件結(jié)構(gòu)必然是不斷的在發(fā)展變化醉者,沒(méi)有必要每次都為不同的硬件結(jié)構(gòu)重新編碼刽辙,而CUDA就是提供了一種可擴(kuò)展的編程模型窥岩,使得已經(jīng)寫好的CUDA代碼可以在任意數(shù)量核心的GPU上運(yùn)行。
CUDA最主要的包含兩個(gè)方面:一個(gè)是ISA指令集架構(gòu)宰缤;第二硬件計(jì)算引擎颂翼;實(shí)際上是硬件和指令集。 也就是說(shuō)我們可以把CUDA看做是與X86或者cell類似的架構(gòu)慨灭,但是是基于是GPU朦乏,而不是傳統(tǒng)的CPU。
cuDNN(NVIDIA CUDA? Deep Neural Network library)
The NVIDIA CUDA? Deep Neural Network library (cuDNN) is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN is part of the NVIDIA Deep Learning SDK.
Deep learning researchers and framework developers worldwide rely on cuDNN for high-performance GPU acceleration. It allows them to focus on training neural networks and developing software applications rather than spending time on low-level GPU performance tuning. cuDNN accelerates widely used deep learning frameworks, including Caffe, Caffe2, TensorFlow, Theano, Torch, and Microsoft Cognitive Toolkit.
1. 安裝顯卡驅(qū)動(dòng)
在安裝CUDA和cuDNN之前氧骤,需要確保顯卡驅(qū)動(dòng)已經(jīng)安裝好呻疹,其安裝情況可以在 設(shè)置-軟件更新-附加驅(qū)動(dòng) 中查看:
更多關(guān)于顯卡(文中使用1080Ti)安裝的步驟,可以參考系列文章的第二篇:
配置深度學(xué)習(xí)主機(jī)與環(huán)境(TensorFlow+1080Ti):(二)Win10&Ubuntu雙系統(tǒng)與顯卡驅(qū)動(dòng)安裝
2. 安裝CUDA
- 查閱 NVIDIA CUDA Installation Guide for Linux
英偉達(dá)CUDA安裝指南(Linux)對(duì)于后續(xù)的學(xué)習(xí)與工作大有裨益筹陵,包含了CUDA的詳盡安裝說(shuō)明刽锤。當(dāng)然如果你不想閱讀英文镊尺,只想盡快安裝CUDA,可以參照后續(xù)步驟并思。
- 下載 CUDA Toolkit 安裝包:
- 推薦使用第一個(gè)runfile (local) 安裝選項(xiàng)庐氮;
- 網(wǎng)上不少教程中寫有需要降低gcc版本,實(shí)測(cè)宋彼,無(wú)需降級(jí)弄砍,因此可以忽略;
- 下載第一個(gè) Base Installer 即可宙暇。
-
安裝CUDA8.0
- 打開終端输枯,輸入:
sudo sh cuda_8.0.61_375.26_linux.run
,在下載選項(xiàng)中占贫,也有說(shuō)明如何安裝桃熄;
- 如果出現(xiàn)大段廢話,可以使用
Ctrl+C
跳過(guò)型奥; -
進(jìn)入具體的安裝選項(xiàng):
- 注意第二個(gè)選項(xiàng)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
須選擇否瞳收,因?yàn)樵谥耙呀?jīng)安裝好了顯卡驅(qū)動(dòng),無(wú)需重新安裝厢汹。
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y
Enter CUDA Samples Location
[ default is /home/dexter ]:
- 添加環(huán)境變量:
- 在終端中輸入:
gedit ~/.bashrc
- 在打開的文件中寫入:
export PATH="$PATH:/usr/local/cuda-8.0/bin"
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib64"
- 保存并關(guān)閉文件螟深, 在終端中輸入:
source ~/.bashrc
使環(huán)境更改生效。
- 在終端中輸入
nvidia-smi
烫葬,可以查詢顯卡狀態(tài)界弧。
- CUDA Samples 測(cè)試
運(yùn)行 CUDA Samples 檢測(cè) CUDA 是否順利安裝: - 打開終端,切換到位置:
~/ NVIDIA_CUDA-8.0_Samples
- 輸入:
make
- 編譯時(shí)間較長(zhǎng)搭综。若沒(méi)有報(bào)錯(cuò)垢箕,則將新編譯為二進(jìn)制文件,默認(rèn)存放在
~/NVIDIA_CUDA-7.5_Samples/bin
中兑巾。 - 打開終端条获,切換到位置:
~/NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release
- 終端輸入:
./deviceQuery
,如果顯示類似下圖蒋歌,則說(shuō)明CUDA安裝且配置成功帅掘!
3. 安裝cuDNN
- 下載cuDNN堂油,下載之前需要注冊(cè)Nvidia開發(fā)者帳號(hào)修档,按要求注冊(cè)即可。
-
莫名其妙在我的筆記本上無(wú)法登錄...在主機(jī)的Ubuntu中可以順利登錄...此條純屬吐槽府框,封IP真是夠了...
- 登錄后顯示有多個(gè)版本可供選擇萍悴,建議使用 cuDNN v5.1 for CUDA 8.0,因?yàn)樽髡咦铋_始嘗鮮選擇 cuDNN v6.0 for CUDA 8.0 最后安裝失敗寓免,應(yīng)該是支持還不到位癣诱。然后又刪掉cuDNN,再重新安裝(中間刪掉重新安裝cuDNN已經(jīng)安裝好的Anaconda不影響袜香,但是最好重新安裝TensorFlow)撕予。
- 具體報(bào)錯(cuò)為:
ImportError: libcudnn.so.5: cannot open shared object file: No such file or director
在安裝cuDNN中,可以看到安裝文件的版本為libcudnn.so.6蜈首,所以很明顯是v6版本不支持導(dǎo)致的錯(cuò)誤(參見(jiàn)本文最后一張圖实抡,是安裝cuDNN v6時(shí)的截圖,其中包含libcudnn.so.6文件)欢策。
-
stcokoverflow 中也出現(xiàn)了相關(guān)問(wèn)題:
ImportError: libcudnn when running a TensorFlow program
-
選擇 cuDNN v5.1 for CUDA 8.0 中的 cuDNN v5.1 Library for Linux 下載:
在包含安裝文件的文件夾吆寨,右鍵,打開終端踩寇,輸入如下命令行:
tar xvzf cudnn-8.0-linux-x64-v5.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64
sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.h /usr/local/cuda-8.0/lib64/libcudnn*
相當(dāng)于解壓縮+復(fù)制粘貼啄清,手動(dòng)復(fù)制粘貼也是沒(méi)問(wèn)題的。到此cuDNN安裝完畢俺孙。