GPU版本tensorflow安裝及介紹

安裝GPU加速的tensorflow 卸載tensorflow

一: 本次安裝實驗環(huán)境

Ubuntu 16.04 + cuda9.0 + cudnn7.0

Ubuntu 16.04 + cuda8.0 + cudnn5.1

什么是CUDA呢京痢?簡單的來講它是為了實現(xiàn)GPU運算的平臺祭椰。我們的tensorflow會調(diào)用cuda的接口方淤,利用顯卡幫助我們運算程序

而CUDNN是為了加速神經(jīng)網(wǎng)絡(luò)用的

二: 卸載TensorFlow

先介紹卸載携茂, 如果你的tensorflow是用pip安裝的,那下面簡單的命令就可以完成卸載了

    sudo pip uninstall tensorflow_gpu  
    sudo pip3 uninstall tensorflow_gpu

用 pip 還是pip3基于你是用python2 還是用python3安裝的tensorflow

三: 關(guān)于驅(qū)動那點事:

安裝之前要先換驅(qū)動带膜,如果你之前換過膝藕,那可以跳過這步直接進入主題芭挽。
方法如下:
打開system settings --> software & Updates --> Additional Drivers
然后選擇你需要的顯卡驅(qū)動览绿。(一般選擇nvidia的顯卡驅(qū)動)

Selection_016.png

如果還不清楚饿敲,或者不行怀各,可參考這兩個地址:

http://blog.csdn.net/tianrolin/article/details/52830422
http://blog.csdn.net/u012581999/article/details/52433609

在正式進入安裝之前,請先把cuda和cudnn對應(yīng)的版本下載好:
本教程給的例子是 : Ubuntu16.04 + cuda9.0 + cudnn7.0 + tensorflow1.9Ubuntu16.04 + cuda8.0 + cudnn5.1 + tensorflow1.9

對于cuda和cudnn的下載瓢对,官網(wǎng)鏈接如下:

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive

如果官網(wǎng)網(wǎng)速不夠寿酌,可以用我給的鏈接(沒幣私信):

https://download.csdn.net/download/chenhaojing/10591809

注意:這個版本搭配不是唯一的,首先你要了解你電腦的顯卡是什么類型硕蛹,然后根據(jù)你的顯卡類型選擇cuda的版本醇疼,在根據(jù)cuda的版本選擇cudnn的版本,最后再根據(jù)前面兩種的搭配選擇tensorflow的版本

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

Selection_017.png

Selection_018.png

tensorflow 1.4 及以下選擇cuda8.0 , 以上選擇cuda9.0

安裝cuda(以9.0為例子)

注意法焰,下載.run文件秧荆,不要下載.deb文件埃仪,否則就踩坑了

安裝命令:
sudo sh cuda_9.0.176_384.81_linux.run

執(zhí)行后會給一段協(xié)議乙濒,按ctrl+c 跳過閱讀, 然后 accept接受協(xié)議卵蛉,選項如下:


Selection_019.png

你還會看到這個類似安裝失敗的提示:


Selection_020.png

別在意颁股,要確定自己是不是安裝成功,如下

驗證是否安裝完成
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
(或者手動進入改文件夾傻丝,注意甘有,同樣路徑中cuda-9.0根據(jù)cuda的版本變化而變化)

 sudo  make (報錯可以不管)

 ./deviceQuery
 如果顯示的是關(guān)于GPU的信息,則說明安裝成功了桑滩。
Selection_021.png

Selection_023.png

四:安裝cudnn

同樣注意安裝版本梧疲,例子是cudnn 7.0
先解壓:

tar -zxvf cudnn-9.0-linux-x64-v7.tgz

解壓后有個cuda文件,內(nèi)有include和lib64兩個文件夾,進入include文件夾辕录,執(zhí)行如下命令:

    sudo cp cudnn.h /usr/local/cuda/include/     #復(fù)制頭文件  

(或者直接執(zhí)行 sudo cp cuda/include/cudnn.h /usr/local/cuda/include )
再cd命令切換進lib64文件夾岗钩,執(zhí)行如下命令:

     sudo cp lib* /usr/local/cuda/lib64/    #復(fù)制動態(tài)鏈接庫  

(或者直接執(zhí)行 sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 )

注意,按照網(wǎng)上一些版本不匹配的安裝方法炕檩,這里執(zhí)行后還要執(zhí)行復(fù)制和刪除軟連接的操作,其實完全是多余的,當(dāng)然韭畸,如果你不小心裝錯版本宇智,是有必要修改軟連接的

五:配置環(huán)境變量

我們就把cuda的環(huán)境變量配在 .bashrc 吧:

sudo gedit ~/.bashrc
把下面命令粘貼到文件末尾
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0

六: 安裝TensorFlow-gpu

先給正確的安裝命令:

Anacanda 下的命令:(力推,如果不知道建議先去安裝胰丁,這個極為方便)

pip install tensorflow-gpu==1.9

官網(wǎng)命令:

 sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.7.0-cp36-none-linux_x86_64.whl

清華影像命令:

 sudo pip install --upgrade https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow-1.7.0-cp36-none-linux_x86_64.whl

注意事項:

如果直接運行官網(wǎng)給的代碼随橘,網(wǎng)速可能很慢,畢竟是外國的網(wǎng)站锦庸。所以机蔗,我們不從官網(wǎng)下,去清華大學(xué)開源軟件鏡像站下載tensorflow.方法如下:

  1. https://storage.googleapis.com/ 替換為 https://mirrors.tuna.tsinghua.edu.cn/ 即可訪問清華大學(xué)開源軟件鏡像站甘萧。
  2. 根據(jù)你想要的TensorFlow的版本萝嘁,那么只需要修改tensorflow-1.7.0-cp36-none-linux_x86_64.whl
    比如,我要TensorFlow-1.0.1版本扬卷,那么上面官網(wǎng)地址就修改為:
sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.0.1-cp27-none-linux_x86_64.whl

如果你用python3.5, 那么在tensorflow-1.0.1后面把cp27該為cp35-cp35m,下載命令就變?yōu)椋?/p>

sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.0.1-cp35-cp35m-none-linux_x86_64.whl
  1. 如果改動不成功或者你不是Linux系統(tǒng)牙言,那么請參考鏈接(以鏈接中的地址為主):

https://mirrors.tuna.tsinghua.edu.cn/help/tensorflow/

七: 測試

上面步驟都完成后進入測試:

>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print sess.run(hello)
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print sess.run(a+b)
42

錯誤解決方案

軟鏈接出錯

發(fā)現(xiàn)這一步出錯的主要原因是您安裝的cuda或cudnn版本引起的
可能會報如下錯誤:

Couldn't open CUDA library libcudnn.so. LD_LIBRARY_PATH:

這說明找不到文件 libcudnn.so ,這個文件其實是個軟鏈接來著怪得,他指向另外一個軟件咱枉。
注意:這里有必要解釋一下cuda和cudnn這兩個文件。我們解壓出來的lib64下面有3個so文件徒恋。分別是 libcudnn.so 和 libcudnn.so.5以及 libcudnn.so.5.1.12文件(當(dāng)然蚕断,讀者你的文件跟我不相同的概率很大,不過不要僅因谎,下面會教你怎么修改軟鏈接)基括,并且這3個點so文件大小都一樣。其實都是軟連接财岔!libcudnn.so鏈接到libcudnn.so.5风皿,而libcudnn.so.5.又鏈接到libcudnn.so.5.1.12。 正真的文件只有l(wèi)ibcudnn.so.5.1.12匠璧,因此我們要將/usr/local/lib64下的以前的這樣的鏈接替換掉桐款。由于裝cuda時,比如我裝的是cuda8.0夷恍,那么在/usr/local/下會生成cuda-8.0文件夾魔眨,以及一個cuda文件夾,cuda是軟鏈接到cuda-8.0的酿雪,所以這兩個文件夾可以看成一個遏暴。往任意一個文件夾中添加?xùn)|西,另一個文件夾都會有相同的東西指黎。

> cd /usr/local/cuda/lib64 
> ll libcudnn*

出現(xiàn):

> lrwxrwxrwx 1 root root   13 3月   5 12:45 libcudnn.so -> libcudnn.so.5
> lrwxrwxrwx 1 root root   18 3月   5 14:38 libcudnn.so.5 ->libcudnn.so.5.1.10
> -rwxr-xr-x 1 root root  81M 3月   5 14:18 libcudnn.so.5.1.12
> -rw-r--r-- 1 root root 138M 3月   5 14:28 libcudnn_static.a

從上面可以看出朋凉,libcudnn.so 文件最終指向libcudnn.so.5.1.12
所以,我們要刪去原來的軟鏈接醋安,重寫加上正確的軟鏈接

> sudo rm libcudnn.so.5 libcudnn.so.5.1.10 
> sudo ln -s libcudnn.so.5.1.12 libcudnn.so.5

再次查看:

ll libcudnn*

lrwxrwxrwx 1 root root   13 3月   5 12:45 libcudnn.so -> libcudnn.so.5
lrwxrwxrwx 1 root root   18 3月   5 14:38 libcudnn.so.5 -> libcudnn.so.5.1.10
-rwxr-xr-x 1 root root  81M 3月   5 14:18 libcudnn.so.5.1.10

多個cuda版本下可能會報的錯

tensorflow-gpu is not working with Blas GEMM launch failed

InternalError (see above for traceback): Blas GEMM launch failed : a.shape=(1, 5), b.shape=(5, 10), m=1, n=10, k=5
     [[Node: layer1/MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](_arg_Placeholder_0_0/_11, layer1/weights/read)]]
     [[Node: layer2/MatMul/_17 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/cpu:0", send_device="/job:localhost/replica:0/task:0/gpu:0", send_device_incarnation=1, tensor_name="edge_158_layer2/MatMul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/cpu:0"]()]]

檢查這個錯誤首先先確定是不是真的顯卡不夠杂彭,被其他程序占去了大部分墓毒,如果是,可以適當(dāng)分配少量的顯卡給tensorflow

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

如果你顯卡內(nèi)存剩于挺多的亲怠,那么可能是你在配置多版本cuda時沒有清空之前cuda的緩存:

sudo rm -rf ~/.nv/     # 完美解決

可能會用到的操作

gcc版本降級

Ubuntu 16.04的gcc編譯器是5.4.0所计,然而CUDA 8.0不支持5.0以上的編譯器,因此需要降級团秽,把編譯器版本降到4.9主胧。命令如下:

sudo apt-get install g++-4.9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30
sudo update-alternatives --set cc /usr/bin/gcc
sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30
sudo update-alternatives --set c++ /usr/bin/g++

查看Ubuntu 16.04的Kernel,GCC和GLIBC的版本信息徙垫。

Kernel:

uname -sr #或 uname -r

GCC

gcc -v #或 gcc --version

GLIBC

$ ldd --version

參考網(wǎng)址

http://blog.csdn.net/tianrolin/article/details/52830422
http://blog.csdn.net/u012581999/article/details/52433609
https://www.cnblogs.com/mydebug/p/4972276.html
http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html
https://www.tensorflow.org/versions/r0.11/get_started/os_setup.html#optional-install-cuda-gpus-on-linux
https://zhuanlan.zhihu.com/p/33307112
http://blog.csdn.net/chcoolbeeboy/article/details/78110914
https://zhuanlan.zhihu.com/p/33307112
https://www.cnblogs.com/wangduo/p/7383989.html
https://www.tensorflow.org/install/#optional-install-cuda-gpus-on-linux
http://blog.csdn.net/s2010241013/article/details/55656248
https://www.cnblogs.com/apak/p/8410618.html
https://www.tensorflow.org/install/install_linux
https://mirrors.tuna.tsinghua.edu.cn/help/tensorflow/
http://blog.csdn.net/u014516389/article/details/72818155
http://blog.csdn.net/hungryof/article/details/52746279

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末讥裤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子姻报,更是在濱河造成了極大的恐慌己英,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吴旋,死亡現(xiàn)場離奇詭異损肛,居然都是意外死亡,警方通過查閱死者的電腦和手機荣瑟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門治拿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人笆焰,你說我怎么就攤上這事劫谅。” “怎么了嚷掠?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵捏检,是天一觀的道長。 經(jīng)常有香客問我不皆,道長贯城,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任霹娄,我火速辦了婚禮能犯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘犬耻。我一直安慰自己踩晶,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布枕磁。 她就那樣靜靜地躺著合瓢,像睡著了一般。 火紅的嫁衣襯著肌膚如雪透典。 梳的紋絲不亂的頭發(fā)上晴楔,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天,我揣著相機與錄音峭咒,去河邊找鬼税弃。 笑死,一個胖子當(dāng)著我的面吹牛凑队,可吹牛的內(nèi)容都是我干的则果。 我是一名探鬼主播,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼漩氨,長吁一口氣:“原來是場噩夢啊……” “哼西壮!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起叫惊,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤款青,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后霍狰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體抡草,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年蔗坯,在試婚紗的時候發(fā)現(xiàn)自己被綠了康震。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡宾濒,死狀恐怖腿短,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情绘梦,我是刑警寧澤橘忱,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站谚咬,受9級特大地震影響鹦付,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜择卦,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一敲长、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧秉继,春花似錦祈噪、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至杠茬,卻和暖如春月褥,著一層夾襖步出監(jiān)牢的瞬間弛随,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工宁赤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留舀透,地道東北人。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓决左,卻偏偏與公主長得像愕够,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子佛猛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354