吐槽
RTX3060出來(lái)已經(jīng)有一段時(shí)間了吟榴,但是tensorflow配置教程來(lái)說(shuō)相對(duì)較少耘婚,之前筆者直接使用conda命令安裝了tensorflow2.1.0版本梯嗽,測(cè)試gpu是否可用時(shí)欣范,顯示的是可用,且代碼也可以運(yùn)行秋麸,不會(huì)報(bào)錯(cuò)(jupyter上運(yùn)行的,pycharm上沒(méi)有試過(guò))炬太。但訓(xùn)練模型時(shí)灸蟆,val_loss一直都很大,不是幾位數(shù)亲族,是十多二十位數(shù)的損失炒考,且訓(xùn)練出來(lái)的模型一直是一條沒(méi)有變化的直線可缚。起初一直認(rèn)為是模型的原因,后來(lái)發(fā)現(xiàn)同樣的環(huán)境(tensorflow斋枢、python等等版本都相同)帘靡,在其它電腦上完美運(yùn)行,控制變量法就是顯卡的鍋瓤帚。
1.版本關(guān)系
直接說(shuō)版本關(guān)系吧描姚!
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?tensorflow2.4.1 + cuda11.1 + cudnn8.0.5
和同學(xué)交流一下,RTX3090同樣適合該版本戈次。
2.cuda下載轩勘、安裝
RTX3060需要cuda11.1進(jìn)行驅(qū)動(dòng),但是使用conda install tensorflow-gpu時(shí)怯邪,不會(huì)安裝cuda11.1(pip聽(tīng)說(shuō)也不行绊寻,但是我沒(méi)試過(guò)),所以cuda11.1需要在官網(wǎng)上手動(dòng)下載悬秉,然后手動(dòng)進(jìn)行安裝榛斯。cuda下載:https://developer.nvidia.com/cuda-toolkit-archive,在里面選擇cuda11.1
根據(jù)自己電腦配置選搂捧,然后點(diǎn)下載驮俗。
下載完成后推薦安裝就可以了,安裝位置默認(rèn)允跑。
3.Cudnn下載王凑、安裝
還是直接官網(wǎng)下載就可以了,不過(guò)需要注冊(cè)個(gè)賬號(hào)聋丝,用qq郵箱注冊(cè)就可以了索烹,要是登錄不進(jìn)去換個(gè)號(hào)試試,還是不行就在網(wǎng)上找找有沒(méi)有cudnn8.0.5的包可以直接下載弱睦。cudnn下載網(wǎng)址:https://developer.nvidia.com/cudnn百姓,下載解壓完成后,就是三個(gè)文件夾+一個(gè)txt
將cudnn里面的三個(gè)文件夾復(fù)制到cuda安裝目錄况木,然后全部替換掉垒拢。cuda默認(rèn)安裝話,安裝目錄如下圖:
4.環(huán)境變量配置
下面是環(huán)境變量配置火惊,在系統(tǒng)中添加以下 5個(gè) 環(huán)境變量:
CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1? ? ? ? ? ? ?(cuda默認(rèn)安裝的話就是這個(gè)路徑)
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
在環(huán)境變量Path中添加:
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\common\lib\x64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib\x64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.1\bin\win64
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin
5.tensorflow安裝
首先安裝anaconda求类,安裝教程網(wǎng)上很多,此處不再贅述屹耐。
點(diǎn)擊開(kāi)始按鈕尸疆,在開(kāi)始中找到anaconda,選中anaconda Prompt(anaconda3)
在prompt中輸入命令,新建一個(gè)名為tf的虛擬環(huán)境寿弱,(tf為虛擬環(huán)境名稱(chēng)犯眠,可以隨便改)
conda create -n tf python==3.7.9
虛擬環(huán)境建立完成后,在命令框中輸入activate tf症革,就切換到了tf環(huán)境下
此時(shí)輸入命令pip install tensorflow-gpu==2.4.1
接下來(lái)就是漫長(zhǎng)的安裝等待阔逼,(要是你有科學(xué)上網(wǎng)工具可能快一點(diǎn),但是有可能需要先將pip降低版本地沮,之前我pip版本是20.1.0嗜浮,我使用命令python -m pip install pip==20.0.1 降低了pip版本),安裝完成后摩疑,關(guān)閉危融。
6.測(cè)試
筆者是在pycharm上運(yùn)行的,(記得將pycharm下工程的解釋器選擇到tf環(huán)境下雷袋,pycharm使用就不講了)吉殃,測(cè)試程序?yàn)椋?/p>
import tensorflowas tf
tf.config.list_physical_devices('GPU')
若輸出為下面:
有個(gè)警告Could not load dynamic library 'cusolver64_10.dll'; dlerror: cusolver64_10.dll not found,直接進(jìn)入到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin找到cusolver64_11.dll楷怒,將其重命名為cusolver64_11.dll就可以了蛋勺。(如果沒(méi)有cusolver64_11.dll,同理鸠删,找到前綴相同的抱完,把后面替換為10),完成后再運(yùn)行測(cè)試程序:
至此刃泡,安裝完成G捎椤!烘贴!