終于安裝配置完成了ubuntu+docker+tensorflow-gpu+jupyter的全部環(huán)境
總體過程挺曲折灰追,花費了近一周的業(yè)余時間梳码,但是邊學(xué)邊干也拜,安裝的過程也是學(xué)習(xí)的過程鸳玩,收獲很大
本文記錄一下最雜亂的地方植锉,就是nvidia-docker的安裝绳泉,本身安裝不難,雜亂是因為nvidia-docker有好幾個版本,最新版nvidia-container-toolkit的資料相當(dāng)少
最新版的nvidia-docker就是nvidia-container-toolkit衫樊,比nvidia-docker2更加優(yōu)秀。官方的解釋是"Usage of nvidia-docker2 packages are deprecated since NVIDIA GPUs are now natively supported as devices in the Docker runtime"。(機(jī)翻:不贊成使用nvidia-docker2包科侈,因為nvidia GPU現(xiàn)在在Docker運行時本機(jī)作為可支持設(shè)備)
nvidia-container-toolkit需要主機(jī)已安裝當(dāng)前新版的docker 19.03
使用nvidia-container-toolkit的最大優(yōu)點:linux主機(jī)不需要安裝cuda和cudnn载佳,僅安裝顯卡驅(qū)動即可(tensorflow和nvidia-docker官方均強(qiáng)調(diào)這一點)
我的系統(tǒng)配置:
OS:Ubuntu18.04 64 bit(直接用‘軟件和更新’安裝顯卡驅(qū)動)
顯卡:NVidia GTX 20**
docker ce v19.03
image:tensorflow/tensorflow:latest-gpu-py3(tf2.1-gpu,python3.6.9)
安裝過程:
從終端運行docker
#Add the package
repositoriesdistribution=$(. /etc/os-release;echo$ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey|sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list|sudo tee /etc/apt/sources.list.d/nvidia-docker.listsudo
apt-get update&&sudo apt-get install -y nvidia-container-toolkitsudo
systemctl restart docker
#安裝完畢
#新開tf-gpu容器
sudo docker run --gpus all -it ImageName bash
# --gpus all意思是使用所有g(shù)pu進(jìn)行加速臀栈,很多深度學(xué)習(xí)的主機(jī)有多個gpu
#在python中驗證gpu是否生效
>>> import tensorflow as tf
>>> tf.config.list_physical_devices('GPU')
輸入如下:
[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
安裝完成
nvidia-docker官方github蔫慧,特別值得參考:https://github.com/NVIDIA/nvidia-docker