零揍鸟、環(huán)境準(zhǔn)備
git下載:https://git-for-windows.github.io/
MINGW下載:http://www.mingw.org/
Tensorflow源碼下載:git clone https://github.com/tensorflow/tensorflow/tree/r1.3
cmake for windows:https://cmake.org/download/
swig(python for c++ interface):http://www.swig.org/download.html
Visual Studio 2015:
Anaconda 4.2.0(此版本非最新版本,之所以使用是因?yàn)槠淠J(rèn)python版本為3.5.2):https://www.anaconda.com/download/
Numpy:https://www.scipy.org/scipylib/download.html
一、安裝CUDA
0. 首先需要在cuda-gpus檢查電腦的GPU是否支持cuda編程,要求Compute Capability 3.0及以上爷恳。
1. 安裝Visual Studio 2015(需要在CUDA之前安裝好)
2. 安裝CUDA toolkit 8.0(推薦下載離線版本)
3. 解壓下載好的cuDNN,將其中的 bin耕陷、include、lib 覆蓋到CUDA的安裝目錄
二然想、安裝tensorflow-gpu
1. 安裝anaconda
2. 進(jìn)入python3.5環(huán)境,通過以下命令安裝tensorflow-gpu:
pip install --ignore-installed --upgrade tensorflow-gpu
3. 如果遇到各種lib欣范、dll缺失的問題变泄,可以嘗試通過添加對應(yīng)的路徑到path中來解決
在CUDA_PATH后面添加bin和lib\x64路徑
將cudnn64_7改為cudnn64_6
4. 測試代碼
如下:
#Creates a graph.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
#Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
#Runs the op.
print sess.run(c)
三、編譯tensorflow-gpu
官方只提供了Ubuntu和Mac OS X的編譯支持恼琼,在Windows下可以通過Bazel和CMake兩種方式進(jìn)行編譯妨蛹,但只是 “highly experimental”,可能會(huì)遇到各種錯(cuò)誤晴竞。下面使用CMake來進(jìn)行編譯蛙卤。
0. 進(jìn)行編譯之前安裝一下軟件:
Cmake 3.5以上
Git
swig
Windows下的額外要求:
Visual Studio 2015
Python 3.5
Numpy 1.11.0 or later
1. 設(shè)置環(huán)境變量
進(jìn)入目錄 C:\Program Files (x86)\Microsoft Visual Studio version\VC\,運(yùn)行命令 vcvarsall amd64颓鲜,從64位命令行編譯到64位的目標(biāo)平臺(tái)表窘。執(zhí)行這一步可以避免編譯的時(shí)候出現(xiàn)內(nèi)存不足的錯(cuò)誤。
將CUDA dlls和cuDNN dll添加到環(huán)境變量:
NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin
cudnn-8.0-windows7-x64-v7\cuda\bin
將Cmake和git添加到環(huán)境變量
CMake\bin
2. 下載 Tensorflow源代碼, 在其中的 tensorflow\tensorflow\contrib\cmake 目錄下新建 build 目錄甜滨,用于存放編譯結(jié)果乐严。
D:\temp> git clone https://github.com/tensorflow/tensorflow.git
D:\temp> cd tensorflow\tensorflow\contrib\cmake
D:\temp\tensorflow\tensorflow\contrib\cmake> mkdir build
D:\temp\tensorflow\tensorflow\contrib\cmake> cd build
D:\temp\tensorflow\tensorflow\contrib\cmake\build>
3. 調(diào)用cmake來產(chǎn)生Visual Studio solution 和project files.
D:\...\build> cmake .. -A x64 -DCMAKE_BUILD_TYPE=Release ^
More? -DSWIG_EXECUTABLE=C:/tools/swigwin-3.0.10/swig.exe ^
More? -DPYTHON_EXECUTABLE=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/python.exe ^
More? -DPYTHON_LIBRARIES=C:/Users/%USERNAME%/AppData/Local/Continuum/Anaconda3/libs/python35.lib
如果有NVIDIA顯卡,且安裝好了cuDNN,那么可以添加以下參數(shù):
More? -Dtensorflow_ENABLE_GPU=ON ^
More? -DCUDNN_HOME="D:\...\cudnn"
4. 調(diào)用MSBiuld來編譯Tensorflow
使用以下命令產(chǎn)生.whl文件
D:\...\build> MSBuild /p:Configuration=Release tf_python_build_pip_package.vcxproj
遇到的問題:
error C2001: newline in constant
打開對應(yīng)的文件發(fā)現(xiàn)出現(xiàn)了亂碼衣摩,google之后發(fā)現(xiàn)可以通過修改locale為 英語(美國) 來解決昂验。
編譯過程中下載失敗或者 git clone緩慢
使用命令 nslookup 查找失效ip(github.global.ssl.fastly.net,storage.googleapis.com等)捂敌,修改host文件。完了之后 ipconfig /flushdns既琴。當(dāng)然也可以嘗試手動(dòng)下載到對應(yīng)的目錄占婉。
參考guide:
https://github.com/tensorflow/tensorflow/tree/r1.3/tensorflow/contrib/cmake
http://blog.csdn.net/DawnRanger/article/details/77755412
http://blog.csdn.net/xingwei_09/article/details/72822360