一. 前提
多GPU交互在神經網絡是常見的薄辅,所以在安裝caffe之前需要安裝NCCL,來保證多GPU之間的相互交流摄闸。
多GPU禁漓,這里指的是2個及2個以上英偉達顯卡,而不是筆記本中的集顯和獨顯忧侧。
二.安裝NCCL
**1.下載編譯 **
shell終端
cd nccl
make CUDA_HOME=/user/local/cuda-7.5 test #注意自己的cuda路徑
2.測試和配置環(huán)境變量
shell終端
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./build/lib
./build/test/single/all_reduce_test
./build/test/single/all_reduce_test 10000000
make install
注:make install 是自己添加石窑,而官方原文沒有。之所以這么加是因為在caffe 執(zhí)行 cmake時候蚓炬,cmake無法找到
非deb安裝軟件的路徑松逊,所以添加make install 是為了能讓cmake識別到路徑。
三.安裝caffe
安裝依賴&下載caffe (略)
編譯
cp Makefile.config.example Makefile.config
gedit Makefile.config
打開文本后肯夏,作出如下修改
取消下面這些話的前面注釋符號#
USE_CUDNN := 1
USE_NCCL := 1
ANACONDA_HOME := $(HOME)/anaconda #這里我們使用Anaconda環(huán)境下的python
PYTHON_INCLUDE := $(ANACONDA_HOME)/include \
$(ANACONDA_HOME)/include/python2.7 \
$(ANACONDA_HOME)/lib/python2.7/site-packages/numpy/core/include \
PYTHON_LIB := $(ANACONDA_HOME)/lib
在下面這些語句中加上#注釋符號
#PYTHON_INCLUDE := /usr/include/python2.7 \
# /usr/lib/python2.7/dist-packages/numpy/core/include
#PYTHON_LIB := /usr/lib
保存经宏,退出,編譯caffe
sudo pip install -r caffe/python/requirements.txt
cd caffe
mkdir build
cd build
make all -j
make install -j
make runtest -j