1.軟件包下載
從https://github.com/intel/MLSL/releases中進(jìn)行下載。我使用的root權(quán)限的安裝,所以下載的是intel-mlsl-devel-64-2017.2-018.x86_64.rpm與PUBLIC_KEY.PUB。下載完成之后可以直接導(dǎo)入虛擬機(jī)的文件夾中报咳。
2.安裝MLSL軟件包
先進(jìn)入放rpm文件與pub文件的文件夾中起意。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
然后導(dǎo)入PUBLIC_KEY.PUB,命令如下: ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
rmp --import PUBLIC_KEY.PUB ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
接著便是mlsl的安裝語(yǔ)句齿风,命令如下: ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
rpm -i intel-mlsl-devel-64-2017.2-018.x86_64.rpm
在默認(rèn)情況下mlsl會(huì)被安裝在如下路徑/opt/intel/mlsl_2017.2-018
3.使用MLSL
需要首先設(shè)置intel的mlsl環(huán)境
source /opt/intel/mlsl_2017.2-018/intel64/bin/mlslvars.sh
然后需要編譯,編譯只需要直接進(jìn)入opt/intel/mlsl_2017.2-018/test文件中然后make便可成功
make
make成功之后會(huì)出現(xiàn)一個(gè)運(yùn)行文件也就是mlsl_test绑洛,接下來(lái)就是運(yùn)行:
# use data parallelism
mpirun -n 8 -ppn 1 ./mlsl_test 1
# use model parallelism
mpirun - n 8 -ppn 1 ./mlsl_test 8
# use hybrid parallelism, enable distributed weight update
mpirun -n 8 -ppn 1 ./mlsl_test 2 1
在運(yùn)行過(guò)程中我遇到的問(wèn)題如下:
[proxy:0:0@knl03] HYDU_create_process (../../utils/launch/launch.c:825): execvp error on file –n (No such file or directory)
解決辦法就是將運(yùn)行文件刪除然后在進(jìn)行重新編譯救斑,可以使用make也可以使用mpicc -o mlsl_test mlsl_test.cpp≌嫱停或者可以先去opt/intel/mlsl_2017.2-018目錄下的example先運(yùn)行一下example脸候,同樣先使用make進(jìn)行編譯然后在用mpirun進(jìn)行運(yùn)行
最后的運(yùn)行結(jié)果如下圖: