配置深度學(xué)習(xí)主機(jī)與環(huán)境(TensorFlow+1080Ti):
(二)Win10&Ubuntu雙系統(tǒng)與顯卡驅(qū)動(dòng)安裝
一. 硬件選購(gòu)
研究需求偷仿,遂組裝一臺(tái)全新的計(jì)算機(jī)晾剖,安裝Ubuntu汰蓉,用來運(yùn)行TensorFlow崔拥,同時(shí)保留Win10漫玄,方便其他其他場(chǎng)合使用柳骄。因?yàn)橛布聯(lián)Q代很快是掰,各種網(wǎng)絡(luò)結(jié)構(gòu)也層出不窮复凳。因此丽啡,考慮使用多顯卡來提升系統(tǒng)的計(jì)算能力是有必要的∧庇遥現(xiàn)階段,主要購(gòu)買單塊顯卡實(shí)現(xiàn)整個(gè)系統(tǒng)的搭建补箍,同時(shí)保留拓展(多顯卡)空間改执。
硬件清單如下:
以上配置總共花費(fèi)24173.1元人民幣,購(gòu)買時(shí)間主要在6月底7月初坑雅,沒能趕上京東618的活動(dòng)辈挂,順便不幸的碰到了顯卡缺貨,所以價(jià)格上僅供參考裹粤。
1. 主板
因?yàn)榭紤]到系統(tǒng)有可能拓展四塊顯卡鞍匾,因此主板首先需要支持4-Way NVIDA SLI功能故黑,通常單塊顯卡占用16條PCIE通道阵具,四塊顯卡則需要16*4=64條PCIE通路,而常見的i7處理器中的高端型號(hào)最高只有40條PCIE通道噪叙,因此理論上的處理方法是需要使用兩塊CPU實(shí)現(xiàn)雙通道處理。京東上就有使用雙路E5配合4路1080Ti所搭建的深度學(xué)習(xí)主機(jī)霉翔。
在不考慮雙路CPU的情況下睁蕾,要想實(shí)現(xiàn)16*4PCIE通路,目前只有Asus X99-E WS/USB 3.1唯一一塊主板可以實(shí)現(xiàn)PCIE通路的拓展债朵。
上圖是主板說明書中的一頁子眶,顯示主板共有7條PCIE接口。使用四塊顯卡序芦,分別放置于1壹店、3、5芝加、7號(hào)PCIE接口硅卢,可以實(shí)現(xiàn)4*16條PCIE通道。具體實(shí)現(xiàn)我并不是特別清楚藏杖,但是在我的深度學(xué)習(xí)工作站攢機(jī)過程記錄中将塑,作者也同樣詢問過這個(gè)問題:
2. 中央處理器 CPU
為適配主板型號(hào),CPU為L(zhǎng)GA2011-v3系列蝌麸,同時(shí)支持最高40條PCIE通道点寥。因?yàn)橄到y(tǒng)主要使用顯卡進(jìn)行計(jì)算,因此對(duì)CPU的要求并不是很高来吩。Tim Dettmers在其Blog:A Full Hardware Guide to Deep Learning中提到CPU的核心數(shù)并不重要敢辩,擁有相對(duì)較高的主頻即可。
CPU:Two threads per GPU; full 40 PCIe lanes and correct PCIe spec (same as your motherboard); > 2GHz; cache does not matter;
最后決定在i7-5930K和i7-6850K中二選一弟疆,價(jià)格差距不大戚长,遂選擇主頻較高的i7-6850K。
注意:i7-6850K是不帶核顯的怠苔,裝機(jī)前期顯卡還沒到同廉,特地借了一張點(diǎn)亮卡用來檢測(cè)裝機(jī)情況。
各型號(hào)處理器具體參數(shù)可以在Intel官方網(wǎng)站查詢與對(duì)比柑司。
3. 顯卡 GPU
并非所有的顯卡都支持CUDA迫肖,實(shí)際上僅有部分Nvidia高端顯卡才支持,具體支持列表可前往Nvidia查詢攒驰。
目前10系顯卡橫空出世蟆湖,基本上深度學(xué)習(xí)主機(jī)主要可選為:Titan Xp、1080Ti玻粪、Titan隅津、1060與Tesla系列诬垂,深度學(xué)習(xí)模型對(duì)參數(shù)精度要求并不高,因此除非土豪饥瓷,可以排出Tesla系列顯卡剥纷。在金錢允許但非土豪的情況下痹籍,1080Ti是目前最佳的選擇呢铆。在顯卡的選購(gòu)過程中,肯定會(huì)遇到公版與非公版的選擇問題蹲缠。雖然非公版的散熱較好棺克,且自帶超頻,但考慮到系統(tǒng)的穩(wěn)定性與兼容性线定,建議還是選擇公版顯卡娜谊。另外非公版顯卡還可能會(huì)遇到顯卡太厚主板放不下的問題。
在顯卡的購(gòu)買過程中正好遇到了顯卡慌斤讥,京東上所有自營(yíng)的商家全部缺貨纱皆,剩下的部分顯卡都在6500~7000RMB左右。不得已選擇上淘寶代購(gòu)芭商,結(jié)果大部分代購(gòu)商家都拿不到貨派草,難怪大家都盼望著礦難。另外海淘顯卡推薦選擇EVGA铛楣,在臺(tái)灣有維修點(diǎn)近迁,方便保修。?
以下圖表和建議簸州,來自于Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning:
Best GPU overall (by a small margin): Titan Xp
Cost efficient but expensive:?GTX 1080 Ti, GTX 1070, GTX 1080
Cost efficient and cheap:? GTX?1060 (6GB)I work with data sets > 250GB: GTX Titan X (Maxwell), NVIDIA Titan X Pascal, or NVIDIA Titan Xp
I have little?money: GTX 1060 (6GB)
I have almost no money:?GTX 1050 Ti (4GB)
I do Kaggle:?GTX 1060 (6GB) for any “normal” competition, or GTX 1080 Ti?for “deep learning competitions”
I am a competitive computer vision researcher: NVIDIA Titan Xp; do not upgrade from existing Titan X (Pascal or Maxwell)
I am a researcher:?GTX 1080 Ti. In some cases, like natural language processing, a GTX 1070 or GTX 1080 might also be a solid choice — check the memory requirements of your current modelsI want to build a GPU cluster:This is really complicated, you can get some ideashereI started deep learning and I am serious about it:?Start with a GTX 1060 (6GB). Depending of what area you choose next (startup, Kaggle, research, applied deep learning) sell your GTX 1060 and buy something more appropriate
I want to try deep learning, but I am not serious about it:?GTX 1050 Ti (4 or 2GB)
4. 機(jī)箱
選擇Tim Dettmers與NVIDIA? DIGITS? DevBox同款機(jī)箱鉴竭,被大多數(shù)深度學(xué)習(xí)用戶所采用。
5. 電源
建議不要在電源上省錢岸浑,主機(jī)可能24小時(shí)運(yùn)行搏存,穩(wěn)定性最重要。1600w對(duì)付4塊1080Ti足以矢洲。另外:Nvidia DevBox 用的是 EVGA 1600W 80+ Gold 120-G2-1600-X1祭埂,比我買的鈦金便宜點(diǎn)。
6. 散熱
在風(fēng)冷和水冷的選擇上糾結(jié)了很久兵钮,總擔(dān)心水冷過保之后會(huì)漏水蛆橡,最終還是選擇了風(fēng)冷。直接選擇京東上貓頭鷹最貴的一款(NOCTUA NH-D15 CPU散熱器)掘譬,后期使用情況看泰演,散熱不錯(cuò),噪音也不大葱轩。
如果選擇水冷的話建議將冷排安裝在AIR540機(jī)箱的頂端睦焕,這樣可以避免頂端進(jìn)灰藐握。
7. 內(nèi)存
i7-6850K默認(rèn)主頻2400MHz,開啟XMP之后垃喊,自動(dòng)超頻為3200MHz猾普。因此建議購(gòu)買DDR4 3200MHz內(nèi)存條。
XMP是Extreme Memory Profile的縮寫本谜,是Intel在2007年9月提出的內(nèi)存認(rèn)證標(biāo)準(zhǔn)初家,適用于DDR3和DDR4。
為了統(tǒng)一行業(yè)內(nèi)的超頻數(shù)值標(biāo)準(zhǔn)乌助,而不讓各個(gè)內(nèi)存廠商隨意設(shè)定更高的內(nèi)存頻率數(shù)值寫入到SPD溜在,英特爾提出了XMP認(rèn)證標(biāo)準(zhǔn)。通過XMP認(rèn)證的內(nèi)存會(huì)在內(nèi)存地址176 ~ 254中記錄內(nèi)存的速度設(shè)定他托,最多可以保存2組設(shè)定值掖肋。廠商們?nèi)缧枰玫絏MP的認(rèn)證,就必須把內(nèi)存及該設(shè)定送交Intel測(cè)試赏参,通過后就會(huì)給予認(rèn)證志笼。
通過XMP認(rèn)證后,其SPD中除了預(yù)設(shè)普通頻率數(shù)值的SPD值外把篓,還寫入了更高頻率設(shè)定的SPD纫溃。這個(gè)更高頻率的設(shè)定配合支持XMP的主板后可以被啟用,從而將內(nèi)存超頻提升性能纸俭。
簡(jiǎn)單的說皇耗,通過了英特爾XMP認(rèn)證的內(nèi)存,SPD中有兩個(gè)或更多頻率設(shè)定檔案揍很,只要在主板中啟用這些預(yù)設(shè)的XMP檔案郎楼,即可將內(nèi)存條自動(dòng)超頻到3200或更高值(根據(jù)檔案設(shè)定而定)。
XMP與手動(dòng)超頻效果基本無異窒悔,所以可將其看作為內(nèi)存的自動(dòng)超頻技術(shù)呜袁。
8. 顯示器
顯示器就是生產(chǎn)力。
9. 鼠鍵
建議購(gòu)買無線鼠鍵简珠,可以離機(jī)箱遠(yuǎn)遠(yuǎn)的阶界。
注意:在系統(tǒng)點(diǎn)亮之后可能無法識(shí)別無線鼠鍵,建議在點(diǎn)亮階段使用有線鼠鍵聋庵。
10. 存儲(chǔ)
若訓(xùn)練集龐大膘融,建議購(gòu)買較大的SSD,HDD可用來倉儲(chǔ)祭玉。假如需要安裝雙系統(tǒng)氧映,建議SSD 512G,HDD可以用來當(dāng)作Win10和Ubuntu的公共掛載盤脱货。
二. 主機(jī)組裝
計(jì)算機(jī)組裝應(yīng)該是整個(gè)搭建過程中最簡(jiǎn)單的部分了岛都,雖然我之前從來沒有組裝過電腦律姨。
第一步將CPU(注意方向)、RAM臼疫、SSD(M.2 Nvme)安裝到主板上择份,將主板附送的主機(jī)后置面板安裝到機(jī)箱上。
第二步將將散熱安裝到CPU上烫堤,放到機(jī)箱中荣赶,確定散熱器風(fēng)道方向與散熱器的位置,以免放不下塔逃。
第三步涂硅脂讯壶,重新將確定好位置的風(fēng)扇安裝到CPU上料仗。
第四部將主板固定到機(jī)箱上湾盗,注意機(jī)箱上的銅柱不多也不少,避免主板下面有空余的銅柱而導(dǎo)致主板短路立轧。
第五步將GPU和其他pcie接口設(shè)備安裝到主板與機(jī)箱上格粪,安裝磁盤陣列到機(jī)箱內(nèi),安裝電源模塊氛改。
第六步接線帐萎。
關(guān)于組裝電腦的相關(guān)資料如下:
1. 知乎:如何配組裝電腦?
三. 參考資料:
1. 知乎:如何配置一臺(tái)適用于深度學(xué)習(xí)的工作站胜卤?
2. 我的深度學(xué)習(xí)工作站攢機(jī)過程記錄
3. 我愛自然語言處理:深度學(xué)習(xí)主機(jī)攢機(jī)小記
4. 深度 | 從硬件配置到軟件安裝疆导,一臺(tái)深度學(xué)習(xí)機(jī)器的配備指南
5. 小白在閉關(guān):搭建一臺(tái)用于深度學(xué)習(xí)的工作站