苦于學(xué)校的cluster遲遲排不上隊(duì)伍拯欧,我的lab member有一臺(tái)Alienware m17r4想整上deep learning 工作站向我跟海寶求助籽懦。我跟她建議和我們家自己散裝的工作站一樣,買(mǎi)一塊獨(dú)立的硬盤(pán)添加到電腦背面漓滔,作為ubuntu server的系統(tǒng)盤(pán)编饺。于是,我們參考了b站視頻 外星人Alienware M17 R4 筆記本固態(tài)加裝教程响驴!新人up的第一次拆機(jī)透且,加裝配件!
學(xué)會(huì)了怎么拆機(jī)踏施,加裝固態(tài)石蔗。我們建議她立刻在amazon上立刻購(gòu)買(mǎi)Dell的散熱片 (散熱馬甲:戴爾官方,鏈接)畅形。
她去bestbuy購(gòu)買(mǎi)了三星970 EVO Plus (1T)。
萬(wàn)事俱備后诉探,我們一塊把電腦拆了日熬,發(fā)現(xiàn)我們家的螺絲刀都不好用,于是派出我們的男友們晚上去walmart購(gòu)買(mǎi)萬(wàn)能螺絲刀(大概15刀)肾胯,終于能夠把所有的釘子都能拆下來(lái)了(淚目)竖席。我們按照視頻教程耘纱,拆掉螺絲,打開(kāi)后蓋毕荐,拔掉了電源線束析,擰開(kāi)固態(tài)硬盤(pán)螺絲,插入固態(tài)硬盤(pán)憎亚,接上固態(tài)硬盤(pán)螺絲员寇。一開(kāi)始沒(méi)有加散熱片因?yàn)閘easing office關(guān)門(mén)了,暫時(shí)拿不到第美,我們是第二天又拆機(jī)補(bǔ)加的蝶锋。
以下是裝ubuntu和nvidia driver的痛苦之旅:
首先,我們開(kāi)始安裝ubuntu20.0什往。我們已經(jīng)用U盤(pán)提前做好了Ubuntu 20.0 desktop系統(tǒng)盤(pán)扳缕。 在選盤(pán)的時(shí)候,我們直接選擇新的空盤(pán)去裝ubuntu系統(tǒng)别威,而沒(méi)有選擇與win和諧共處躯舔,也就是說(shuō),我們要使得兩個(gè)盤(pán)完全獨(dú)立省古,這樣雙系統(tǒng)系統(tǒng)不會(huì)影響對(duì)方庸毫。Ubuntu安裝完畢之后,拔掉U盤(pán)衫樊,按enter鍵重啟電腦飒赃。
在重啟的時(shí)候,會(huì)進(jìn)入grub登陸界面科侈,此時(shí)需要按e進(jìn)入grub edit界面载佳。在該界面,我們需要在quiet 后面添加 nomodeset臀栈,這是為了防止nouveou 影響顯卡的使用蔫慧,詳細(xì)信息請(qǐng)看 what doest nomodeset
do?。于是权薯,我們能夠正常進(jìn)入系統(tǒng)姑躲。
然后,我們開(kāi)始安裝顯卡驅(qū)動(dòng)盟蚣,一開(kāi)始黍析,我們采用的是ubuntu系統(tǒng)自帶的可視化顯卡驅(qū)動(dòng)安裝方式,后來(lái)我們采用命令行裝屎开,效果其實(shí)都一樣阐枣,沒(méi)有任何影響和區(qū)別。好,我們裝完之后蔼两,直接reboot甩鳄,嘉文的外星人就開(kāi)始blackscreen 了,這個(gè)問(wèn)題折磨了我們一晚上额划,不知道為什么裝了driver之后會(huì)黑屏妙啃。
我們找了無(wú)數(shù)的網(wǎng)頁(yè),試了無(wú)數(shù)種辦法俊戳,都以失敗告終揖赴。后來(lái)我們才知道,黑屏其實(shí)是ubuntu的顯卡驅(qū)動(dòng)無(wú)法讓外星人顯示器顯示圖像品抽,但是電腦的所有程序储笑,包括nvidia driver都是正常運(yùn)行的。其實(shí)在昨天圆恤,我就發(fā)現(xiàn)了一個(gè)hint突倍,就是外星人在黑屏狀態(tài)下,鍵盤(pán)一直都是紫色光盆昙。嘉文說(shuō)她電腦在正常運(yùn)行的時(shí)候鍵盤(pán)都是紫光羽历,在剛剛開(kāi)機(jī)的時(shí)候鍵盤(pán)都是閃爍著彩色,所以我昨天也隱約有這種感覺(jué)淡喜。后來(lái)秕磷,我開(kāi)始求助于萬(wàn)能的朋友圈,我的學(xué)弟就給我發(fā)來(lái)了易之學(xué)弟的alienware裝機(jī)指南炼团,其中里面最有用的hint就是裝ssh澎嚣。當(dāng)時(shí)學(xué)弟跟我留言說(shuō)ssh時(shí)我有點(diǎn)蒙,但看到他給我發(fā)的易之寫(xiě)的《Alienware 裝Ubuntu踩坑指南》之后瘟芝,我才恍然大悟易桃。這操作,太騷了锌俱。但可惜晤郑,jiawen的電腦太新了,顯卡也是新的3070贸宏,所以電腦還是黑屏造寝。但我們可以妥協(xié):這個(gè)電腦可以直接當(dāng)成一個(gè)server,以后就拿別的電腦用ssh連它就好了吭练。
于是我重新裝了ubuntu系統(tǒng)(我基本重裝了10次了)诫龙,然后在裝driver之前,立刻裝上ssh-server,讓外星人能夠被ssh上线脚。然后赐稽,我再重啟叫榕,開(kāi)機(jī)浑侥,發(fā)現(xiàn)黑屏狀態(tài)時(shí)姊舵,我的電腦也能夠成功連接上嘉文的外星人。輸入nvidia-smi
之后寓落,令人親切的cuda Nvidia界面出現(xiàn)了括丁,(淚奔)。
于是伶选,我們跟她說(shuō)史飞,這個(gè)電腦暫時(shí)就當(dāng)做服務(wù)器了,并且還需要固定ip仰税,她家是光纖網(wǎng)构资,路由器比較特別,網(wǎng)線接上之后不能直接聯(lián)網(wǎng)陨簇,所以還是要鏈接wifi吐绵。她家的局域網(wǎng)也不能登陸192.168.1.1的路由地址,以后再看看如何在wifi下面綁定IP+MAC吧河绽。好在她的手機(jī)路由app可以查看這個(gè)電腦IP己单。每當(dāng)這個(gè)電腦關(guān)機(jī)重啟,IP一旦改變耙饰,她的手機(jī)都能夠偵測(cè)到纹笼。苦了兩個(gè)大男人又要跑到walmart去買(mǎi)網(wǎng)線苟跪。
然后廷痘,終于能夠用她的筆記本去連這個(gè)外星人“server”了。開(kāi)始了我們輕松的安裝Pytorch之旅件已。按照常規(guī)操作安裝了anaconda之后笋额,我們創(chuàng)建帶著python3.6的虛擬環(huán)境伴著python3.6,然后就開(kāi)始安裝Pytorch拨齐。注意鳞陨,她的Nvidia Driver是11.3,由于RTX 30系列顯卡(她電腦是3070)的特殊性瞻惋,我們不能用10.3版本的cuda toolkit 去安裝厦滤,必須要用CUDA 11.1。不要問(wèn)我為什么歼狼,問(wèn)就是30系列太新了掏导,太高級(jí)了,無(wú)法向下兼容羽峰。(??)
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia
然后趟咆,我們跑了一個(gè)簡(jiǎn)單的mnist 程序添瓷,成功了!V瞪础A鄞!淚奔E斑搿2罄ⅰ!疆偿!
我剛剛回家咱筛,現(xiàn)在是晚上23:37, 記錄下這激動(dòng)人心的時(shí)刻。然后繼續(xù)寫(xiě)代碼擼論文杆故,晚安迅箩。