最近重裝了實驗室服務(wù)器,系統(tǒng)為Ubantu 20.0.4,另外由于要運行深度學(xué)習(xí)厕鹃,所以還要配置CUDAtoolkit,踩過很多坑乍丈,特此記錄剂碴。
1.重裝Ubantu 20.0.4
主要參考
https://blog.csdn.net/baidu_36602427/article/details/86548203
1.1下載鏡像
https://ubuntu.com/download/desktop
界面有兩個download,上面是最新穩(wěn)定版轻专,下面是還在更新的最新版忆矛,為了系統(tǒng)穩(wěn)定性下載上面的。
1.2制作U盤啟動盤
1.準(zhǔn)備好一個空的U盤请垛,插入后 我的電腦-右鍵U盤-格式化
2.下載UltraISO軟件用來刻錄系統(tǒng) https://cn.ultraiso.net/xiazai.html
3.下載好后打開UltraISO催训,菜單欄文件-打開-找到下載的Ubantu位置雙擊 然后菜單欄啟動-寫入硬盤鏡像文件,彈出界面選中插入U盤宗收,其他默認(rèn)就行漫拭,點擊寫入,結(jié)束后確定退出混稽,拔出U盤
1.3重裝系統(tǒng)
將U盤插入電腦采驻,重啟,根據(jù)電腦品牌進(jìn)入啟動項管理(可能是是F2/F10/F11/F12),可以百度自己牌子電腦的啟動項管理匈勋,設(shè)置為U盤啟動礼旅。
我的U盤插進(jìn)去后,啟動時有兩個選項颓影,有一個帶EFI各淀,這個根據(jù)電腦配置選擇相應(yīng)的啟動項,如果不知道自己電腦有沒有可以先選帶EFI的诡挂,若是報錯再用不帶EFI的重裝一遍碎浇。
選用后等候一段時間临谱,進(jìn)入到安裝界面。
前兩頁是選語言和鍵盤布局奴璃,直接默認(rèn)英文悉默,因為中文路徑在運行代碼時可能會有意想不到的坑。
第三頁苟穆,更新選項上面選擇正常安裝(normal),其他的默認(rèn)
第四頁抄课,安裝類型選擇最小面的else,手動配置雳旅。這里可以借鑒https://blog.csdn.net/baidu_36602427/article/details/86548203中的配置
注意事項
1.有些時候如果先劃分/boot區(qū)跟磨,后面劃分別的區(qū)時會報錯,如果出現(xiàn)這種情況攒盈,將/boot區(qū)放在最后劃分抵拘。
2.安裝前找到要裝的硬盤,sda型豁、sdb僵蛛、sdc...是不同的硬盤,選定要安裝的硬盤迎变,先刪除所有分區(qū)充尉,然后再根據(jù)鏈接進(jìn)行安裝。
3.由于自己電腦空間和鏈接中空間不一定一樣大衣形,可以將除/home區(qū)以外所有分區(qū)大小設(shè)置和鏈接中一樣驼侠,/home區(qū)占用剩下的就行,若是遇見1.中情況要最后對/boot進(jìn)行分區(qū)谆吴,則倒數(shù)第二個裝/home分區(qū)泪电,預(yù)留1024M給/boot分區(qū)
4.如果有多塊物理硬盤,如果之前的東西需要就不管纪铺,不需要就刪除
1.5 安裝好后更換源
(這個步驟可能會導(dǎo)致驅(qū)動依賴不對,裝軟件的時候還遇到了別的bug,所以還是別換吧)只更新源就好了
sudo apt-get update
sudo apt-get upgrade
如果要換的話
sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup
sudo nano /etc/apt/sources.list
將原始內(nèi)容全部注釋(在沒有#開頭的行都加上#)
將一下內(nèi)容復(fù)制碟渺,粘貼(復(fù)制后鼠標(biāo)中鍵)到打開的窗口中
deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
復(fù)制粘貼好后ctrl+s ,ctrl + x保存退出鲜锚。
更新源
sudo apt-get update
sudo apt-get dist-upgrade
sudo apt-get upgrade
安裝輸入法
- 打開language support, 這時候會自動彈出窗口讓安裝依賴苫拍,直接安裝就好了芜繁。
- install/remove languages...打開,看下chinese(simplified)有沒有勾選绒极,沒有的話選上骏令,確認(rèn)讓自動安裝依賴
sudo apt install ibus
sudo apt install ibus-gtk ibus-gtk3
sudo apt install ibus-pinyin
- 重啟。設(shè)置里打開region & language垄提。如果是ubuntu18.04可以點下面加號添加chinese--chinese(intellegent pinyin)然后win+空格可以切換輸入法使用了榔袋。如果是ubuntu20.0.4周拐,settings--keyboard里可以找到這個設(shè)置。
到最后一步凰兑,settings -keyboard -- input sources +號 --添加中文
安裝驅(qū)動
如果之前安裝過記得卸載
之前通過ppa安裝的妥粟,卸載如下
sudo apt-get remove --purge nvidia*
以前是通過runfile安裝的,卸載如下:
sudo ./NVIDIA-Linux-x86_64-384.59.run --uninstall
sudo apt-get install software-properties-common
sudo add-apt-repository ppa:graphics-drivers/ppa
ubuntu-drivers devices (查看NVIDIA顯卡型號和推薦的驅(qū)動程序的模型)
sudo apt-get install nvidia-driver- (輸入這個然后按table補(bǔ)全看有哪些選擇吏够,選最新或者第二新勾给,或者推薦的那個)
sudo reboot #重啟后生效
nvidia-smi #如果沒報錯,則成功
和驅(qū)動配套的cuda版本見官網(wǎng)锅知,記得根據(jù)自己想要裝的cuda版本配置驅(qū)動版本
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
2.安裝ssh
首先ifconfig查看IP播急,若報錯顯示沒有net-tools,則根據(jù)報錯提示命令安裝
sudo apt install openssh-server
sudo apt install openssh-client
sudo nano /etc/ssh/ssh_config
在跳出的窗口中售睹,去掉PasswordAuthentication yes前面的#號桩警,保存退出(ctrl+s--ctrl+x)
重啟ssh
sudo /etc/init.d/ssh restart
3.配置CUDA
進(jìn)入官網(wǎng) https://developer.nvidia.com/cuda-downloads 下載
下載runfile文件
cd runfile文件位置
sudo sh cuda_11.2.2_460.32.03_linux.run --override #指令前半部分和官網(wǎng)給的第二行一樣
(注意如果沒有override,有可能會報錯)
運行后會卡一下侣姆,別急生真,這時候亂點可能電腦直接崩了,耐心等待一下捺宗。
彈出下一個界面選擇continue
重點來了
runfile會自己再下一個CUDA驅(qū)動柱蟀,但是本來已有驅(qū)動,所以會報錯蚜厉。在下一個界面取消勾選cuda driver(即第一個长已,方向鍵選中后回車取消,再方向鍵選中繼續(xù))昼牛,過一會就裝好了术瓮。
驗證CUDATOOLKIT是否裝好: nvcc -V
但是這時候還報錯,因為還沒有加入環(huán)境變量
sudo nano ~/.bashrc
export LD_LIBRARY_PATH=/usr/local/cuda/lib
export PATH=$PATH:/usr/local/cuda/bin
source ~/.bashrc
如果創(chuàng)建了usr贰健,要在usr自己~目錄下也加入環(huán)境變量
下載cudnn
官網(wǎng)下載:
https://developer.nvidia.com/cudnn
tar -xvf cudnn...
先解壓胞四, 后將動態(tài)鏈接庫和頭文件放入相應(yīng)目錄
mv cuda/include/* /usr/local/cuda/include/
chmod +x cuda/lib64/* && mv cuda/lib64/* /usr/local/cuda/lib64/
安裝完成以后,增加環(huán)境變量:
echo "export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:${LD_LIBRARY_PATH} \n" >> ~/.bashrc
source ~/.bashrc && ldconfig
[圖片上傳中...(image.png-91d5d5-1657371226591-0)]
其他硬盤掛載
新建分區(qū)
df -h #查看已掛載硬盤
sudo fdisk -l #查看所有物理硬盤
#對比得出未掛載的硬盤
sudo mkdir /mnt/sdb #對每個未掛載的硬盤都創(chuàng)建相應(yīng)的文件夾名稱供后續(xù)掛載,以sdb為例
對未掛載的硬盤伶椿,sudo fdisk -l 指令后查看是否分區(qū)辜伟,如果已分區(qū)界面如下:
未分區(qū)界面如下:
對未分區(qū)的硬盤進(jìn)行分區(qū)、格式化:
sudo fdisk /dev/sd* #對想分區(qū)脊另、格式化的硬盤進(jìn)行操作
輸入m -- 輸入p查看分區(qū) -- 輸入n新建分區(qū) -- 如果只分一個區(qū)就一直回車/多個區(qū)就在選擇開頭导狡、結(jié)尾扇區(qū)時選擇自己想分配的大小 -- p查看是否新建成功 -- w保存
格式化分區(qū)
sudo mkfs.ext4 /dev/sdb1
掛載硬盤(本來已分區(qū)未掛載的硬盤直接執(zhí)行掛載,如果報錯偎痛,備份內(nèi)容并執(zhí)行上一步格式化)
sudo mount /dev/sd* /mnt/sd* #對應(yīng)
永久掛載
以上掛載是暫時掛載旱捧,重啟電腦時需要重新掛載,下進(jìn)行永久掛載
sudo nano /etc/fstab
可以看到下圖:
按照格式加入自己掛載:
最后重新讀炔嚷蟆:
mount -a
[圖片上傳中...(image.png-82ba29-1657371238512-0)]