學(xué)習(xí)R包
先上思維導(dǎo)圖
配置鏡像
編輯配置文件
file.edit('~/.Rprofile')
在新建的腳本窗口中添加這兩行代碼
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對應(yīng)中科大源
在控制臺輸入options()$repos
和options()$BioC_mirror
檢查是否配置成功
安裝R包
install.packages(“包”)
BiocManager::install(“包”)
加載包
library(包)
require(包)
dplyr五個基礎(chǔ)函數(shù)
1.mutate()
,新增列
.2.select()
,按列篩選
列號select(test,1)
多個列select(test,c(1,5))
列名select(test,Sepal.Length)
3.filter()
篩選行
4.arrange()
,按某1列或某幾列對整個表格進(jìn)行排序
5.summarise()
:匯總
dplyr兩個實用技能
1:管道操作 %>% (cmd/ctr + shift + M):就是把第一個命令的結(jié)果作為第二個命令的輸入
2:count()
統(tǒng)計某列的unique值
dplyr處理關(guān)系數(shù)據(jù)
stringsAsFactors = F意味著,“在讀入數(shù)據(jù)時,遇到字符串之后赡勘,不將其轉(zhuǎn)換為factors,仍然保留為字符串格式”念赶。
1.內(nèi)連inner_join,取交集
2.左連left_join()
3.全連full_join()
4.半連接:返回能夠與y表匹配的x表所有記錄semi_join()
5.反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join()
6.簡單合并:bind_rows()
bind_cols()
總結(jié)
學(xué)會了配置鏡像,加速包的下載恰力。
學(xué)會了dplyr包的5個基礎(chǔ)函數(shù)叉谜。
學(xué)會了管道操作,就像水管一樣一個接著一個地把結(jié)果作為下一條命令的輸入踩萎。
比較難理解的就是連接關(guān)系數(shù)據(jù)停局。