1.鏡像設(shè)置
file.edit('~/.Rprofile')
options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
再運(yùn)行
options()$repos和options()$BioC_mirror
即可
2.R包的安裝與加載
①安裝(聯(lián)網(wǎng))
install.packages(“包”)
BiocManager::install(“包”)
②加載
library(包);require(包)
3.dplyr五個(gè)基本函數(shù)
安裝并加載dplyr
mutate(),新增列
新增列
select(),按列篩選
①按列號(hào)篩選:select(變量名,列號(hào)),如select(test,1)
②按列名篩選:select(變量名,列名)筐骇,如select(test, Petal.Length, Petal.Width)
按列篩選
one_of()函數(shù):用來選擇聲明變量饼齿,即選擇vars為變量费什。
③filter()篩選行:filter(變量名,所要篩選的行)回梧,如filter(test, Species == "setosa")县袱;filter(test, Species %in% c("setosa","versicolor"))
篩選行
④arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序:
arrange(變量名,要排序的列名)躺孝,如arrange(test, Sepal.Length)享扔,默認(rèn)由小到大排序;arrange(test, desc(Sepal.Length))括细,這里用desc表示從大到小排序
排序
⑤summarise():匯總
summarise(變量名,要匯總的方式)伪很,如summarise(test, mean(Sepal.Length), sd(Sepal.Length)),mean:求平均值奋单,sd:求標(biāo)準(zhǔn)差
group_by():分組
group_by(變量名锉试,分組的列名),如group_by(test, Species)
分組再匯總:如summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length)
匯總
4.dplyr兩個(gè)實(shí)用技能
①%>% (cmd/ctr + shift + M):管道操作
管道傳參览濒,即將左邊的值傳遞給下一個(gè)函數(shù)
管道傳參
②count()統(tǒng)計(jì)某列的unique值
count(變量名,列名)呆盖,如count(test,Species)
計(jì)算unique值
5.dplyr處理關(guān)系數(shù)據(jù):連接兩個(gè)表格
data.frame()函數(shù)建立表格
內(nèi)連inner_join,取交集
內(nèi)連
左連left_join
左連
右連right_join
右連
全連full_join
全連
半連接:返回能夠與y表匹配的x表所有記錄semi_join,即返回重疊部分
半連接
反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join贷笛,即返回不重疊部分
反連接
簡(jiǎn)單合并
bind_rows():需要兩個(gè)數(shù)據(jù)框列數(shù)相同
bind_cols():需要兩個(gè)數(shù)據(jù)框行數(shù)相同
簡(jiǎn)單合并
否則: