R包學(xué)習(xí)(dplyr為例)
R包是一系列函數(shù)的合集同波,安裝加載R包后可以通過(guò)調(diào)用別人寫(xiě)好的函數(shù)完成自己的數(shù)據(jù)處理需求
R包安裝
R包的來(lái)源有R的官網(wǎng)(設(shè)置CRAN)和bioconductor這兩個(gè)網(wǎng)站,下載R包也是從這兩個(gè)網(wǎng)站上下載的叠国,所以需要先設(shè)置鏡像未檩,鏡像設(shè)置不好的話(huà)R包下載就會(huì)報(bào)錯(cuò)
鏡像設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
options:設(shè)置R的選項(xiàng)設(shè)置
查詢(xún)鏡像來(lái)源的代碼:
options()$repos
options()$BioC_mirror
安裝
install.packages(“包”)#CRAN的包
BiocManager::install(“包”)#Bioconductor的包
加載
library()
require()
dplyr包
安裝并加載dplyr
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
五個(gè)基礎(chǔ)函數(shù)
mutate()#增加列
select()#篩選列
filter()#篩選行
arrange()#按列排序整個(gè)表格
summarise()
實(shí)用技能
1、管道
%>% #快捷鍵(cmd/ctr + shift + M)
2粟焊、count 統(tǒng)計(jì)某列的unique值
count(test,Species)
dplyr的雙表操作
1冤狡、內(nèi)連接
inner_join(A,B,by = 'C')
2、左連接
left_join(A,B,by ='C')
3项棠、全連接
full_join(A,B,by ='C')
4悲雳、半連接
semi_join(x = A, y = B, by = 'C')
5、反連接
anti_join(x = A, y = B, by = 'x')
6香追、簡(jiǎn)單合并
bind_rows(A,B)
bind_cols(A,B)