R包的學習
R包的安裝與加載
1.鏡像設(shè)置-教程
- 高級模式:R的配置文件
.Rprofile
2.安裝
- 存在于CRAN網(wǎng)站的包安裝命令
install.packages(“包”)
私恬。 - 存在于Bioconductor網(wǎng)站的包安裝命令
BiocManager::install(“包”)
坎怪。
3.加載
-
library(某個包)
塘安,require(包)
砌梆,這兩個命令均可。
so 安裝加載流程:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
dplyr包的用法
5個基礎(chǔ)函數(shù)
-
mutate()
--新增列军熏。
括號里面去定義新增哪個數(shù)據(jù)框里面的內(nèi)容涨颜,后用逗號隔開曙旭,定義該新函數(shù)應該是以何種運算來出現(xiàn)。如:mutate(test,new=ab),那么新的一列就是以ab來計算得到的便监。 -
select()
--按列篩選扎谎。
- 按列號篩選:select(test,1)-選擇test表的第一列,select(test,c(1,5))-選擇test表的第1列和第5列烧董。
- 按列名篩選:select(test, Petal.Length, Petal.Width)-選擇test表表頭為Petal.Length和Petal.Width的那列毁靶。
-
filter()
--篩選行 -
arrange()
--按某1列或某幾列對整個表格進行排序。
- arrange(test, 第一列名稱)是以默認的方式從小到大的順序排列
- arrange(test, desc(a))test表格中以a列為排列標準逊移,從大到小的排列
5.`summarise():匯總(與group_by聯(lián)合使用更香哦)
group_by(test, Species) # 先按照Species分組预吆,計算每組Sepal.Length的平均值和標準差
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
實用技能
- 管道操作 %>%(cmd/ctr + shift + M):加載任意一個tidyverse包均可使用。
- count統(tǒng)計某列的unique值:count(數(shù)據(jù)集胳泉,列名)拐叉。
處理關(guān)系數(shù)據(jù)(將兩個表進行連接)
- 取交集:
inner_join(test1, test2, by = "x")
- 左連:
left_join(test1, test2, by = 'x')
- 全連
full_join( test1, test2, by = 'x')
- 半連接
semi_join(x = test1, y = test2, by = 'x')
- 反連接
anti_join(x = test2, y = test1, by = 'x')
-
bind_rows()
函數(shù)是兩個表格列數(shù)相同相連接,而bind_cols()
函數(shù)則是兩個數(shù)據(jù)框有相同的行數(shù)