一蚓峦、前言
R包是多個(gè)函數(shù)的集合,具有詳細(xì)的說(shuō)明和示例疮丛。
生信必學(xué)R語(yǔ)言——含有豐富圖表和Biocductor上的生信分析R包盗扒。每個(gè)包都解決生信的一個(gè)流程問(wèn)題。
二刨啸、安裝和加載R包
1堡赔、鏡像設(shè)置
- R的配置文件:
.Rprofile
file.edit('~/.Rprofile')
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
- 保存后重啟Rstudio,再運(yùn)行:
options()$repos
和options()$BioC_mirror
2设联、R包安裝和加載命令
-安裝:
install.packages(“包”)
BiocManager::install(“包”)
-加載:
library(包)
require(包)
- dplyr示例
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
- 示例數(shù)據(jù)——使用內(nèi)置數(shù)據(jù)集iris的簡(jiǎn)化版
test <- iris[c(1:2,51:52,101:102),]
3善已、dplyr五個(gè)基礎(chǔ)函數(shù)
- mutate(),新增列
mutate(test, new = Sepal.Length * Sepal.Width)
-
select(),按列篩選
-
filter()篩選行
-
arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
-
summarise():匯總
三、dplyr兩個(gè)實(shí)用技能
- 管道操作 %>% (ctr + shift + M)
加載任意一個(gè)tidyverse包即可用管道符號(hào)
-
count統(tǒng)計(jì)某列的unique值
四离例、dplyr處理關(guān)系數(shù)據(jù)
-
內(nèi)連inner_join,取交集
-
左連left_join
-
全連full_join
-
半連接:返回能夠與y表匹配的x表所有記錄semi_join
-
反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join
- 簡(jiǎn)單合并
注:
bind_rows()
函數(shù)需要兩個(gè)表格列數(shù)相同换团,bind_cols()
函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)。