學(xué)習(xí)使用R包
以dplyr包為例
R包是多個(gè)函數(shù)的集合怕吴,具有詳細(xì)的說(shuō)明和示例
安裝和加載R包
確保聯(lián)網(wǎng)操作
鏡像設(shè)置
# options函數(shù)就是設(shè)置R運(yùn)行過(guò)程中的一些選項(xiàng)設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
# 當(dāng)然可以換成其他地區(qū)的鏡像
安裝
install.packages(“包”)
BiocManager::install(“包”)
取決于你要安裝的包存在于CRAN網(wǎng)站還是Biocductor,存在于哪里
谷歌搜索待安裝的包赖欣,確定其來(lái)源
加載
library(包)
require(包)
每次打開(kāi)新的Rproject需要重新加載要使用的R包
dplyr五個(gè)函數(shù)
- mutate(),新增列
- select(),按列篩選
- filter()篩選行
- arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
- summarise():匯總
dplyr兩個(gè)實(shí)用技能
- 管道操作 %>% (cmd/ctr + shift + M)
TIP:加載任意一個(gè)tidyverse包即可用管道符號(hào)
- count統(tǒng)計(jì)某列的unique值
dplyr處理關(guān)系數(shù)據(jù)
options(stringsAsFactors = F)
捏悬,即將2個(gè)表進(jìn)行連接撞蚕,注意:不要引入factor
- 內(nèi)連inner_join,取交集
- 左連left_join
- 全連full_join
- 半連接:返回能夠與y表匹配的x表所有記錄semi_join
- 反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join
- 簡(jiǎn)單合并
? tips:在相當(dāng)于base包里的cbind()函數(shù)和rbind()函數(shù);注意,bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同过牙,而bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)
代碼.png
代碼運(yùn)行.png
代碼運(yùn)行2.png
代碼運(yùn)行三.png
Tips
學(xué)習(xí)R包的用法記得使用幫助文檔甥厦,查看示例?包的名稱(chēng)
或者谷歌搜索