對(duì)待R要高冷,拒絕可以拒絕的一切
1.高級(jí)的鏡像設(shè)置
不想每次打開(kāi)Rstudio都要運(yùn)行一遍鏡像配置嗽上,就需要用到R的配置文件.Rprofile
- 首先用file.edit()來(lái)編輯文件:
file.edit('~/.Rprofile')
- 然后在其中添加好options代碼
# options函數(shù)就是設(shè)置R運(yùn)行過(guò)程中的一些選項(xiàng)設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
# 當(dāng)然可以換成其他地區(qū)的鏡像
- 最后保存然后重啟Rstudio
再運(yùn)行一下:
options()$repos
options()$BioC_mirror
發(fā)現(xiàn)已經(jīng)配置好了办绝,省了手動(dòng)運(yùn)行的步驟
2.R包安裝
- 第一種:CRAN網(wǎng)站
install.packages(“”)
- 第二種:Bioconductor網(wǎng)站
BiocManager::install(“”)
3.R包加載
- 兩者均可
library()
require()
(總結(jié))4.安裝加載三部曲:("dplyr")為例
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
5.dplyr五個(gè)基礎(chǔ)函數(shù)
(示例數(shù)據(jù):test <- iris[c(1:2,51:52,101:102),])
(1)新增列
mutate(變量,新增列名=新增內(nèi)容)
(2)篩選列
select(變量,篩選條件)
(3)篩選行
filter(變量,篩選條件)
(4)排序
- 按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
arrange(變量,篩選條件)
(5)匯總
summarise(變量,篩選條件)
-
結(jié)合group_by伊约,根據(jù)分組再匯總分析
6.dplyr兩個(gè)實(shí)用技能
(1)管道操作
- %>% :向右操作符
把左側(cè)準(zhǔn)備的數(shù)據(jù)或表達(dá)式姚淆,傳遞給右側(cè)的函數(shù)調(diào)用或表達(dá)式進(jìn)行運(yùn)行孕蝉,可以連續(xù)操作就像一個(gè)鏈條一樣
%>%
(cmd/ctr + shift + M)
-所以上述的一串代碼可以變成簡(jiǎn)單的一串
(2)統(tǒng)計(jì)某列的unique值:count
count(變量,篩選條件)
7.dplyr處理關(guān)系數(shù)據(jù)
注意:2個(gè)表進(jìn)行連接,不要引入factor
載入數(shù)據(jù):
88.pn
(1)內(nèi)連腌逢,取交集
inner_join
(2)左連
left_join
(3)全連接
full_join
(4)半連接
- 返回能夠與y表匹配的x表所有記錄
semi_join
(5)反連接
- 返回?zé)o法與y表匹配的x表的所記錄
anti_join
(6)簡(jiǎn)單合并
- 相當(dāng)于base包里的cbind()函數(shù)和rbind()函數(shù)
-
bind_rows()
需要兩個(gè)表格列數(shù)相同 -
bind_cols()
需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)
下面進(jìn)行操作:
先準(zhǔn)備數(shù)據(jù)
再操作:
最后的最后:
今日的思維導(dǎo)圖: