生信學(xué)習(xí)第六天~學(xué)習(xí)R包!很重要N悄薄逝变!
R包是多個(gè)函數(shù)的集合,具有詳細(xì)的說明和示例
以下均以dplyr為例
第一步
鏡像設(shè)置膛堤,為了加速包的下載
1.可以進(jìn)入設(shè)置里手動(dòng)設(shè)置
用options()$repos
可以檢驗(yàn)
2.輸入下面兩行代碼即可
# options函數(shù)就是設(shè)置R運(yùn)行過程中的一些選項(xiàng)設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
可以用options()$BioC_mirror
檢驗(yàn)一下
3.用這個(gè)方法就可以不用每次打開都再配置一遍??
首先編輯一個(gè)Rprofile文件
file.edit('~/.Rprofile')
這樣的話在每次打開前Rstudio都會(huì)先運(yùn)算一遍這個(gè)文件
然后復(fù)制黏貼一下2中的 代碼手趣,保存后重啟即可
可以用options()$repos
和options()$BioC_mirror
再檢查一下
這種辦法不一定都能成。肥荔。比如我就失敗了
第二步
安裝R包
命令是install.packages(“包”)
或者BiocManager::install(“包”)
取決于你要安裝的包存在于CRAN網(wǎng)站還是Biocductor绿渣,可以谷歌搜到存在于哪里朝群。
第三步
加載
library(包)
require(包)
兩個(gè)都可以
接下來就先裝個(gè)dplyr試一試
然而。中符。姜胖。事情總是不可能這么一帆風(fēng)順。淀散。
清華不愛我右莱。。這個(gè)時(shí)候吧凉。隧出。手動(dòng)換一個(gè)鏡像再試試
這時(shí)候詭異的事情又出現(xiàn)了,手動(dòng)為啥換了也沒用???
還出現(xiàn)了一條詭異的警告?
難道我要在第一步就跪了嗎/(ㄒoㄒ)/
不阀捅!我不認(rèn)輸胀瞪!然后百度一波!
一個(gè)歪果網(wǎng)站告訴了我一個(gè)小秘密
輸入options(repos = c(CRAN = "https://cran.rstudio.com"))
第四步
學(xué)習(xí)dplyr五個(gè)基礎(chǔ)函數(shù)
小聲bb:學(xué)完會(huì)發(fā)現(xiàn)好像excel
先隨便弄了一個(gè)示例數(shù)據(jù)
test <- iris[c(1:2,51:52,101:102),]
1.mutate()
新增列
輸入mutate(test, new = Sepal.Length * Sepal.Width)
如圖凄诞,意思就是新增了個(gè)叫“new”的列,數(shù)值等于Sepal.Length * Sepal.Width
2.
select()
按列篩選可以按列號(hào)篩選
這里用到的是昨天的向量賦值的知識(shí)~注意舉一反三
當(dāng)然也可以按列名篩選
和上面的方法大同小異帆谍,想要什么列就輸名就好了
注意要看清楚列名的大小寫!V嵩邸汛蝙!
3.filter()
篩選行
可以看出來可以加入各種篩選條件,用到的命令都是昨天學(xué)過的朴肺,復(fù)習(xí)一下~
需要注意一下的是
字符一定要記得加" "
等于號(hào)是==
與是&
4.
arrange()
按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序arrange()
默認(rèn)從小到大排序arrange(, desc())
加上desc變從大到小當(dāng)然同時(shí)按幾列也可以窖剑,列名間加上各種符號(hào)即可
5.
summarise()
匯總結(jié)合group_by使用實(shí)用性強(qiáng)
第五步
dplyr兩個(gè)實(shí)用技能
1.管道操作 %>%
(cmd/ctr + shift + M)
一頓操作之后會(huì)發(fā)現(xiàn)得到了和第四步里最后一個(gè)操作一樣的結(jié)果戈稿,其實(shí)管道操作就是“組合小功能完成大任務(wù)”西土,在中間變量特別多的時(shí)候很適用~
2.count統(tǒng)計(jì)某列的unique值
第六步
dplyr處理關(guān)系數(shù)據(jù)
先建兩個(gè)數(shù)據(jù)框,注意不要引入factor
stringsAsFactors是這個(gè)意思
1.inner_join
內(nèi)連,取交集
2.left_join
左連
注意輸入指令時(shí)數(shù)據(jù)框名的先后
3.
full_join
全連對(duì)換次序只改變行鞍盗、列的次序需了,數(shù)據(jù)框里的所有的數(shù)據(jù)都是一樣的
4.
semi_join
半連接,返回能夠與y表匹配的x表所有記錄5.anti_join
反連接般甲,返回?zé)o法與y表匹配的x表的所記錄
6.簡(jiǎn)單合并
相當(dāng)于base包里的cbind()函數(shù)和rbind()函數(shù)
bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同,而bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)