今天首先按照教程進行了鏡像設置
file.edit('~/.Rprofile')
添加代碼
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對應清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對應中科大源
安裝
聯(lián)網后下載r包,安裝命令為install.packages(“包”)或者BiocManager::install(“包”)
需要谷歌搜索安裝的包存在于CRAN網站還是Biocductor
加載
library(包)或require(包)
舉例(dplyr)
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
代碼實操
1.mutate(),新增列
mutate(表名, new = Sepal.Length * Sepal.Width)
2.select(),按列篩選
select(表名,列號/列名/某幾列)
特殊:vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))
3.filter()篩選行
filter(表名,列名 == "某數(shù)值")
4.arrange(),按某1列或某幾列對整個表格進行排序
arrange(表名, desc(列名))#用desc從大到小 (默認從小到大)
5.summarise():匯總
舉例:
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
先分組再計算
1:管道操作 %>% (cmd/ctr + shift + M)
2:count統(tǒng)計某列的unique值
表格間關系
options(stringsAsFactors = F)
導入兩表格信息
inner_join(test1, test2, by = "x") 取交集
left_join(test1, test2, by = 'x') 所有表1有x值的全要
full_join全連
4.半連接:返回能夠與y表匹配的x表所有記錄semi_join
5.反連接:返回無法與y表匹配的x表的所記錄anti_join
簡單合并
兩個表格列數(shù)相同bind_rows()图筹,而兩個數(shù)據框有相同的行數(shù)bind_cols()