R包的安裝有兩種吃引,具體使用哪一種需要查看包的來源
1: install.package("包")
2: BioManager::install("包")
以dplyr包為例,常用命令
ps:tidyverse就是幾個(gè)包的集合京景,包括ggplot2,dplyr,tidyr,readr缀遍,purrr,tibble饱须,stringr, forcats域醇。
dplyr的兩個(gè)實(shí)用技能
1: 管道操作 %>%
test %>%
group_by(Species) %>%
summarise(mean(Sepal.Length), sd(Sepal.Length))
2:count統(tǒng)計(jì)某列的unique值
count(test,Species)
dplyr處理關(guān)系數(shù)據(jù)
連接兩個(gè)表
stringsAsFactors = FALSE,可以避免將字符轉(zhuǎn)化為因子冤寿。
1.內(nèi)連inner_join(test1和2取交集)
inner_join(test1, test2, by = "x")
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
2.左連left_join(用2篩選1)
left_join(test1, test2, by = 'x')
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
## 4 x D NA
left_join(test2, test1, by = 'x')
## x y z
## 1 a 1
## 2 b 2 A
## 3 c 3
## 4 d 4
## 5 e 5 B
## 6 f 6 C
3.全連full_join
full_join( test1, test2, by = 'x')
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
## 4 x D NA
## 5 a
## 6 c
## 7 d
4.半連接(返回能夠與2匹配的1)
semi_join(x = test1, y = test2, by = 'x')
## x z
## 1 b A
## 2 e B
## 3 f C
5.反連接(返回不能夠與2連接的1)
anti_join(x = test2, y = test1, by = 'x')
## x y
## 1 a 1
## 2 c 3
## 3 d 4
6.簡(jiǎn)單合并
列合并的時(shí)候歹苦,列數(shù)要相同;行合并的時(shí)候督怜,行數(shù)要相同。
bind_rows(test1, test2)
bind_cols(test1, test3)