image.png
學(xué)習(xí)使用dplyr包
-安裝加載包
install.packages("dplyr")
library(dplyr)
- 五個(gè)基本函數(shù)的使用
1.mutate()
新增數(shù)據(jù)框的變量
mutate(x,newvar=)
2.select()挑選變量
select(x,1,2...) 3.filter()行篩選
filter(x,var=某觀測(cè)值)`
4..arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
5.summarise():匯總感覺跟summary()函數(shù)有相似之處 - dplyr包的使用技巧
1.管道操作 %>% (cmd/ctr + shift + M)這個(gè)在linux上面的原理一樣
2.count統(tǒng)計(jì)某列的unique值 - dplyr處理關(guān)系數(shù)據(jù)
1.內(nèi)連inner_join,取交集
inner_join(test1, test2, by = "x")
2.左連left_join
left_join(dataframe1, dataframe2, by = 'x')
3.全連full_join
full_join( test1, test2, by = 'x')
4.半連接:返回能夠與y表匹配的x表所有記錄semi_join
5.反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join
6.簡(jiǎn)單合并:rbind cbind.