1. dplyr簡介
dplyr是R語言的數(shù)據(jù)分析包檩帐,能對dataframe類型的數(shù)據(jù)做很方便的數(shù)據(jù)處理和分析操作爆哑。d代表dataframe - plyr是英文鉗子plier的諧音.
dplyr如同R的大多數(shù)包,都是函數(shù)式編程辆亏。有點類似于流水線窥突,每個函數(shù)就是一個車間火焰,多個車間共同完成一個生產(chǎn)(數(shù)據(jù)分析)任務(wù)。
而在dplyr中凌那,就有一個管道符 %>% ,符號左側(cè)表示數(shù)據(jù)的輸入吟逝,右側(cè)表示下游數(shù)據(jù)處理環(huán)節(jié)帽蝶。
dplyr是R中專門用于數(shù)據(jù)處理的包。更具體功能包括:
?select() 從數(shù)據(jù)中選擇列
?filter() 數(shù)據(jù)行的子集
?group_by()匯總數(shù)據(jù)
?summarise()匯總數(shù)據(jù)(計算匯總統(tǒng)計信息)
?arrange() 排序數(shù)據(jù)
mutate() 創(chuàng)建新變量
2. dplyr常用函數(shù)
2.1 arrange
2.2?Select
2.3 Filter
2.4?Mutate(重點)
注:轉(zhuǎn)自知乎(HiDadeng)