R語(yǔ)言dplyr包:高效數(shù)據(jù)處理函數(shù)(filter蝉衣、group_by、mutate巷蚪、summarise)

R語(yǔ)言dplyr包的數(shù)據(jù)整理病毡、分析函數(shù)用法文章連載NO.01

在日常數(shù)據(jù)處理過(guò)程中難免會(huì)遇到些難處理的,選取更適合的函數(shù)分割钓辆、篩選剪验、合并等實(shí)在是大快人心!

利用dplyr包中的函數(shù)更高效的數(shù)據(jù)清洗前联、數(shù)據(jù)分析功戚,及為后續(xù)數(shù)據(jù)建模創(chuàng)造環(huán)境;本篇涉及到的函數(shù)為filter似嗤、filter_all()啸臀、filter_if()、filter_at()烁落、mutate乘粒、group_by、select伤塌、summarise灯萍。

1、數(shù)據(jù)篩選函數(shù):

#可使用filter()函數(shù)篩選/查找特定條件的行或者樣本

#filter(.data=,condition_1,condition_2)#將返回相匹配的數(shù)據(jù)

#同時(shí)可以多條件匹配multiple condition每聪,當(dāng)采用多條件匹配時(shí)可直接condition1旦棉,condition2或者condition1&condition2

#其他邏輯表達(dá)還有:==,>,>=等药薯,&绑洛,|,童本!真屯,xor(),is.na穷娱,between绑蔫,near

#filter延展的相關(guān)函數(shù)filter_all()运沦、filter_if()、filter_at()

#以iris數(shù)據(jù)集為例:

filter(.data=iris,Sepal.Length>3,Sepal.Width<3.5)

filter(.data=iris,Sepal.Length>3,Species=="virginica")

輸出情況:? ? ????? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

?輸出情況:

#要使用filter_all()配深、filter_if()茶袒、filter_at()需要先去掉Species列(非數(shù)值型列)?

iris_data<-iris%>% select(-Species)

#篩選所有屬性小于6的行?

iris_data%>% filter_all(all_vars(.<6))

部分輸出情況:?

#篩選任意一個(gè)屬性大于3的行

iris_data%>% filter_all(any_vars(.>3))

#篩選以sep開(kāi)頭的屬性任一大于3的行

iris_data%>% filter_at(vars(starts_with("Sep")), any_vars(. >3))

#R中自帶數(shù)據(jù)集mtcars,篩選任意一個(gè)屬性大于150的行

filter_all(mtcars, any_vars(. > 150))

#篩選以d開(kāi)頭的屬性任一可被2整除的行

filter_at(mtcars, vars(starts_with("d")), any_vars((. %% 2) == 0))

2凉馆、數(shù)據(jù)分組薪寓、匯總函數(shù)group_by、summarise

其他延展函數(shù)?group_by_all澜共、group_by_if向叉、group_by_at(將在后續(xù)文章中解析)

?group_by函數(shù)按照某個(gè)變量分組,對(duì)于數(shù)據(jù)集本身并不會(huì)發(fā)生什么變化嗦董,只有在與mutate(), arrange() 和 summarise() 函數(shù)結(jié)合應(yīng)用的時(shí)候會(huì)體現(xiàn)出它的優(yōu)越性母谎,將會(huì)對(duì)這些 tbl 類(lèi)數(shù)據(jù)執(zhí)行分組操作 (R語(yǔ)言泛型函數(shù)的優(yōu)越性).

mtcars_cyl <- mtcars %>% group_by(cyl)

mtcars_cyl %>% summarise(

disp = mean(disp),

hp = mean(hp)

)

mtcars_vs_am <- mtcars %>% group_by(vs, am)

mtcars_vs <- mtcars_vs_am %>% summarise(n = n())

3、新增列函數(shù)mutate京革,在數(shù)據(jù)集的基礎(chǔ)上新增列奇唤,不對(duì)原數(shù)據(jù)作更改

可用的相關(guān)參數(shù)、邏輯:

? +, -?等等

? log()

? lead(), lag()

? dense_rank(), min_rank(), percent_rank(), row_number(), cume_dist(), ntile()

? cumsum(), cummean(), cummin(), cummax(), cumany(), cumall()

? na_if(), coalesce()

? if_else(), recode(), case_when()

相關(guān)延展函數(shù):transmute匹摇、mutate_all咬扇、mutate_if、mutate_at(后期文章分享)

mtcars %>% as_tibble() %>% mutate(

cyl2 = cyl*3,

cyl4 = cyl2+2)

下一篇預(yù)告? ? arrange廊勃、order_by懈贺、compute、sample坡垫、n_distinct等梭灿,后面還會(huì)講Hmisc這個(gè)包,很不錯(cuò)冰悠。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末堡妒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子溉卓,更是在濱河造成了極大的恐慌皮迟,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,576評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件的诵,死亡現(xiàn)場(chǎng)離奇詭異万栅,居然都是意外死亡佑钾,警方通過(guò)查閱死者的電腦和手機(jī)西疤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)休溶,“玉大人代赁,你說(shuō)我怎么就攤上這事扰她。” “怎么了芭碍?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,017評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵徒役,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我窖壕,道長(zhǎng)忧勿,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,626評(píng)論 1 296
  • 正文 為了忘掉前任瞻讽,我火速辦了婚禮鸳吸,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘速勇。我一直安慰自己晌砾,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布烦磁。 她就那樣靜靜地躺著养匈,像睡著了一般。 火紅的嫁衣襯著肌膚如雪都伪。 梳的紋絲不亂的頭發(fā)上呕乎,一...
    開(kāi)封第一講書(shū)人閱讀 52,255評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音陨晶,去河邊找鬼楣嘁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛珍逸,可吹牛的內(nèi)容都是我干的逐虚。 我是一名探鬼主播,決...
    沈念sama閱讀 40,825評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼谆膳,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼叭爱!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起漱病,我...
    開(kāi)封第一講書(shū)人閱讀 39,729評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤买雾,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后杨帽,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體漓穿,經(jīng)...
    沈念sama閱讀 46,271評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評(píng)論 3 340
  • 正文 我和宋清朗相戀三年注盈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了晃危。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,498評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖僚饭,靈堂內(nèi)的尸體忽然破棺而出震叮,到底是詐尸還是另有隱情,我是刑警寧澤鳍鸵,帶...
    沈念sama閱讀 36,183評(píng)論 5 350
  • 正文 年R本政府宣布苇瓣,位于F島的核電站,受9級(jí)特大地震影響偿乖,放射性物質(zhì)發(fā)生泄漏击罪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評(píng)論 3 333
  • 文/蒙蒙 一贪薪、第九天 我趴在偏房一處隱蔽的房頂上張望外邓。 院中可真熱鬧,春花似錦古掏、人聲如沸损话。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,338評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)丧枪。三九已至,卻和暖如春庞萍,著一層夾襖步出監(jiān)牢的瞬間拧烦,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,458評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工钝计, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恋博,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,906評(píng)論 3 376
  • 正文 我出身青樓私恬,卻偏偏與公主長(zhǎng)得像债沮,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子本鸣,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容