R數(shù)據(jù)科學(xué)第三章

filter(flights, arr_delay >= 120)
??nycflights13
library(nycflights13)
install.packages("nycflights13")
library(tidyverse)
flights
?flights
View(flights)
calss(flights)

鍙橀噺綾誨瀷

int 鏁存暟錛宒bl 鍙岀簿搴︽誕鐐規(guī)暟銆佸疄鏁幫紝dttm 鏃ユ湡+鏃墮棿錛宭gl 閫昏緫鍨嬪彉閲忥紝浠呭寘鎷琓RUE鍜孎ALSE, fctr 鍥犲瓙錛宒ate 鏃ユ湡鍨嬪彉閲?

filter 鎸夎絳涢€?
arrange 緇欒鎺掑簭
select 鎸夊垪絳涢€?
mutate鏍規(guī)嵁鐜版湁鐨勫彉閲忓垱寤烘柊鐨勫彉閲?
summarize鎽樿緇熻

浣跨敤filter榪涜絳涢€?

filter(flights, month == 1, day == 1)
jan1 <- filter(flights, month == 1, day == 1)
jan1
(dec25 <- filter(flights, month == 12, day == 25))
dec25
姣旇緝榪愮畻絎?

,>=,<,<=,!+,==
filter(flights, month == 11 | month == 12)
a <- filter(flights, month == 11 | month == 12)
View(a)
filter(flights, month %in% c(11,12))
df <- tibble(x = c(1, NA, 3))
filter(df, x > 1)
filter(df, is.na(x) | x >1)
arrange(flights, year, month, day)
arrange(flights, desc(dep_delay))##闄嶅簭
鏃犺姝e簭鍜屽€掑簭錛岀┖鍊兼帓鍦ㄦ渶鍚?
df <- tibble(x = c(5, 2, NA))
arrange(df, x)
arrange(df, desc(x))
arrange(flights, desc(is.na(dep_time)), dep_time)

select鎸夊垪絳涢€?

select(flights, year, month, day)#鏍規(guī)嵁鍒楀悕鍗曢€夋嫨鏌愬嚑鍒?
select(flights,year:day)#榪為€夊嚑鍒?
select(flights, -(year:day))#榪為€?+鍙嶉€?
starts_with("abc")#閫夋嫨abc寮€澶寸殑鍚嶇О
ends_with("eyz") #鍖歸厤浠モ€渆yz鈥濈粨灝劇殑鍚嶇О
contains("ijk") #鍖歸厤鍖呭惈ijk鐨勫悕縐?
matches("(.)\1") #鍖歸厤姝g‘琛ㄨ揪寮忕殑閭d簺鍙橀噺
num_range("x",1:3) #鍖歸厤x1,x2,x3
rename(flights,tail_num = tailnum) #閲嶅懡鍚嶏紝淇敼tailnum鏀逛負(fù)tail_num
select(flights, time_hour, air_time, everything())#鏌愬嚑鍒楃Щ鍔ㄥ埌寮€澶達(dá)紝everyting鏄叾浣欏嚑鍒椼€?
緇冧範(fàn)
vars <- c("year", "month", "day", "dep_delay", "arr_delay")
select(flights, one_of(vars))
var 鏄痗haracter vector(鐗瑰緛鍚戦噺)銆傝繖鏍峰啓鍑虹殑select錛堬級(jí)涓嶉渶瑕佸啓澶氫釜鍚戦噺鍚?
select(flights,contains("YEAR",ignore.case = FALSE)) #鏈潵鏄拷鐣ュぇ灝忓啓錛岃繖鏍鋒槸涓嶅拷鐣ュぇ灝忓啓

5. mutate()鐢熸垚鏂板垪

mutate鐢熸垚鏂板垪鍚庯紝娣誨姞鏂板垪鍒版暟鎹鏈熬錛岀敓鎴愭柊鐨勬暟鎹銆倀ransmute鍒欐槸鍙繚鐣欐柊鐢熸垚鐨勫垪錛屽師鏈夌殑鍒楀姞鍑忎箻闄ょ瓑璁$畻鍑虹殑緇撴灉浣滀負(fù)鏂板垪

鐢熸垚gain鍜宻peed

flights_sml <- select(flights,
year:day,
ends_with("delay"),
distance,
air_time)
flights_sml
mutate(flights_sml,
gain = dep_delay - arr_delay,
speed = distance / air_time * 60)
鏂板垪鍙互鐩存帴鍙備笌鍙︿竴鏂板垪鐨勭敓鎴?
mutate(flights_sml,
gain = dep_delay - arr_delay,
hours = air_time / 60,
gain_per_hour = gain / hours)
transmute()鍙繚鐣欐柊鍒?
transmute(flights,
gain = dep_delay - arr_delay,
hours = air_time /60,
gain_per_hour = gain / hours)
summarise()##榪涜鍒嗙粍鎽樿
summarise(flights, delay = mean(dep_delay, na.rm = TRUE))
group_by()鍑芥暟浼?xì)鋴蓅ummarize鏇存湁鐢?
by_day <- group_by(flights, year, month, day)
summarise(by_day, delay = mean(dep_delay, na.rm = TRUE))

綆¢亾鎿嶄綔

綆¢亾鎿嶄綔浼?xì)绠€鍖栦唬鐮侊紝鏁版嵁妗嗗悕涓嶅繀閲嶅鍐欏嬈?

level1鈥斺€旂敓鎴愪腑闂翠駭鐗?

by_day <- group_by(flights, year, month, day)
summarise(by_day, delay = mean(dep_delay, na.rm = TRUE))

level2鈥斺€?

summarise(group_by(flights, year, month, day), delay = mean(dep_delay, na.rm = TRUE))

level3鈥斺€旂閬撴搷浣滈摼鎺ヤ袱姝ワ紝鏁版嵁妗嗗悕鍦ㄦ嫭鍙烽噷闈?

group_by(flights, year, month, day) %>% summarise(delay = mean(dep_delay, na.rm = TRUE))

level4_

flights %>% group_by(year, month, day) %>% summarise(delay = mean(dep_delay, na.rm = TRUE))
錛?2錛夌己澶卞€?
濡傛灉鏁版嵁涓湁NA錛岃綆楃粨鏋滃氨鍏ㄩ儴涓篘A錛屾墍浠ヤ唬鐮佷腑闇€瑕? na.rm = TRUE. 璁$畻鍓嶇Щ闄ょ己澶卞€?
錛堣鏁幫級(jí)

璁℃暟

渚嬪瓙錛氭壘鍑哄鉤鍧囧歡璇椂闂存渶闀跨殑椋炴満
錛堟牴鎹畉ailname榪涜鍒嗙粍錛屽緱鍒扮殑鏄叏騫村悓涓€鏋墮鏈虹殑鍚勭鏁版嵁錛?
carriers <- group_by(flights, carrier)
s1 <- summarise(carriers, n())
s1
s2 <- count(flights, carrier)

s2
mu <- mutate(carriers,n = n())
s3 <- distinct(mu, n)
s3
s4 <- distinct(mu, carrier, n)
s4
鍥涚鏂規(guī)硶緇熻鐨勭粨鏋滄槸涓€鑷寸殑錛宒istinct鏄幓閲嶅銆?

寫在最后,學(xué)習(xí)了好幾天熙尉,還看了小潔老師的筆記檩淋,最后保存時(shí)用UTF8,然后就成這樣了,弄的自己都不認(rèn)識(shí),我也是人才,還有我也轉(zhuǎn)換不過去了灼捂。這次當(dāng)交學(xué)費(fèi)了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末换团,一起剝皮案震驚了整個(gè)濱河市悉稠,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌艘包,老刑警劉巖的猛,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異辑甜,居然都是意外死亡衰絮,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門磷醋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人胡诗,你說我怎么就攤上這事邓线。” “怎么了煌恢?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵骇陈,是天一觀的道長。 經(jīng)常有香客問我瑰抵,道長你雌,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮婿崭,結(jié)果婚禮上拨拓,老公的妹妹穿的比我還像新娘。我一直安慰自己氓栈,他們只是感情好渣磷,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著授瘦,像睡著了一般醋界。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上提完,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天形纺,我揣著相機(jī)與錄音,去河邊找鬼徒欣。 笑死挡篓,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的帚称。 我是一名探鬼主播官研,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼闯睹!你這毒婦竟也來了戏羽?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤楼吃,失蹤者是張志新(化名)和其女友劉穎始花,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體孩锡,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡酷宵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了躬窜。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浇垦。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖荣挨,靈堂內(nèi)的尸體忽然破棺而出男韧,到底是詐尸還是另有隱情,我是刑警寧澤默垄,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布此虑,位于F島的核電站,受9級(jí)特大地震影響口锭,放射性物質(zhì)發(fā)生泄漏朦前。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望韭寸。 院中可真熱鬧春哨,春花似錦、人聲如沸棒仍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽莫其。三九已至癞尚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間乱陡,已是汗流浹背浇揩。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留憨颠,地道東北人胳徽。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像爽彤,于是被迫代替她去往敵國和親养盗。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容