終于到了心心念的R了综苔,看老師在短期內(nèi)成長(zhǎng)的軌跡惩系,深受鼓舞。這是離自己最近的榜樣如筛,通過(guò)努力定可到達(dá)彼岸堡牡!
一、必修作業(yè)-R基本操作
-
學(xué)R語(yǔ)言必讀之書(shū)
- 《R數(shù)據(jù)科學(xué)》——正在學(xué)杨刨,紙質(zhì)書(shū)遠(yuǎn)勝于電子書(shū)晤柄,雖然貴,但很值妖胀。
- 《R語(yǔ)言實(shí)戰(zhàn)》——挺好的入門(mén)書(shū)芥颈,太枯燥,沒(méi)看完赚抡,暫時(shí)丟下了爬坑。
- 《R數(shù)據(jù)可視化手冊(cè)》—— 算是對(duì)ggplot2的說(shuō)明吧。
- 常見(jiàn)命令和函數(shù)
x >- c("hello, R", "ggplot2")
y <- as.list( as.data.frame( as.array( as.array( as.matrix( as.factor( as.character(1:5)))))))
ggplot( data = XXX, mapping = aes( x = xxx, y = xxx, color = xxx, fill = xxx) +
geom_point/bar/smooth/line/histogram/boxplot( data = xxx, mapping = aes(),
stat = "xxx", position = "xxx") +
coord_fixed/flip/polar/equal() +
facet_wrap/grid()
二涂臣、求解答《R數(shù)據(jù)科學(xué)》3.5.2的習(xí)題2和4
- 習(xí)題2
比較air_time 和 arr_time - dep_time盾计。您期望看到什么?實(shí)際又看到什么赁遗?如何解決署辉?
下面是我的代碼,我覺(jué)得對(duì)岩四,但為何arr_time_dep_time在相減前轉(zhuǎn)化為分鐘哭尝,為何不等于air_time?
new_flights <- flights %>%
filter(!is.na(dep_time),!is.na(arr_time)) %>%
select(arr_time, dep_time, air_time) %>%
mutate(airtime = (arr_time %/% 100*60+arr_time %% 100-dep_time %/% 100*60-dep_time %% 100)) %>%
mutate(newairtime = ifelse(airtime < 0, airtime + 1440, airtime))
- 習(xí)題4
使用排秩函數(shù)找出10個(gè)延誤時(shí)間最長(zhǎng)的航班炫乓。如何處理名字相同的情況?仔細(xì)閱讀min_rank()的幫助文件献丑。
下面是我的代碼末捣,我跑了一下,覺(jué)得對(duì)又不對(duì)创橄。對(duì)是因?yàn)榍?0個(gè)沒(méi)有相同的arr_delay箩做,不對(duì)是我假設(shè),在這前10個(gè)排序的觀測(cè)值里妥畏,有兩個(gè)觀測(cè)值假設(shè)a和b邦邦,其排序分別是3安吁,4,他們的arr_time一樣大小燃辖,但是a和b的dep_time分別是12鬼店,15,那是不是a和b的名次反了呢黔龟,該如何解決妇智?
order <- flights %>%
+ mutate(mc = row_number(desc(order$arr_delay))) %>%
+ filter(between(mc,1,10))
以上兩個(gè)問(wèn)題在老師的R數(shù)據(jù)科學(xué)的讀書(shū)筆記里沒(méi)有對(duì)應(yīng)的解答,麻煩老師給看一下氏身。