【R】加速你的R代碼

背景

最近在做項(xiàng)目抡砂，對不同文件夾下的sas文件進(jìn)行整合聊训。

發(fā)現(xiàn)文件太多礁竞，合并效率非常低，于是請教了一下同事常用的一些加速方法靖苇；

待優(yōu)化的步驟

1.讀取數(shù)據(jù)過程

讀入數(shù)據(jù)過程選取特點(diǎn)列席噩，再進(jìn)行下游操作，這樣一定程度上可以提速（影響不太大）

read_sas(data_file, col_select = NULL )

2.循環(huán)優(yōu)化（for循環(huán)）

需要提前創(chuàng)建空表贤壁。循環(huán)進(jìn)行寫入悼枢；

foreach + doParallel 多核并行方案

library(foreach)
library(doParallel)

#registerDoParallel(no_cores)也可以
registerDoParallel(makeCluster(no_cores))

foreach()函數(shù)需要%dopar%命令并行化程序

#輸出向量設(shè)置.combine = c
foreach(exponent = 1:5, .combine = c)  %dopar%  base^exponent

[1]   3   9  27  81 243

#輸出矩陣設(shè)置.combine = rbind
foreach(exponent = 1:5, .combine = rbind)  %dopar%  base^exponent

         [,1]
result.1    3
result.2    9
result.3   27
result.4   81
result.5  243


#輸出列表設(shè)置.combine = list
foreach(exponent = 1:5, .combine = list, .multicombine=TRUE)  %dopar%  base^exponent

[[1]]
[1] 3

[[2]]
[1] 9

[[3]]
[1] 27

[[4]]
[1] 81

[[5]]
[1] 243

#輸出數(shù)據(jù)框設(shè)置.combine = data.frame
foreach(exponent = 1:5, .combine = data.frame)  %dopar%  base^exponent
  result.1 result.2 result.3 result.4 result.5
1        2        4        8       16       32

#關(guān)閉集群
stopImplicitCluster()

3.mclappy加速

適合管道思路，一直往下寫脾拆；

all_data <- mclapply(
1:length(all_ds_name) %>% set_names(all_ds_name),
function(i) {
read_sas(
str_glue('{folder_rawdata_snap}/{all_ds_name[i]}.sas7bdat'),
col_select = c(
project, Site, StudySiteNumber, Subject, InstanceName, DataPageName, RecordPosition, MinCreated,
instanceId, Folder
)
)
},
mc.cores = 8, mc.preschedule = F
)

4.purrr::map 家族函數(shù)

map(.x, .f, ...)：返回值為列表
map_lgl()馒索、map_int()给梅、map_dbl()、map_chr()：返回特定數(shù)據(jù)類型的向量双揪，在使用map_int()時需要注意數(shù)據(jù)類型的自動提升問題
map_dfc()动羽、map_dfr()：對數(shù)據(jù)進(jìn)行col_binding、row_binding得到數(shù)據(jù)框

mtcars %>%
  split(.$cyl) %>%
  map(~ lm(mpg ~ wt, data = .x)) %>% 
  map_dfr(~ as.data.frame(t(as.matrix(coef(.)))))

# 返回值
    (Intercept)        wt
  1    39.57120 -5.647025
  2    28.40884 -2.780106
  3    23.86803 -2.192438

5.分組或排序過程

group_by 或 arrage 比較多變量渔期，分組較多很慢运吓，dtplyr加速

query_posting_delay_query_detail <- query_detail %>%
select(Study, SiteName, StudyEnvironmentSiteNumber, SubjectName, Folder, Form, Field, `Log#`, MarkingGroupName, QryOpenDate, Name) %>%
filter(!(Name %in% c('Cancelled'))) %>%
filter(!(MarkingGroupName %in% c('Site from System'))) %>%
mutate(QryOpenDate = as_date(mdy_hms(QryOpenDate))) %>%
# use data.table for faster group summarize: 479.858 -> 0.112 seconds, under 95008 groups
lazy_dt() %>%
group_by(Study, SiteName, StudyEnvironmentSiteNumber, SubjectName, Folder, Form, Field, `Log#`, MarkingGroupName) %>%
summarise(QryOpenDate = min(QryOpenDate, na.rm = T)) %>%
ungroup() %>%
as_tibble()

歡迎評論交流~

參考：

http://www.reibang.com/p/c498c9d4cfaf

https://d.cosx.org/d/420387-r-for

http://showteeth.tech/posts/57211.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市疯趟，隨后出現(xiàn)的幾起案子拘哨，更是在濱河造成了極大的恐慌，老刑警劉巖信峻，帶你破解...
沈念sama閱讀 218,546評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件倦青，死亡現(xiàn)場離奇詭異，居然都是意外死亡盹舞，警方通過查閱死者的電腦和手機(jī)产镐，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來踢步，“玉大人癣亚，你說我怎么就攤上這事』裼。” “怎么了述雾？”我有些...
開封第一講書人閱讀 164,911評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長兼丰。經(jīng)常有香客問我玻孟，道長，這世上最難降的妖魔是什么鳍征？我笑而不...
開封第一講書人閱讀 58,737評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任黍翎，我火速辦了婚禮，結(jié)果婚禮上蟆技，老公的妹妹穿的比我還像新娘玩敏。我一直安慰自己，他們只是感情好质礼，可當(dāng)我...
茶點(diǎn)故事閱讀 67,753評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布旺聚。她就那樣靜靜地躺著，像睡著了一般眶蕉。火紅的嫁衣襯著肌膚如雪砰粹。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,598評論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音碱璃，去河邊找鬼弄痹。笑死，一個胖子當(dāng)著我的面吹牛嵌器，可吹牛的內(nèi)容都是我干的肛真。我是一名探鬼主播，決...
沈念sama閱讀 40,338評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼爽航，長吁一口氣：“原來是場噩夢啊……” “哼蚓让！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起讥珍，我...
開封第一講書人閱讀 39,249評論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤历极，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后衷佃，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體趟卸，經(jīng)...
沈念sama閱讀 45,696評論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,888評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年氏义，在試婚紗的時候發(fā)現(xiàn)自己被綠了锄列。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,013評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡觅赊，死狀恐怖右蕊，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情吮螺，我是刑警寧澤，帶...
沈念sama閱讀 35,731評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布帕翻，位于F島的核電站鸠补，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏嘀掸。R本人自食惡果不足惜紫岩，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,348評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望睬塌。院中可真熱鬧泉蝌，春花似錦、人聲如沸揩晴。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽硫兰。三九已至诅愚，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間劫映，已是汗流浹背违孝。一陣腳步聲響...
開封第一講書人閱讀 33,048評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工刹前，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人雌桑。一個月前我還...
沈念sama閱讀 48,203評論 3贊 370
代替公主和親
正文我出身青樓喇喉，卻偏偏與公主長得像，于是被迫代替她去往敵國和親校坑。傳聞我的和親對象是個殘疾皇子轧飞，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,960評論 2贊 355