spark性能調(diào)優(yōu)

最近遇到這樣一個報錯信息搬葬,記錄如下


問題描述:跑小數(shù)據(jù)量的時候沒有報錯艳悔,跑大數(shù)據(jù)量時報了這個錯
QQ圖片20190326100611.jpg
問題解決:

增加executor:
如果executor數(shù)量比較少,那么猜年,能夠并行執(zhí)行的task數(shù)量就比較少,就意味著乔外,我們的Application的并行執(zhí)行的能力就很弱。
比如有3個executor杨幼,每個executor有2個cpu core聂渊,那么同時能夠并行執(zhí)行的task四瘫,就是6個。6個執(zhí)行完以后诊胞,再換下一批6個task锹杈。增加了executor數(shù)量以后,那么竭望,就意味著,能夠并行執(zhí)行的task數(shù)量咬清,也就變多了。比如原先是6個影钉,現(xiàn)在可能可以并行執(zhí)行10個掘剪,甚至20個,100個夺谁。那么并行能力就比之前提升了數(shù)倍,數(shù)十倍蜡塌。相應的勿负,性能(執(zhí)行的速度),也能提升數(shù)倍~數(shù)十倍笆环。

增加每個executor的cpu core:
也是增加了執(zhí)行的并行能力。原本20個executor,每個才2個cpu core库菲。能夠并行執(zhí)行的task數(shù)量,
就是40個task”钋埽現(xiàn)在每個executor的cpu core溉浙,增加到了5個蒋荚。能夠并行執(zhí)行的task數(shù)量,就是100個task惊奇。執(zhí)行的速度播赁,提升了2倍左右。

增加每個executor的內(nèi)存量:
增加了內(nèi)存量以后容为,對性能的提升,有三點:
1替劈、如果需要對RDD進行cache得滤,那么更多的內(nèi)存,就可以緩存更多的數(shù)據(jù)耿戚,將更少的數(shù)據(jù)寫入磁盤,
甚至不寫入磁盤坛猪。減少了磁盤IO皂股。
2墅茉、對于shuffle操作呜呐,reduce端,會需要內(nèi)存來存放拉取的數(shù)據(jù)并進行聚合洋机。如果內(nèi)存不夠洋魂,也會寫入磁盤喜鼓。如果給executor分配更多內(nèi)存以后衔肢,就有更少的數(shù)據(jù),需要寫入磁盤角骤,甚至不需要寫入磁盤。減少了磁盤IO背桐,提升了性能胳赌。
3、對于task的執(zhí)行疑苫,可能會創(chuàng)建很多對象。如果內(nèi)存比較小捍掺,可能會頻繁導致JVM堆內(nèi)存滿了挺勿,
然后頻繁GC曲横,垃圾回收,minor GC和full GC禾嫉。(速度很慢)蚊丐。內(nèi)存加大以后,帶來更少的GC麦备,垃圾回收,
避免了速度變慢黍匾,性能提升呛梆。

結合案例

在我們在生產(chǎn)環(huán)境中,提交spark作業(yè)時填物,用的spark-submit shell腳本秀仲,里面調(diào)整對應的參數(shù)
/usr/local/spark/bin/spark-submit
--class cn.spark.sparktest.core.WordCountCluster
--num-executors 3 \ 配置executor的數(shù)量
--executor-memory 100m \ 配置每個executor的內(nèi)存大小
--executor-cores 3 \ 配置每個executor的cpu core數(shù)量
--driver-memory 100m \ 配置driver的內(nèi)存(影響很大)
/usr/local/SparkTest-0.0.1-SNAPSHOT-jar-with-dependencies.jar \

除此之外還可以通過數(shù)據(jù)傾斜調(diào)優(yōu)、資源調(diào)優(yōu)雁刷、shuffle調(diào)優(yōu)

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末沛励,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子目派,更是在濱河造成了極大的恐慌,老刑警劉巖白筹,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件谅摄,死亡現(xiàn)場離奇詭異,居然都是意外死亡顽照,警方通過查閱死者的電腦和手機闽寡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來植影,“玉大人淆院,你說我怎么就攤上這事何乎⊥帘纾” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵各墨,是天一觀的道長启涯。 經(jīng)常有香客問我恃轩,道長黎做,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任筷厘,我火速辦了婚禮宏所,結果婚禮上,老公的妹妹穿的比我還像新娘爬骤。我一直安慰自己,他們只是感情好骤铃,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布溃列。 她就那樣靜靜地躺著,像睡著了一般补鼻。 火紅的嫁衣襯著肌膚如雪雅任。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天硼婿,我揣著相機與錄音,去河邊找鬼禽车。 笑死,一個胖子當著我的面吹牛殉摔,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播栓撞,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼瓢颅!你這毒婦竟也來了弛说?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤巾兆,失蹤者是張志新(化名)和其女友劉穎虎囚,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體淘讥,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡堤如,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年搀罢,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片榔至。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡唧取,死狀恐怖铅鲤,靈堂內(nèi)的尸體忽然破棺而出枫弟,到底是詐尸還是另有隱情,我是刑警寧澤骇塘,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布韩容,位于F島的核電站,受9級特大地震影響奠货,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜递惋,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望萍虽。 院中可真熱鬧,春花似錦超全、人聲如沸邓馒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至财异,卻和暖如春唱遭,著一層夾襖步出監(jiān)牢的瞬間戳寸,已是汗流浹背拷泽。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工跌穗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留订晌,地道東北人蚌吸。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像羹唠,于是被迫代替她去往敵國和親奕枢。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359