Spark Core 性能調(diào)優(yōu)之配置進程參數(shù)

操作場景

? ? ? ? Spark on?YARN模式下,有Driver、ApplicationMaster宣渗、Executor三種進程吨铸。在任務調(diào)度和運行的過程中行拢,Driver和Executor承擔了很大的責任,而ApplicationMaster主要負責container的啟停诞吱。

? ? ? ? 因而Driver和Executor的參數(shù)配置對spark應用的執(zhí)行有著很大的影響意義舟奠。用戶可通過如下操作對Spark集群性能做優(yōu)化。

操作步驟

1. 配置Driver內(nèi)存房维。

Driver負責任務的調(diào)度沼瘫,和Executor、AM之間的消息通信咙俩。當任務數(shù)變多耿戚,任務平行度增大時湿故,Driver內(nèi)存都需要相應增大∧せ祝可以根據(jù)實際任務數(shù)量的多少坛猪,為Driver設置一個合適的內(nèi)存。

● 將“spark-defaults.conf”中的“spark.driver.memory”配置項或者“spark-env.sh”中的“SPARK_DRIVER_MEMORY”配置項設置為合適大小皂股。

● 在使用spark-submit命令時墅茉,添加“--driver-memory MEM”參數(shù)設置內(nèi)存。

2. 配置Executor個數(shù)呜呐。

每個Executor每個核同時能跑一個task就斤,所以增加了Executor的個數(shù)相當于增大了任務的并發(fā)度。在資源充足的情況下蘑辑,可以相應增加Executor的個數(shù)洋机,以提高運行效率。

● 將 “spark-defaults.conf” 中的 “spark.executor.instance” 配置項或者 “spark-env.sh” 中的 “SPARK_EXECUTOR_INSTANCES” 配置項設置為合適大小以躯。還可以設置動態(tài)資源調(diào)度功能進行優(yōu)化槐秧,詳情請參見?www.reibang.com/writer#/notebooks/15701476/notes/16128092?。

● 在使用spark-submit命令時忧设,添加“--num-executors NUM”參數(shù)設置Executor個數(shù)刁标。

3. 配置Executor核數(shù)。

每個Executor多個核同時能跑多個task址晕,相當于增大了任務的并發(fā)度膀懈。但是由于所有核共用Executor的內(nèi)存,所以要在內(nèi)存和核數(shù)之間做好平衡谨垃。

● 將“spark-defaults.conf”中的“spark.executor.cores”配置項或者“spark-env.sh”中的“SPARK_EXECUTOR_CORES”配置項設置為合適大小启搂。

● 在使用spark-submit命令時,添加“--executor-cores NUM”參數(shù)設置核數(shù)刘陶。

4. 配置Executor內(nèi)存胳赌。

Executor的內(nèi)存主要用于任務執(zhí)行、通信等匙隔。當一個任務很大的時候疑苫,可能需要較多資源,因而內(nèi)存也可以做相應的增加纷责;當一個任務較小運行較快時捍掺,就可以增大并發(fā)度減少內(nèi)存。

● 將“spark-defaults.conf”中的“spark.executor.memory”配置項或者“spark-env.sh”中的“SPARK_EXECUTOR_MEMORY”配置項設置為合適大小再膳。

● 在使用spark-submit命令時挺勿,添加“--executor-memory MEM”參數(shù)設置內(nèi)存。

例子

在執(zhí)行spark wordcount計算中喂柒。1.6T數(shù)據(jù)不瓶,250個executor禾嫉。

在默認參數(shù)下執(zhí)行失敗,出現(xiàn)Futures?timed out 和 OOM 錯誤湃番。

因為數(shù)據(jù)量大夭织,task數(shù)多,而wordcount每個task都比較小吠撮,完成速度快尊惰。當task數(shù)多時driver端相應的一些對象就變大了,而且每個task完成時executor和driver都要通信泥兰,這就會導致由于內(nèi)存不足弄屡,進程之間通信斷連等問題。

當把Driver的內(nèi)存設置到4g時鞋诗,應用成功跑完膀捷。


使用ThriftServer執(zhí)行TPC-DS測試套,默認參數(shù)配置下也報了很多錯誤:Executor

Lost等削彬。而當配置Driver內(nèi)存為30g全庸,executor核數(shù)為2,executor個數(shù)為125融痛,executor內(nèi)存為6g時壶笼,所有任務才執(zhí)行成功。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末雁刷,一起剝皮案震驚了整個濱河市覆劈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌沛励,老刑警劉巖责语,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異目派,居然都是意外死亡坤候,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進店門企蹭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來铐拐,“玉大人,你說我怎么就攤上這事练对。” “怎么了吹害?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵螟凭,是天一觀的道長。 經(jīng)常有香客問我它呀,道長螺男,這世上最難降的妖魔是什么棒厘? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮下隧,結果婚禮上奢人,老公的妹妹穿的比我還像新娘。我一直安慰自己淆院,他們只是感情好何乎,可當我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著土辩,像睡著了一般支救。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拷淘,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天各墨,我揣著相機與錄音,去河邊找鬼启涯。 笑死贬堵,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的结洼。 我是一名探鬼主播黎做,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼补君!你這毒婦竟也來了引几?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤挽铁,失蹤者是張志新(化名)和其女友劉穎伟桅,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體叽掘,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡楣铁,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了更扁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盖腕。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖浓镜,靈堂內(nèi)的尸體忽然破棺而出溃列,到底是詐尸還是另有隱情,我是刑警寧澤膛薛,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布听隐,位于F島的核電站,受9級特大地震影響哄啄,放射性物質(zhì)發(fā)生泄漏雅任。R本人自食惡果不足惜风范,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望沪么。 院中可真熱鬧硼婿,春花似錦、人聲如沸禽车。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哭当。三九已至猪腕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間钦勘,已是汗流浹背陋葡。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留彻采,地道東北人腐缤。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像肛响,于是被迫代替她去往敵國和親岭粤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容