spark setting up dynamic allocate 步驟 -原創(chuàng)

什么是spark 的dynamic allocate

  • 它允許你的spark 根據(jù) spark的運(yùn)行時(shí)的負(fù)載情況動(dòng)態(tài)增加或者減少executors 的個(gè)數(shù)

  • 下面展示的是一張靜態(tài)資源分配下spark實(shí)際使用的資源與分配的資源圖


  • 下面展示的是動(dòng)態(tài)資源分配下spark 實(shí)際使用的資源與分配的資源 圖


什么場景下使用spark 的dynamic allocate

  • 任何需要大的shuffle拉取的情況


開啟spark dynamic allocate 步驟設(shè)置

1. 設(shè)置環(huán)境變量

$ export HADOOP_CONF_DIR=/hadoop/hadoop-2.7XX/etc/hadoop
$ export HADOOP_HOME=/hadoop/hadoop-2.7XX
$ export SPARK_HOME=/hadoop/spark-2.4.0-bin-hadoop2.7
$ hds=(`cat ${HADOOP_CONF_DIR}/slaves` 'namenode1' 'namenode2') 
# 配置hadoop cluster 的所有機(jī)器的host 
# remeber to unset hds at the end

2. yarn文件配置

  • bakup yarn-site.xml

    $ for i in ${hds[@]}  ; do echo $i ; ssh $i "cp ${HADOOP_CONF_DIR}/yarn-site.xml ${HADOOP_CONF_DIR}/yarn-site.xml.pre_spark_shuffle.bak"  ; done;
    $ for i in ${hds[@]}  ; do echo $i ; ssh $i "ls ${HADOOP_CONF_DIR} | grep pre_spark_shuffle.bak"  ; done;
    
  • modify yarn-site.xml

    $ more ${HADOOP_CONF_DIR}/yarn-site.xml | grep -B 1 -A 2 "aux-services"
    
  • output

    <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle,spark_shuffle</value>
    </property>
    <property>
      <name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
      <value>org.apache.spark.network.yarn.YarnShuffleService</value>
    </property>
    
  • broadcast yarn-site.xml

     $ for i in ${hds[@]} ; do echo $i ; scp ${HADOOP_CONF_DIR}/yarn-site.xml ${i}:${HADOOP_CONF_DIR}/ ; done ;
     $ for i in ${hds[@]} ; do echo $i ; ssh $i  "cat ${HADOOP_CONF_DIR}/yarn-site.xml | grep -B 1 -A 2 'aux-services' " ; done ;
    
  • Check heapsize

    $ more ${HADOOP_CONF_DIR}/yarn-env.sh | grep "YARN_HEAPSIZE"
    
    • output

    YARN_HEAPSIZE=2000 # 根據(jù)實(shí)際情況調(diào)整
    
  • check yarn class path

    $ yarn classpath | sed -r 's/:/\n/g'
    $ more ${HADOOP_CONF_DIR}/yarn-site.xml | grep "yarn.application.classpath"  
    # if finds nothing  , we can use default path $HADOOP_HOME/share/hadoop/yarn/
    
  • check yarn shuffle jar

    $ find ${SPARK_HOME} -iname "*yarn-shuffle.jar" 
    # get result :  spark-2.4.0-yarn-shuffle.jar 
    
  • copy yarn shuffle jar

    $ for i in ${hds[@]} ; do echo $i ; scp `find ${SPARK_HOME} -iname "*yarn-shuffle.jar"` ${i}:$HADOOP_HOME/share/hadoop/yarn/ ; done ;
    $ for i in ${hds[@]}  ; do echo $i ; ll -ltr $HADOOP_HOME/share/hadoop/yarn/   | grep shuffle  ; done ;
    
  • Restart yarn

      $ bash $HADOOP_HOME/sbin/stop-yarn.sh
      $ bash $HADOOP_HOME/sbin/start-yarn.sh
    
  • check application

    $ for i in ${hds[@]}  ; do echo $i ; ssh $i ". /etc/profile ; jps" | grep -i manager  ; done;
    

3. spark 配置

  • spark-default.conf

    $ more ${SPARK_HOME}/conf/spark-defaults.conf
    
  • and add the following entries:

     spark.dynamicAllocation.enabled true
     spark.shuffle.service.enabled  true
     spark.dynamicAllocation.minExecutors 1
     spark.dynamicAllocation.maxExecutors 4
     spark.dynamicAllocation.executorIdleTimeout 60
    

refrence

ppt
config

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末叫惊,一起剝皮案震驚了整個(gè)濱河市旅急,隨后出現(xiàn)的幾起案子挨措,更是在濱河造成了極大的恐慌竞帽,老刑警劉巖腿短,帶你破解...
    沈念sama閱讀 222,729評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件程拭,死亡現(xiàn)場離奇詭異达传,居然都是意外死亡零院,警方通過查閱死者的電腦和手機(jī)议忽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,226評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門懒闷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人栈幸,你說我怎么就攤上這事愤估。” “怎么了速址?”我有些...
    開封第一講書人閱讀 169,461評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵玩焰,是天一觀的道長。 經(jīng)常有香客問我壳繁,道長震捣,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,135評(píng)論 1 300
  • 正文 為了忘掉前任闹炉,我火速辦了婚禮蒿赢,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘渣触。我一直安慰自己羡棵,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,130評(píng)論 6 398
  • 文/花漫 我一把揭開白布嗅钻。 她就那樣靜靜地躺著皂冰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪养篓。 梳的紋絲不亂的頭發(fā)上秃流,一...
    開封第一講書人閱讀 52,736評(píng)論 1 312
  • 那天,我揣著相機(jī)與錄音柳弄,去河邊找鬼舶胀。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的嚣伐。 我是一名探鬼主播糖赔,決...
    沈念sama閱讀 41,179評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼轩端!你這毒婦竟也來了放典?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,124評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤基茵,失蹤者是張志新(化名)和其女友劉穎奋构,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耿导,經(jīng)...
    沈念sama閱讀 46,657評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡声怔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,723評(píng)論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了舱呻。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片醋火。...
    茶點(diǎn)故事閱讀 40,872評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖箱吕,靈堂內(nèi)的尸體忽然破棺而出芥驳,到底是詐尸還是另有隱情,我是刑警寧澤茬高,帶...
    沈念sama閱讀 36,533評(píng)論 5 351
  • 正文 年R本政府宣布兆旬,位于F島的核電站,受9級(jí)特大地震影響怎栽,放射性物質(zhì)發(fā)生泄漏丽猬。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,213評(píng)論 3 336
  • 文/蒙蒙 一熏瞄、第九天 我趴在偏房一處隱蔽的房頂上張望脚祟。 院中可真熱鬧,春花似錦强饮、人聲如沸由桌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,700評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽行您。三九已至,卻和暖如春剪廉,著一層夾襖步出監(jiān)牢的瞬間娃循,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,819評(píng)論 1 274
  • 我被黑心中介騙來泰國打工斗蒋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留淮野,地道東北人捧书。 一個(gè)月前我還...
    沈念sama閱讀 49,304評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像骤星,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子爆哑,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,876評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容