Spark Streaming 調(diào)優(yōu)指南

Spark Streaming是架構(gòu)在Spark Core上的一個“應(yīng)用”啄栓,SparkStreaming主要由DStreamGraph撞叽、Job的生成姻成、數(shù)據(jù)的接收和導(dǎo)入以及容錯四大模塊組成,我們今天就從這四大模塊入手愿棋,看看每個模塊都有什么樣的調(diào)優(yōu)方式

SparkStraming調(diào)優(yōu)體系

1 DStreamGraph

其實(shí)這部分主要是算子的使用優(yōu)化科展,這個跟Spark調(diào)優(yōu)的內(nèi)容是相同,在這一部分可以優(yōu)化的內(nèi)容有

  • 重復(fù)使用的rdd進(jìn)行cache
  • 使用高性能的算子代替性能差的算子
    • reduceByKey\aggregateByKey代替groupByKey
    • 使用mappartition代替map
    • 使用foreachpartition代替foreach
  • 使用Kryo序列化代替Java序列化
  • filter之后使用coalesce減少小任務(wù)

2 Job的生成

這一部分主要涉及到的調(diào)優(yōu)是batchInternal的調(diào)整糠雨,為了程序不延遲地執(zhí)行才睹,合理的batchInternal是必要的

3 數(shù)據(jù)的接收和導(dǎo)入

這一部分主要是針對數(shù)據(jù)的接受速度進(jìn)行調(diào)優(yōu),如果接收速度大于處理數(shù)據(jù)甘邀,那么程序會走向無限延遲最后崩潰的道路,所以主要的調(diào)優(yōu)在于限速

  • 對于receiver和direct approach 方式都通用的
    spark.streaming.backpressure.enabled=true; sparkstreaming框架會自動地計算處理速度來控制數(shù)據(jù)的接受速度琅攘,建議開啟

  • receiver方式

    • spark.streaming.receiver.maxRate 來進(jìn)行限速
    • spark.streaming.blockInternal 設(shè)置緩存在內(nèi)存塊的大小,防止內(nèi)存被撐爆
  • direct approach方式

    • spark.streaming.kafka.maxRatePartition來對每個分區(qū)進(jìn)行限速

4 容錯

主要是數(shù)據(jù)的容錯方式選擇

  • 熱備:默認(rèn)開啟數(shù)據(jù)備份數(shù)為2
  • 冷備:開啟WAL松邪,將log保存到HDFS上坞琴,executor掛掉后可以從hdfs上進(jìn)行數(shù)據(jù)的恢復(fù)
  • 重放:對于數(shù)據(jù)源本身支持重放有效,如Kafka逗抑,失效后可以通過offset值進(jìn)行恢復(fù)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末剧辐,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子邮府,更是在濱河造成了極大的恐慌荧关,老刑警劉巖,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件褂傀,死亡現(xiàn)場離奇詭異忍啤,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)紊服,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門檀轨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人欺嗤,你說我怎么就攤上這事参萄。” “怎么了煎饼?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵讹挎,是天一觀的道長。 經(jīng)常有香客問我吆玖,道長筒溃,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任沾乘,我火速辦了婚禮怜奖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘翅阵。我一直安慰自己歪玲,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布掷匠。 她就那樣靜靜地躺著滥崩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪讹语。 梳的紋絲不亂的頭發(fā)上钙皮,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機(jī)與錄音顽决,去河邊找鬼短条。 笑死,一個胖子當(dāng)著我的面吹牛慌烧,可吹牛的內(nèi)容都是我干的鸠儿。 我是一名探鬼主播汹粤,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼汇四!你這毒婦竟也來了通孽?” 一聲冷哼從身側(cè)響起背苦,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤行剂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后固阁,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年更耻,在試婚紗的時候發(fā)現(xiàn)自己被綠了秧均。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锯七。...
    茶點(diǎn)故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖噪猾,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情丝蹭,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站茵典,受9級特大地震影響统阿,放射性物質(zhì)發(fā)生泄漏扶平。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一猜扮、第九天 我趴在偏房一處隱蔽的房頂上張望勉吻。 院中可真熱鬧,春花似錦旅赢、人聲如沸齿桃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽源譬。三九已至,卻和暖如春孕似,著一層夾襖步出監(jiān)牢的瞬間踩娘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留养渴,地道東北人雷绢。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像理卑,于是被迫代替她去往敵國和親翘紊。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容