1.2 Spark-RDD彈性的七大特性

1.自動(dòng)進(jìn)行內(nèi)存和磁盤存儲(chǔ)的切換

spark會(huì)優(yōu)先將數(shù)據(jù)存儲(chǔ)在內(nèi)存中,如果內(nèi)存放不下床蜘,才把數(shù)據(jù)寫入磁盤辙培,不但能計(jì)算內(nèi)存中的數(shù)據(jù)蔑水,也能計(jì)算內(nèi)存放不下的數(shù)據(jù)。

2.基于Lineage(血統(tǒng))高容錯(cuò)機(jī)制

Lineage是基于spark的依賴關(guān)系來完成扬蕊,每個(gè)操作只關(guān)聯(lián)父操作搀别,各分片之間的數(shù)據(jù)互不影響,出現(xiàn)錯(cuò)誤的時(shí)候只需要恢復(fù)單個(gè)的split特定部分厨相。

常規(guī)容錯(cuò)方式有兩種:

數(shù)據(jù)檢查點(diǎn)

通過數(shù)據(jù)中心的網(wǎng)絡(luò)連接各臺(tái)機(jī)器领曼,如果發(fā)生checkPoint的時(shí)候就需要復(fù)制數(shù)據(jù),復(fù)制是要通過網(wǎng)絡(luò)傳輸?shù)穆虼司W(wǎng)絡(luò)寬帶是分布式的瓶頸庶骄,對(duì)存儲(chǔ)的資源也是很大的消耗。

記錄數(shù)據(jù)的更新

當(dāng)有數(shù)據(jù)更新的時(shí)候践磅,就需要記錄數(shù)據(jù)单刁,這種方式不需要復(fù)制數(shù)據(jù)集。

  • RDD是不可變的且lazy的
  • RDD的寫操作是粗粒度的府适、讀操作可以是粗粒度羔飞,也可以是細(xì)粒度。

3.Task失敗會(huì)進(jìn)行特定次數(shù)的重試

默認(rèn)重試次數(shù)是4次檐春。TaskSchedulimpl的源碼如下:

  def this(sc: SparkContext) = {
    this(
      sc,
      sc.conf.get(config.MAX_TASK_FAILURES),
      TaskSchedulerImpl.maybeCreateBlacklistTracker(sc))
  }

  private[spark] val MAX_TASK_FAILURES =
    ConfigBuilder("spark.task.maxFailures")
      .intConf
      .createWithDefault(4)

4.Stage失敗逻淌,會(huì)自動(dòng)進(jìn)行特定次數(shù)的重試

Stage可以跟蹤多個(gè)StageInfo(存儲(chǔ)SparkListener監(jiān)聽到的所有Stage信息,將Stage信息傳遞給Listeners或web UI)疟暖。重試默認(rèn)次數(shù)是4次卡儒,且可以直接運(yùn)行計(jì)算失敗的階段,只計(jì)算失敗的數(shù)據(jù)分片俐巴,具體Stage源碼如下:

private[spark] object DAGScheduler {
  // The time, in millis, to wait for fetch failure events to stop coming in after one is detected;
  // this is a simplistic way to avoid resubmitting tasks in the non-fetchable map stage one by one
  // as more failure events come in
  val RESUBMIT_TIMEOUT = 200

  // Number of consecutive stage attempts allowed before a stage is aborted
  val DEFAULT_MAX_CONSECUTIVE_STAGE_ATTEMPTS = 4
}

5.checkpoint和persist(檢查點(diǎn)和持久化)骨望,可以主動(dòng)或被動(dòng)觸發(fā)

checkpoint是對(duì)RDD進(jìn)行的標(biāo)記,會(huì)產(chǎn)生一系列的文件欣舵,且所有父依賴都會(huì)被刪除擎鸠,是整個(gè)依賴的終點(diǎn)。checkpoint是lazy級(jí)別的缘圈。
persist后劣光,RDD的每個(gè)分片會(huì)保存在內(nèi)存或磁盤中,下一次使用相同RDD進(jìn)行其他action計(jì)算的時(shí)候糟把,就可以重用赎线。

6.數(shù)據(jù)調(diào)度彈性、DAGSchedule糊饱、TaskSchedule調(diào)度和資源調(diào)度無關(guān)

spark講執(zhí)行模型抽象成有向無環(huán)圖(Stage),各個(gè)Stage之間可以串行或這并行颠黎,從而不需要把Stage的中間結(jié)果輸出到HDFS中另锋,當(dāng)節(jié)點(diǎn)發(fā)生故障時(shí)滞项,其他節(jié)點(diǎn)可以替代該節(jié)點(diǎn)運(yùn)行。

7.數(shù)據(jù)分片的高度彈性

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末夭坪,一起剝皮案震驚了整個(gè)濱河市文判,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌室梅,老刑警劉巖戏仓,帶你破解...
    沈念sama閱讀 222,183評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異亡鼠,居然都是意外死亡赏殃,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門间涵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仁热,“玉大人,你說我怎么就攤上這事勾哩】勾溃” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵思劳,是天一觀的道長迅矛。 經(jīng)常有香客問我,道長潜叛,這世上最難降的妖魔是什么秽褒? 我笑而不...
    開封第一講書人閱讀 59,854評(píng)論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮钠导,結(jié)果婚禮上震嫉,老公的妹妹穿的比我還像新娘。我一直安慰自己牡属,他們只是感情好票堵,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,871評(píng)論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著逮栅,像睡著了一般悴势。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上措伐,一...
    開封第一講書人閱讀 52,457評(píng)論 1 311
  • 那天特纤,我揣著相機(jī)與錄音,去河邊找鬼侥加。 笑死捧存,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播昔穴,決...
    沈念sama閱讀 40,999評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼镰官,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了吗货?” 一聲冷哼從身側(cè)響起泳唠,我...
    開封第一講書人閱讀 39,914評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宙搬,沒想到半個(gè)月后笨腥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,465評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡勇垛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,543評(píng)論 3 342
  • 正文 我和宋清朗相戀三年脖母,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片窥摄。...
    茶點(diǎn)故事閱讀 40,675評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡镶奉,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出崭放,到底是詐尸還是另有隱情哨苛,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評(píng)論 5 351
  • 正文 年R本政府宣布币砂,位于F島的核電站建峭,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏决摧。R本人自食惡果不足惜亿蒸,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,029評(píng)論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望掌桩。 院中可真熱鬧边锁,春花似錦、人聲如沸波岛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽则拷。三九已至贡蓖,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間煌茬,已是汗流浹背斥铺。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評(píng)論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坛善,地道東北人晾蜘。 一個(gè)月前我還...
    沈念sama閱讀 49,091評(píng)論 3 378
  • 正文 我出身青樓邻眷,卻偏偏與公主長得像,于是被迫代替她去往敵國和親笙纤。 傳聞我的和親對(duì)象是個(gè)殘疾皇子耗溜,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,685評(píng)論 2 360

推薦閱讀更多精彩內(nèi)容