12 Spark Streaming源碼解讀之Executor容錯安全性

要篇內容介紹Executor的容錯琢感,容錯方式有WAL碗暗、消息重放、其他

  1. 首先介紹WAL的方法昌阿,就是保存數據前饥脑,先把數據寫日志。從ReceiverSupervisorImpl的pushAndReportBlock的方法開始看懦冰,代碼如下
def pushAndReportBlock(
      receivedBlock: ReceivedBlock,
      metadataOption: Option[Any],
      blockIdOption: Option[StreamBlockId]
    ) {
    val blockId = blockIdOption.getOrElse(nextBlockId)
    val time = System.currentTimeMillis
    val blockStoreResult = receivedBlockHandler.storeBlock(blockId, receivedBlock)
    logDebug(s"Pushed block $blockId in ${(System.currentTimeMillis - time)} ms")
    val numRecords = blockStoreResult.numRecords
    val blockInfo = ReceivedBlockInfo(streamId, numRecords, metadataOption, blockStoreResult)
    trackerEndpoint.askWithRetry[Boolean](AddBlock(blockInfo))
    logDebug(s"Reported block $blockId")
}

調用receivedBlockHandler的storeBlock方法灶轰,receivedBlockHandler決定了采用哪種方式來存儲數據,代碼如下

private val receivedBlockHandler: ReceivedBlockHandler = {
    if (WriteAheadLogUtils.enableReceiverLog(env.conf)) {
      if (checkpointDirOption.isEmpty) {
        throw new SparkException(
          "Cannot enable receiver write-ahead log without checkpoint directory set. " +
            "Please use streamingContext.checkpoint() to set the checkpoint directory. " +
            "See documentation for more details.")
      }
      new WriteAheadLogBasedBlockHandler(env.blockManager, receiver.streamId,
        receiver.storageLevel, env.conf, hadoopConf, checkpointDirOption.get)
    } else {
      new BlockManagerBasedBlockHandler(env.blockManager, receiver.storageLevel)
    }
}

如果開啟WAL的方式刷钢,會將數據保存到checkpoint目錄笋颤,如果checkpoint目錄沒有配置,就拋出異常内地。
先看WriteAheadLogBasedBlockHandler伴澄,開啟WAL后,采用BlockManager存儲數據時就不需要復本了阱缓,否則和WAL同時做容錯就是重復性工作非凌,降低了系統(tǒng)的性能。
再看BlockManagerBasedBlockHandler荆针,就是將數據交給BlockManager存儲敞嗡,根據用戶定義的存儲級別來存儲,系統(tǒng)一般默認存儲級別為MEMORY_AND_DISK_SER_2航背,如果對數據安全性要求不高也可以不要復本秸妥。

  1. 消息重放就是一種非常高效的方式,采用kafka的Direct API接口讀取數據時首先計算offset的位置沃粗,如果job異常粥惧,根據消費的offset位置重新指定kafka的offset,從失敗的位置讀取最盅。kafka直接做為文件存儲系統(tǒng)突雪,就像hdfs一樣,具體怎么使用以后的章節(jié)還會介紹涡贱。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末咏删,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子问词,更是在濱河造成了極大的恐慌督函,老刑警劉巖,帶你破解...
    沈念sama閱讀 210,914評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異辰狡,居然都是意外死亡锋叨,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 89,935評論 2 383
  • 文/潘曉璐 我一進店門宛篇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來娃磺,“玉大人,你說我怎么就攤上這事叫倍⊥滴裕” “怎么了?”我有些...
    開封第一講書人閱讀 156,531評論 0 345
  • 文/不壞的土叔 我叫張陵吆倦,是天一觀的道長听诸。 經常有香客問我,道長蚕泽,這世上最難降的妖魔是什么蛇更? 我笑而不...
    開封第一講書人閱讀 56,309評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮赛糟,結果婚禮上派任,老公的妹妹穿的比我還像新娘。我一直安慰自己璧南,他們只是感情好掌逛,可當我...
    茶點故事閱讀 65,381評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著司倚,像睡著了一般豆混。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上动知,一...
    開封第一講書人閱讀 49,730評論 1 289
  • 那天皿伺,我揣著相機與錄音,去河邊找鬼盒粮。 笑死鸵鸥,一個胖子當著我的面吹牛,可吹牛的內容都是我干的丹皱。 我是一名探鬼主播妒穴,決...
    沈念sama閱讀 38,882評論 3 404
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼摊崭!你這毒婦竟也來了讼油?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,643評論 0 266
  • 序言:老撾萬榮一對情侶失蹤呢簸,失蹤者是張志新(化名)和其女友劉穎矮台,沒想到半個月后乏屯,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 44,095評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡瘦赫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,448評論 2 325
  • 正文 我和宋清朗相戀三年辰晕,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片耸彪。...
    茶點故事閱讀 38,566評論 1 339
  • 序言:一個原本活蹦亂跳的男人離奇死亡伞芹,死狀恐怖忘苛,靈堂內的尸體忽然破棺而出蝉娜,到底是詐尸還是另有隱情,我是刑警寧澤扎唾,帶...
    沈念sama閱讀 34,253評論 4 328
  • 正文 年R本政府宣布召川,位于F島的核電站,受9級特大地震影響胸遇,放射性物質發(fā)生泄漏荧呐。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,829評論 3 312
  • 文/蒙蒙 一纸镊、第九天 我趴在偏房一處隱蔽的房頂上張望倍阐。 院中可真熱鬧,春花似錦逗威、人聲如沸峰搪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,715評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽概耻。三九已至,卻和暖如春罐呼,著一層夾襖步出監(jiān)牢的瞬間鞠柄,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,945評論 1 264
  • 我被黑心中介騙來泰國打工嫉柴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留厌杜,地道東北人。 一個月前我還...
    沈念sama閱讀 46,248評論 2 360
  • 正文 我出身青樓计螺,卻偏偏與公主長得像期奔,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子危尿,可洞房花燭夜當晚...
    茶點故事閱讀 43,440評論 2 348

推薦閱讀更多精彩內容