FLIP-6 Flink runtime設(shè)計(jì)文檔摘要(二)

這篇主要講信息流和容錯(cuò)的設(shè)計(jì)

組件設(shè)計(jì)細(xì)節(jié)

資源分配流程

slot-allocation-with-new-taskmanager.png
  • 4,6丟失則消息4重發(fā)阱飘,AllocationID用來標(biāo)志資源請(qǐng)求保證重發(fā)的時(shí)候RM不會(huì)重復(fù)申請(qǐng)資源窘游。如果在重試之前子巾,之前分配的slot已經(jīng)被釋放了马澈,那么可能會(huì)重新啟動(dòng)一個(gè)container(之前為了申請(qǐng)slot啟動(dòng)了一個(gè)TM崩泡,分配了一個(gè)slot但是沒用迈螟,所以自動(dòng)釋放了叉抡,RM認(rèn)為沒有可用的slot了,又啟動(dòng)了一個(gè)TM答毫?卜壕??)
  • 10丟失烙常,則可以依靠TM的自動(dòng)重新連接機(jī)制轴捎。ResourceID可以用來區(qū)分重復(fù)注冊(cè)
  • 12丟失,則超時(shí)重發(fā)蚕脏。在后面注冊(cè)環(huán)節(jié)注冊(cè)時(shí)提供了(AllocationID侦副,ResourceID)會(huì)因?yàn)锳llocationID沖突導(dǎo)致注冊(cè)失敗(忽略注冊(cè)信息)
  • 13丟失驼鞭,可以依靠心跳信息來保證消息
  • 14丟失秦驯,依靠TM自動(dòng)重新連接,依靠(AllocationID挣棕,ResourceID)

失敗處理

TaskManager 掛了

  • ResourceManager
    • 檢測(cè)方式译隘,通過心跳超時(shí)
    • 在yarn和mesos下亲桥,可以通過集群管理器額外獲得通知
    • 從 live tm 列表中清除TM
    • 如果有JM分配了這個(gè)TM的slot,則向這些JM發(fā)送TM掛了的信息
    • 啟動(dòng)新的container替換
  • JM
    • 檢測(cè)方式固耘,心跳超時(shí)
    • 可能會(huì)提前收到消息(來自RM)
    • 從slot pool中移除 來自這個(gè)TM的slot
    • 標(biāo)記在那個(gè)slot中運(yùn)行的task掛了题篷,啟動(dòng)task恢復(fù)邏輯
    • 如果資源不夠了,job降級(jí)厅目?
  • 失去的數(shù)據(jù)
    • 運(yùn)行的operator狀態(tài)番枚,不過可以通過checkpoint恢復(fù)
  • 恢復(fù)動(dòng)作
    • 重啟的TM會(huì)查找RM并重新注冊(cè)slot信息

RM掛了

  • TaskManager

    • 檢測(cè)方式:心跳超時(shí)
    • HA:在RM失去leader身份時(shí)會(huì)得到通知
    • 進(jìn)入重新注冊(cè)RM的邏輯,不過不需要取消任務(wù)
    • 一旦注冊(cè)成功损敷,向RM發(fā)送當(dāng)前的slot都分配給了那些job葫笼。當(dāng)前可用的slot有多少
  • JobManager

    • 檢測(cè)方式:心跳超時(shí)
    • HA:在RM失去Leader身份時(shí)會(huì)得到通知
    • JM等待RM恢復(fù)(通過leader-election service會(huì)得到通知),重新發(fā)送在pending request列表中的信息(只有資源申請(qǐng)收到了影響)
  • 失去的數(shù)據(jù)

    • 當(dāng)前運(yùn)行的container:從cluster manager中獲得
    • 可用的slot:從TM注冊(cè)獲得
    • slot的分配情況:從TM注冊(cè)獲得(slot分給了哪個(gè)job)
    • 延遲的slot 分配申請(qǐng):JM會(huì)重新申請(qǐng)資源拗馒,發(fā)送資源請(qǐng)求

可能會(huì)發(fā)生RM啟動(dòng)了一個(gè)container路星,之后RM掛了,恢復(fù)之后又啟動(dòng)了一個(gè)container诱桂。

第二個(gè)container會(huì)因?yàn)闆]有使用被自動(dòng)釋放(在一段時(shí)間之內(nèi))

JM掛了

  • TaskManager
    • 檢測(cè)方式:心跳超時(shí)
    • HA:
    • TM觸發(fā) master掛了的動(dòng)作(當(dāng)前是釋放所有task)
    • TM嘗試重新注冊(cè)JM(在一段時(shí)間之內(nèi))
    • 如果JM沒活過來則已經(jīng)分配的slot會(huì)被報(bào)告給RM可以被分配給其他JM
  • ResourceManager
    • 檢測(cè)方式:心跳超時(shí)
    • HA:
    • 可能會(huì)通知TM說JM掛了奥额,之外沒啥動(dòng)作了
  • 失去的數(shù)據(jù)
    • JobGraph,庫(kù)访诱,可以從持久存儲(chǔ)中獲得(HDFS)
    • 完成的checkpoint元數(shù)據(jù)信息,從HA中獲得
    • 任務(wù)的執(zhí)行狀態(tài)韩肝,任務(wù)會(huì)從上個(gè)checkpoint開始
    • 已經(jīng)注冊(cè)的TM触菜,TM會(huì)重新注冊(cè)相關(guān)信息
  • 恢復(fù)動(dòng)作
    • 獲得leader狀態(tài)
    • 注冊(cè)RM,(為了獲得TM掛了的信息)
    • 觸發(fā)job從上次完成的checkpoint恢復(fù)

JM和RM掛了

  • TM正常執(zhí)行JM掛了的邏輯
  • TM會(huì)嘗試提供給新的JMslot
  • TM停留在RM注冊(cè)循環(huán)中

TM和RM掛了

  • JM不能從RM獲取TM掛了的信息哀峻,但是可以通過心跳超時(shí)檢測(cè)到
  • 資源申請(qǐng)全部超時(shí)(或者取消)涡相,在RM上線的時(shí)候會(huì)嘗試重新啟動(dòng)
  • JM可能會(huì)job降級(jí)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市剩蟀,隨后出現(xiàn)的幾起案子催蝗,更是在濱河造成了極大的恐慌,老刑警劉巖育特,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件丙号,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡缰冤,警方通過查閱死者的電腦和手機(jī)犬缨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來棉浸,“玉大人怀薛,你說我怎么就攤上這事∶灾#” “怎么了枝恋?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵创倔,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我焚碌,道長(zhǎng)畦攘,這世上最難降的妖魔是什么双饥? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任劈猪,我火速辦了婚禮努潘,結(jié)果婚禮上女阀,老公的妹妹穿的比我還像新娘瀑构。我一直安慰自己虑灰,他們只是感情好濒旦,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布娜庇。 她就那樣靜靜地躺著偎漫,像睡著了一般爷恳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上象踊,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天温亲,我揣著相機(jī)與錄音,去河邊找鬼杯矩。 笑死栈虚,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的史隆。 我是一名探鬼主播魂务,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼泌射!你這毒婦竟也來了粘姜?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤熔酷,失蹤者是張志新(化名)和其女友劉穎孤紧,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拒秘,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡号显,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了躺酒。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咙轩。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖阴颖,靈堂內(nèi)的尸體忽然破棺而出活喊,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布钾菊,位于F島的核電站帅矗,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏煞烫。R本人自食惡果不足惜浑此,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望滞详。 院中可真熱鬧凛俱,春花似錦、人聲如沸料饥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽岸啡。三九已至原叮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間巡蘸,已是汗流浹背奋隶。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留悦荒,地道東北人唯欣。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像搬味,于是被迫代替她去往敵國(guó)和親境氢。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容