FLIP-6 Flink runtime設(shè)計(jì)文檔摘要（一）

這篇主要是組件的職責(zé)和功能

每個(gè)JobManager負(fù)責(zé)一個(gè)Job，在提交JobGraph時(shí)創(chuàng)建，在job完成后銷毀
JobManager同樣可以通過savepoint創(chuàng)建

ResourceManager

根據(jù)不同的集群調(diào)度框架提供不同實(shí)現(xiàn)（YARN持灰，Mesos）

主要任務(wù)

處理資源請求（申請新的TaskManager）：在請求到來的時(shí)候可以啟動(dòng)新的container或者直接分配給job
異常檢測：如果JobManager或者TaskManager掛了，需要做相應(yīng)處理，通知相關(guān)組件
緩存TaskManager，以便重用宇整。在TaskManager（container）一段時(shí)間未使用時(shí)自動(dòng)釋放

根據(jù)不同實(shí)現(xiàn)方式可以選擇讓ResourceManager感知到 task slot。（增加一個(gè)map變量即可實(shí)現(xiàn)）

ResourceManager 是在多個(gè)Job運(yùn)行期間一直存活的
RecourceManager如果掛了不能影響當(dāng)前執(zhí)行的job芋膘，運(yùn)行的job可以繼續(xù)使用已經(jīng)分配的資源執(zhí)行鳞青，但是在RM掛了期間不能申請新的資源。
RM的不應(yīng)該依靠保存運(yùn)行時(shí)狀態(tài)來實(shí)現(xiàn)容錯(cuò)
- RM可以通過詢問JM为朋，TM來重新獲取信息盼玄。（RM自身重新獲取container,JM,TM的重新注冊）
- 特殊情況下可能仍然需要保存一些與cluster-manager相關(guān)的狀態(tài)。
JM向RM注冊自己潜腻，這樣便可以獲得TM的信息。如果JM被分配的資源所在的TM掛了器仗，會(huì)收到相關(guān)信息融涣。

如果slot足夠的話2,3步驟省略

design-runtime-simple.png

TaskManager

同時(shí)和RM，JM進(jìn)行信息交互精钮。同時(shí)需要心跳信息來檢測異常

與RM的交互

TM啟動(dòng)的時(shí)候會(huì)在RM注冊自己威鹿。RM斷開連接時(shí)會(huì)重連，并重新注冊自己轨香，上報(bào)自身的slot資源信息
每次心跳時(shí)忽你，TM也會(huì)發(fā)送自己的slot資源的可用狀態(tài)。而且TM和JM直接鏈接并發(fā)送資源信息臂容，這樣RM就會(huì)及時(shí)的感知到資源的變化科雳。
TM這邊看到的資源使用狀態(tài)是最正確的信息（自己的哪個(gè)slot被分配給了哪個(gè)JM）根蟹。通過這個(gè)信息RM可以得到資源的使用狀態(tài)
RM會(huì)告訴TM，TM的哪個(gè)slot被分配給了哪個(gè)JM糟秘。之后TM會(huì)把slot分配給JM简逮。如果分配失敗會(huì)告訴RM對(duì)應(yīng)的slot實(shí)際是不可用的（注：RM那邊的信息可能是錯(cuò)誤的，所以才會(huì)發(fā)送這個(gè)信息給TM尿赚，TM這邊的信息才是資源使用的真是情況散庶，參考上一條）
RM會(huì)向TM發(fā)送shutdown信息

與JM的交互

TM會(huì)根據(jù)JM的要求來分配slot給JM，在JM的Job完成之前這個(gè)slot都是屬于JM的凌净，完成后JM會(huì)釋放slot
TM會(huì)保存自己的slot分配信息（分配給了哪個(gè)JM）悲龟，JM失連則會(huì)觸發(fā)TM自身的master掛了的恢復(fù)邏輯
JM可以部署任務(wù)到JM被分配的slot中
JM失連，TM會(huì)嘗試分配給slot給JM（如果JM有HA冰寻，則新的JM還是負(fù)責(zé)這個(gè)Job）须教。如果一段時(shí)間之內(nèi)都注冊失敗，則所有分配給這個(gè)JM的slot都變?yōu)榭煞峙錉顟B(tài)性雄。當(dāng)之前Job的JM恢復(fù)后没卸，他需要重新從RM申請slot

JM的slot pool

JM有一個(gè)資源池記錄TM提供的slot資源

JM的調(diào)度器從slot pool中獲取slot來調(diào)度任務(wù)，這樣即使RM掛了JM也可以不失去分配的資源

InstanceManager是當(dāng)前slot pool的一個(gè)實(shí)現(xiàn)

SlotPool在無法滿足[資源申請]的時(shí)候會(huì)嘗試從RM中獲取資源秒旋，如果RM掛了或者RM不能提供資源或者請求超時(shí)约计，則[資源申請]失敗

SlotPool可以返還資源給RM，如果應(yīng)用已經(jīng)使用了最大資源后slotpool還有剩余

Dispatcher

Dispatcher 接受client的job提交迁筛，并在cluster manager上創(chuàng)建啟動(dòng)job

[圖片上傳失敗...(image-fc02df-1552733550212)]這個(gè)設(shè)計(jì)是因?yàn)?/p>

有的cluster manager需要一個(gè)集中式（觸發(fā) job 啟動(dòng)）和（監(jiān)控job）的模塊
可以作為一個(gè)常駐實(shí)例來等待任務(wù)提交

容錯(cuò)

核心容錯(cuò)機(jī)制是任務(wù)重啟煤蚌，并從checkpoint中恢復(fù)狀態(tài)

YARN

yarn-without-dispatcher.png

with dispatcher

yarn-with-dispatcher.png

容錯(cuò)方面：

RM和JM運(yùn)行在AM進(jìn)程中，異常檢測和進(jìn)程重啟由YARN執(zhí)行

JobGraph和庫细卧，會(huì)保存在AM的工作目錄中尉桩，YARN會(huì)將他們保存在私有的HDFS目錄中

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市贪庙，隨后出現(xiàn)的幾起案子蜘犁，更是在濱河造成了極大的恐慌，老刑警劉巖止邮，帶你破解...
沈念sama閱讀 221,198評(píng)論 6贊 514
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件这橙，死亡現(xiàn)場離奇詭異，居然都是意外死亡导披，警方通過查閱死者的電腦和手機(jī)屈扎，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,334評(píng)論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來撩匕，“玉大人鹰晨，你說我怎么就攤上這事。” “怎么了模蜡？”我有些...
開封第一講書人閱讀 167,643評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵漠趁，是天一觀的道長。經(jīng)常有香客問我哩牍，道長棚潦，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 59,495評(píng)論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任膝昆，我火速辦了婚禮丸边，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘荚孵。我一直安慰自己妹窖，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,502評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布收叶。她就那樣靜靜地躺著骄呼，像睡著了一般。火紅的嫁衣襯著肌膚如雪判没。梳的紋絲不亂的頭發(fā)上蜓萄，一...
開封第一講書人閱讀 52,156評(píng)論 1贊 308
城市分裂傳說
那天，我揣著相機(jī)與錄音澄峰，去河邊找鬼嫉沽。笑死，一個(gè)胖子當(dāng)著我的面吹牛俏竞，可吹牛的內(nèi)容都是我干的绸硕。我是一名探鬼主播，決...
沈念sama閱讀 40,743評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼魂毁，長吁一口氣：“原來是場噩夢啊……” “哼玻佩！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起席楚，我...
開封第一講書人閱讀 39,659評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤咬崔，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后烦秩，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體刁赦，經(jīng)...
沈念sama閱讀 46,200評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,282評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年闻镶，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丸升。...
茶點(diǎn)故事閱讀 40,424評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡铆农，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情墩剖，我是刑警寧澤猴凹，帶...
沈念sama閱讀 36,107評(píng)論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站岭皂，受9級(jí)特大地震影響郊霎，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜爷绘，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,789評(píng)論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一书劝、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧土至，春花似錦购对、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,264評(píng)論 0贊 23
一樁弒父案骡苞，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至楷扬，卻和暖如春解幽，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背烘苹。一陣腳步聲響...
開封第一講書人閱讀 33,390評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來泰國打工躲株，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人螟加。一個(gè)月前我還...
沈念sama閱讀 48,798評(píng)論 3贊 376
代替公主和親
正文我出身青樓徘溢，卻偏偏與公主長得像，于是被迫代替她去往敵國和親捆探。傳聞我的和親對(duì)象是個(gè)殘疾皇子然爆，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,435評(píng)論 2贊 359