[Flink State] 從源碼解析State的保存過(guò)程

1 前言

State要能發(fā)揮作用,就需要持久化到可靠存儲(chǔ)中映皆,flink中持久化的動(dòng)作就是checkpointing,那么從TM中執(zhí)行的Task的基類StreamTask的checkpoint邏輯說(shuō)起荷荤。

2 源碼解析

<1> StreamTask

  • 類作用說(shuō)明:
    所有流任務(wù)的基礎(chǔ)類睦霎,一個(gè)StreamTask是由TaskManagers部署并且運(yùn)行的本地處理的集合,每一個(gè)StreamTask運(yùn)行來(lái)自算子鏈上的一個(gè)或者多個(gè)StreamOperator。
    鏈接在一起的算子在同一個(gè)線程摔笤,也在同一個(gè)流分區(qū)上够滑,這些算子鏈就是連續(xù)的map/flatMap/filter任務(wù)。

  • StreamTask的生命周期
    (1)setInitialState:用來(lái)提供算子鏈上所有算子的狀態(tài)
    (2)invoke:

  • 關(guān)于checkpoint方法
    triggerCheckpoint方法:checkpoint協(xié)調(diào)器異步調(diào)用此方法以觸發(fā)檢查點(diǎn)吕世。

performCheckpoint方法

(1)如上所示彰触,可以進(jìn)行checkpoint操作。
Step1:準(zhǔn)備checkpoint工作命辖,允許算子進(jìn)行一些pre-barrier工作况毅。在通常情況下,pre-barrier工作應(yīng)該為零或最少尔艇。
(通常是在算子輸出其checkpoint barrier之前尔许,需要進(jìn)行快照時(shí)調(diào)用;此方法方法不應(yīng)用于任何實(shí)際狀態(tài)快照邏輯终娃,因?yàn)樗举|(zhì)上將在操作員檢查站的同步部分之內(nèi)味廊。 如果在此方法中完成繁重的工作,它將影響等待時(shí)間和下游檢查點(diǎn)對(duì)齊棠耕。)
Step2:將checkpoint barrier發(fā)送到下游余佛。
Step3:進(jìn)行狀態(tài)快照,這應(yīng)該很大程度上是異步操作昧辽,以免影響流式拓?fù)涞倪M(jìn)度衙熔。

(2)不能進(jìn)行廣播操作,則將CancelCheckpointMarker廣播出去

checkpointState方法:


(1)創(chuàng)建CheckpointStreamFactory(檢查點(diǎn)輸出流工廠搅荞,用于保留檢查點(diǎn)的數(shù)據(jù))
該接口的實(shí)現(xiàn)類或繼承接口:


由CheckpointStorage實(shí)例調(diào)用resolveCheckpointStorageLocation方法獲取工廠
(2)創(chuàng)建CheckpointingOperation實(shí)例红氯,并執(zhí)行executeCheckpointing方法,在該方法中咕痛,會(huì)遍歷每一個(gè)算子痢甘,進(jìn)行checkpointStreamOperator操作;
該操作就是對(duì)當(dāng)前算子進(jìn)行snapshotState操作茉贡。


下面開(kāi)始進(jìn)入StreamOperator的snapshotState方法塞栅。

<2> StreamOperator的snapshotState方法
StreamOperator源碼簡(jiǎn)析
Apache Flink源碼解析 (四)Stream Operator
算子調(diào)用該方法進(jìn)行狀態(tài)的快照操作,而該方法的基本實(shí)現(xiàn)是在AbstractStreamOperator中的snapshotState方法腔丧。
在該方法中放椰,分別調(diào)用了OperatorStateBackend和KeyedStateBackend的snapshot方法。
特別注意愉粤,在調(diào)用這兩個(gè)方法之前的snapshotState(snapshotContext)這個(gè)調(diào)用砾医,它一方面實(shí)現(xiàn)了Raw的State的snapshot,一方面也實(shí)現(xiàn)了用戶自定義的函數(shù)的State的更新衣厘。

snapshotState(snapshotContext)方法:
對(duì)于具有狀態(tài)的流運(yùn)算符如蚜,想要加入快照需要重寫此hook方法压恒。

什么是CheckpointStateOutputStream?
不同的StateBackEnd會(huì)有不同的實(shí)現(xiàn)错邦,會(huì)返回不同的CheckpointStateOutputStream實(shí)現(xiàn)探赫,比如FsStateBackEnd會(huì)構(gòu)造文件流,而MemoryStateBackEnd就會(huì)構(gòu)造ByteAttayOutputStream撬呢。
而CheckpointStateOutputStream會(huì)作為IO代理包含在KeyedStateCheckpointOutputStream 和 OperatorStateCheckpointOutputStream內(nèi)伦吠。
KeyedStateCheckpointOutputStream 和 OperatorStateCheckpointOutputStream 分別需要記錄額外的狀態(tài)。KeyedStateCheckpointOutputStream 需要記錄每個(gè)keyGroup起始在流中的位置, OperatorStateCheckpointOutputStream 需要記錄每個(gè)partition起始在流中的位置, 這些信息都會(huì)體現(xiàn)在對(duì)應(yīng)的StreamStateHandle中.

todo!!!!

operatorStateBackend和keyedStateBackend的snapshot方法:
將stateBackend備份到用戶指定的文件系統(tǒng)倾芝。
snapshot方法是在接口SnapshotStrategy中定義讨勤,SnapshotStrategy的實(shí)現(xiàn)類如下:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市晨另,隨后出現(xiàn)的幾起案子潭千,更是在濱河造成了極大的恐慌,老刑警劉巖借尿,帶你破解...
    沈念sama閱讀 207,113評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件刨晴,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡路翻,警方通過(guò)查閱死者的電腦和手機(jī)狈癞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)茂契,“玉大人蝶桶,你說(shuō)我怎么就攤上這事〉粢保” “怎么了真竖?”我有些...
    開(kāi)封第一講書人閱讀 153,340評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)厌小。 經(jīng)常有香客問(wèn)我恢共,道長(zhǎng),這世上最難降的妖魔是什么璧亚? 我笑而不...
    開(kāi)封第一講書人閱讀 55,449評(píng)論 1 279
  • 正文 為了忘掉前任讨韭,我火速辦了婚禮,結(jié)果婚禮上癣蟋,老公的妹妹穿的比我還像新娘透硝。我一直安慰自己,他們只是感情好疯搅,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布濒生。 她就那樣靜靜地躺著,像睡著了一般秉撇。 火紅的嫁衣襯著肌膚如雪甜攀。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 49,166評(píng)論 1 284
  • 那天琐馆,我揣著相機(jī)與錄音规阀,去河邊找鬼。 笑死瘦麸,一個(gè)胖子當(dāng)著我的面吹牛谁撼,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播滋饲,決...
    沈念sama閱讀 38,442評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼厉碟,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了屠缭?” 一聲冷哼從身側(cè)響起箍鼓,我...
    開(kāi)封第一講書人閱讀 37,105評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎呵曹,沒(méi)想到半個(gè)月后款咖,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡奄喂,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評(píng)論 2 325
  • 正文 我和宋清朗相戀三年铐殃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片跨新。...
    茶點(diǎn)故事閱讀 38,161評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡富腊,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出域帐,到底是詐尸還是另有隱情赘被,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評(píng)論 4 323
  • 正文 年R本政府宣布俯树,位于F島的核電站帘腹,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏许饿。R本人自食惡果不足惜阳欲,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望陋率。 院中可真熱鬧球化,春花似錦、人聲如沸瓦糟。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,352評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)菩浙。三九已至巢掺,卻和暖如春句伶,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背陆淀。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,584評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工考余, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人轧苫。 一個(gè)月前我還...
    沈念sama閱讀 45,618評(píng)論 2 355
  • 正文 我出身青樓楚堤,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親含懊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子身冬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評(píng)論 2 344