Flink Checkpoint變遷與實踐

一队魏、歷史變遷

在Flink 1.0.0時期

提供了RocksDB的支持万搔，這個版本之前所有的狀態(tài)都只能存在進程的內存里面，這個內存總有存不下的一天瞬雹，如果存不下則會發(fā)生OOM。如果想要存更多數據酗捌、更大量State就要用到RocksDB。RocksDB是一款基于文件的嵌入式數據庫意敛，它會把數據存到磁盤，但是同時它又提供高效讀寫能力草姻。所以使用RocksDB不會發(fā)生OOM這種事情。

在Flink1.1.0里面撩独，提供了純異步化的RocksDB的snapshot。以前版本在做RocksDB的snapshot時它會同步阻塞主數據流的處理澳迫，很影響吞吐量，即每當checkpoint時主數據流就會卡住橄登。純異步化處理之后不會卡住數據流，于是吞吐量也得到了提升拢锹。

在Flink 1.3.0時期: 增量checkpoint

引入了增量的checkpoint這個比較重要的功能。只有基于增量的checkpoint才能更好地支持含有超大State的Job卒稳。如果每一次都把全量上TB的State都刷到遠程的HDFS上那么這個效率是很低下的。而增量checkpoint只是把checkpoint間隔新增的那些狀態(tài)發(fā)到遠程做存儲充坑，每一次checkpoint發(fā)的數據就少了很多，效率得到提高捻爷。在這個版本里面還引入了一個細粒度的recovery，細粒度的recovery在做恢復的時候役衡，有時不需要對整個Job做恢復薪棒，可能只需要恢復這個Job中的某一個子圖，這樣便能夠提高恢復效率俐芯。

在Flink 1.5.0時期：Local Recovery

引入了Task local 的State的recovery。因為基于checkpoint機制吧史，會把State持久化地存儲到某一個遠程存儲，比如HDFS贸营，當發(fā)生Failover的時候需要重新把這個數據從遠程HDFS再download下來，如果這個狀態(tài)特別大那么該download操作的過程就會很漫長钞脂，導致Failover恢復所花的時間會很長。Task local state recovery提供的機制是當Job發(fā)生Failover之后冰啃，能夠保證該Job狀態(tài)在本地不會丟失，進行恢復時只需在本地直接恢復阎毅，不需從遠程HDFS重新把狀態(tài)download下來，于是就提升了Failover recovery的效率扇调。

二、Asynchronous State Snapshots

我們注意到上面描述的機制意味著當 operator 向后端存儲快照時痴腌，會停止處理輸入的數據。這種同步操作會在每次快照創(chuàng)建時引入延遲士聪。

我們完全可以在存儲快照時，讓 operator 繼續(xù)處理數據剥悟，讓快照存儲在后臺異步運行。為了做到這一點区岗，operator 必須能夠生成一個后續(xù)修改不影響之前狀態(tài)的狀態(tài)對象。例如 RocksDB 中使用的寫時復制（ copy-on-write ）類型的數據結構慈缔。

接收到輸入的 barrier 時，operator異步快照復制出的狀態(tài)(注：checkpoint的同步部分藐鹤，復制狀態(tài)可能會花費較多的時間，這也是為什么checkpoint同步部分時間很長的原因)娱节。然后立即發(fā)射 barrier 到輸出流，繼續(xù)正常的流處理肄满。一旦后臺異步快照完成，它就會向 checkpoint coordinator（JobManager）確認 checkpoint 完成〕砬福現在 checkpoint 完成的充分條件是：所有 sink 接收到了 barrier，所有有狀態(tài) operator 都確認完成了狀態(tài)備份（可能會比 sink 接收到 barrier 晚）怒炸。

RocksDBStateBackend 模式對于較大的 Key 進行更新操作時序列化和反序列化耗時很多【琅冢可以考慮使用 FsStateBackend 模式替代。

三恢口、理解Checkpoint

image.png

heavy alignments

image.png

如何選用合適的狀態(tài)后端

image.png

最后編輯于：2018.12.19 18:11:30

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末耕肩，一起剝皮案震驚了整個濱河市问潭，隨后出現的幾起案子猿诸，更是在濱河造成了極大的恐慌狡忙，老刑警劉巖，帶你破解...
沈念sama閱讀 218,682評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件灾茁，死亡現場離奇詭異谷炸，居然都是意外死亡禀挫，警方通過查閱死者的電腦和手機旬陡，發(fā)現死者居然都...
沈念sama閱讀 93,277評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門语婴，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人砰左，你說我怎么就攤上這事〔酥埃” “怎么了旗闽？”我有些...
開封第一講書人閱讀 165,083評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長适室。經常有香客問我，道長捣辆，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,763評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任旧巾，我火速辦了婚禮，結果婚禮上忍些，老公的妹妹穿的比我還像新娘。我一直安慰自己廓握，他們只是感情好，可當我...
茶點故事閱讀 67,785評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布隙券。她就那樣靜靜地躺著，像睡著了一般娱仔。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上拟枚，一...
開封第一講書人閱讀 51,624評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音恩溅，去河邊找鬼。笑死脚乡，一個胖子當著我的面吹牛，可吹牛的內容都是我干的奶稠。我是一名探鬼主播，決...
沈念sama閱讀 40,358評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼锌订，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了辆飘？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,261評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤芹关，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后紧卒，有當地人在樹林里發(fā)現了一具尸體，經...
沈念sama閱讀 45,722評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡轴总，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年博个，在試婚紗的時候發(fā)現自己被綠了肘习。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片坡倔。...
茶點故事閱讀 40,030評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖罪塔，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情征堪，我是刑警寧澤，帶...
沈念sama閱讀 35,737評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布佃蚜，位于F島的核電站着绊，受9級特大地震影響，放射性物質發(fā)生泄漏归露。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,360評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一剧包、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧疆液，春花似錦、人聲如沸堕油。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,941評論 0贊 22
一樁弒父案掉缺，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至攀圈，卻和暖如春暴凑，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背现喳。一陣腳步聲響...
開封第一講書人閱讀 33,057評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嗦篱，地道東北人。一個月前我還...
沈念sama閱讀 48,237評論 3贊 371
代替公主和親
正文我出身青樓诫欠，卻偏偏與公主長得像，于是被迫代替她去往敵國和親浴栽。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,976評論 2贊 355

Flink Checkpoint變遷與實踐

一队魏、歷史變遷

二、Asynchronous State Snapshots

三恢口、理解Checkpoint

推薦閱讀更多精彩內容