Learning Apache Flink(BASIC)

本文是參考Apache Flink v1.3官方文檔

1. Dataflows

Flink的程序包括兩部分钾军,streams和transformations嘲驾。stream指的就是流數(shù)據(jù),transformation指的是以stream作為輸入和輸出的操作诵盼。當程序執(zhí)行的時候惠豺,F(xiàn)link會將程序映射為一個streaming dataflows,如下所示

2. Parallel Dataflows

Flink的程序內部是分布式并行執(zhí)行的拦耐,所以在真正的執(zhí)行過程中耕腾,每個stream會有多個stream partitions,每個操作或者說transformation算子會有多個operator subtasks杀糯,如下所示

3. Tasks and Operator Chains

在分布式并發(fā)執(zhí)行的情況下,Task是由chains operator subtasks構成苍苞,并且每個task是一個線程固翰。例如下圖狼纬,首先source和map構成了一個chains operator,在并發(fā)過程中每個source和map算子又會分別產生兩個subtask骂际,即source[1],map[1]和source[2],map[2]疗琉。那么source[1],map[1]就叫做一個chains operator subtasks,也就是說source[1],map[1]會在一個線程中執(zhí)行歉铝,source[2],map[2]在另一個線程中執(zhí)行盈简。同樣,keyBy().window().apply()[1]也算是一個chains operator subtasks太示,所以keyBy().window().apply()[1]操作也會在一個獨立的線程中執(zhí)行柠贤。那么下圖相當于有5個task,因此需要5個線程來執(zhí)行這個streaming parallel dataflows类缤。

4. Job Managers, Task Managers

JobManagers負責調度task臼勉,管理checkpoints等工作。
TaskManagers也叫做workers餐弱,是主要負責執(zhí)行dataflow宴霸。類似于strom中worker的作用。每個TaskManager就是一個JVM進程膏蚓。

5. Task Slots

每個TaskManager就是一個JVM進程瓢谢,一個TaskManager中會啟動多個獨立的線程,每個線程執(zhí)行一個task驮瞧。為了管理TaskManager中可以使用的線程數(shù)(線程數(shù)決定了這個TaskManager中task的并發(fā)度)氓扛,引入了Task Slot的概念。Task Slot是一個邏輯概念剧董,用來執(zhí)行“one pipeline of parallel task”幢尚。可以理解為翅楼,每個task slot中執(zhí)行一個task尉剩。也就是說一個TaskManager中定義的task slot的數(shù)量就是這個TaskManager可以使用的線程數(shù),每個線程負責執(zhí)行一個task毅臊。

在Flink中的task slot概念類似于storm中executor的概念(storm基本概念請參考《Topology的并行度設置》)理茎,但是區(qū)別在于storm的executor中只能執(zhí)行相同bolt或者spout的任務,而task slot中執(zhí)行的是“pipeline task”管嬉,例如keyBy的結果可以直接作為window算子的輸入皂林,減少了線程間的數(shù)據(jù)交換,序列化反序列化等操作提高了資源利用率蚯撩。

假設集群中有2個TaskManagers每個配置3個slot础倍,將一個程序MapFunction的并行度設置為4,ReduceFunction的并行度設置為3胎挎,會得到如下所示的資源分配圖沟启,F(xiàn)link中所謂的pipeline可以理解為將任務“縱向”分割忆家,即每個task slot中會執(zhí)行整個Source - Map - Reduce過程,而storm中每個executor是“橫向”分割德迹,executor中要么都執(zhí)行Map任務要么都執(zhí)行Reduce任務芽卿。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市胳搞,隨后出現(xiàn)的幾起案子卸例,更是在濱河造成了極大的恐慌,老刑警劉巖肌毅,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件筷转,死亡現(xiàn)場離奇詭異,居然都是意外死亡芽腾,警方通過查閱死者的電腦和手機旦装,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來摊滔,“玉大人阴绢,你說我怎么就攤上這事〖杼桑” “怎么了呻袭?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長腺兴。 經常有香客問我左电,道長,這世上最難降的妖魔是什么页响? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任篓足,我火速辦了婚禮,結果婚禮上闰蚕,老公的妹妹穿的比我還像新娘栈拖。我一直安慰自己,他們只是感情好没陡,可當我...
    茶點故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布涩哟。 她就那樣靜靜地躺著,像睡著了一般盼玄。 火紅的嫁衣襯著肌膚如雪贴彼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天埃儿,我揣著相機與錄音器仗,去河邊找鬼。 笑死童番,一個胖子當著我的面吹牛青灼,可吹牛的內容都是我干的暴心。 我是一名探鬼主播妓盲,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼杂拨,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了悯衬?” 一聲冷哼從身側響起弹沽,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎筋粗,沒想到半個月后策橘,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡娜亿,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年丽已,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片买决。...
    茶點故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡沛婴,死狀恐怖,靈堂內的尸體忽然破棺而出督赤,到底是詐尸還是另有隱情嘁灯,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布躲舌,位于F島的核電站丑婿,受9級特大地震影響,放射性物質發(fā)生泄漏没卸。R本人自食惡果不足惜羹奉,卻給世界環(huán)境...
    茶點故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望约计。 院中可真熱鬧诀拭,春花似錦、人聲如沸病蛉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铺然。三九已至俗孝,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間魄健,已是汗流浹背赋铝。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留沽瘦,地道東北人革骨。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓农尖,卻偏偏與公主長得像,于是被迫代替她去往敵國和親良哲。 傳聞我的和親對象是個殘疾皇子盛卡,可洞房花燭夜當晚...
    茶點故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內容