storm topology生命周期

轉(zhuǎn)述自:Lifecycle of a Storm Topology

本文介紹的storm topology生命周期是基于0.7.1版本的,之后版本可能已發(fā)生了一些變化

我們從執(zhí)行storm jar命令提交topology給nimbus開始炮障,到supervisor啟動或停止worker泊业,再到task執(zhí)行整個過程進行描述衙傀,這其中也包括nimbus是如何監(jiān)控topology的乔煞。

關(guān)于topology的兩點說明:

1. 實際運行中的topology與我們看到的是不同的。運行過程中會有stream和acker bolt加入進來以保證數(shù)據(jù)處理的可靠性吱晒,system-topology函數(shù)負責(zé)topology的創(chuàng)建

2.system-topology用在a. nimbus創(chuàng)建task時 b.worker route消息時

啟動topology


storm jar命令會設(shè)置storm.jar環(huán)境變量在StormSubmitter上傳jar時使用,?然后帶著命令行參數(shù)執(zhí)行指定的class联四。StormSubmitter.submitTopology按以下步驟執(zhí)行:

? ? * ?upload未上傳過的jar文件

? ? * 使用nimbus的thrift接口實現(xiàn)uploading jars

? ? * uploadChunk每次上傳15kb的數(shù)據(jù)

? ? * 上傳完畢時調(diào)用finishFileUpload

? ? * topology的配置用json格式序列化


nimbus接收topology提交的請求撑碴,并對每個topology的配置進行規(guī)范格式化,完成topology一些靜態(tài)屬性的設(shè)置:

? ? * jars和configs存放在本地文件系統(tǒng)中朝墩,具體為:{nimbus local dir}/stormdist/{topology id}

? ? * setup-storm-static 將task--->component的映射寫入zookeeper

? ? * setup-heartbeats在zk中創(chuàng)建一個目錄來存放task心跳


nimbus調(diào)用mk-assignment給各個節(jié)點機分配任務(wù)醉拓,使用到以下信息:

? ? * master-code-dir: ?supervisors用來下載jars/configs

? ? * task->node+port: 任務(wù)id到worker的映射關(guān)系,worker由(node,port)對來標(biāo)識

? ? * node->host: node id到hostname的映射關(guān)系收苏。workers用這個映射關(guān)系來與其他worker進行通信廉嚼,node id用來標(biāo)識supervisors,因為多個supervisors可以運行在同一臺機器上

? ? * task->start-time-secs: 任務(wù)啟動的時間戳倒戏,nimbus用來監(jiān)控topology怠噪,launch time out需要設(shè)置的比心跳超時時間大一些,因為啟動時有很多初始任務(wù)要做杜跷,由nimbus.task.launch.secs設(shè)定

任務(wù)分配完處于deactivated模式傍念,start-storm將相關(guān)數(shù)據(jù)寫到zk之后進入active模式spouts開始emit tuples


supervisor默默的做兩件事:

? ? * 調(diào)用synchronize-supervisor,zk任務(wù)分配變化時就會執(zhí)行葛闷,另外每10s也會定時執(zhí)行憋槐,執(zhí)行時下載新的topology jars,將node要執(zhí)行的任務(wù)寫到本地文件系統(tǒng),其實是一個映射關(guān)系 port->localAssignment, LocalAssignment包含一個topo id還有task ids

? ? * 調(diào)用sync-processes, ?讀取第一件事寫到本地文件的內(nèi)容并與運行的topology對比以決定啟停worker

mk-worker函數(shù)用來啟動worker

? ? * worker之間互連并啟動一個線程監(jiān)控變化淑趾,如果worker任務(wù)變更會與啟停worker重連

? ? * 監(jiān)控topology是否active并將這個狀態(tài)賦給storm-active-atom變量阳仔,task根據(jù)這個變量決定是否調(diào)用spouts的nextTuple

? ? * worker啟動線程來執(zhí)行具體的tasks

mk-task函數(shù)用來啟動task

? ? * task啟動一個routing函數(shù),接收stream輸出tuple返回task ids(用來發(fā)送tuple)

? ? * task執(zhí)行spout和bolt業(yè)務(wù)邏輯


Topology監(jiān)控

nimbus對topology的整個生命周期進行監(jiān)控

? ? * 定時線程執(zhí)行日常任務(wù)的檢查

? ? * nimbus按一個有限狀態(tài)機轉(zhuǎn)動扣泊,包含:active\inactive\killed\rebalancing五個狀態(tài)

? ? * nimbus.monitor.freq.secs設(shè)定檢測周期近范,調(diào)用reassign-topology觸發(fā)monitor事件完成

? ? * reassign-topology調(diào)用mk-assignments來執(zhí)行topology的更新,更新時會啟停workers


殺掉Topology

storm kill調(diào)用nimbus thrift接口完成這個任務(wù)延蟹,可以用-w 指定remove topology的timeout评矩,

也給workers時機來處理完正在執(zhí)行的指令。kill命令是fault-tolerant的阱飘,當(dāng)nimbus恢復(fù)時會remove killed狀態(tài)的topology斥杜,之后刪除zk中該topology的信息和心跳目錄\jars\configs,這個由單獨的線程do-cleanup 完成

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末沥匈,一起剝皮案震驚了整個濱河市蔗喂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌高帖,老刑警劉巖缰儿,帶你破解...
    沈念sama閱讀 221,820評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異棋恼,居然都是意外死亡返弹,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評論 3 399
  • 文/潘曉璐 我一進店門爪飘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來义起,“玉大人,你說我怎么就攤上這事师崎∧眨” “怎么了?”我有些...
    開封第一講書人閱讀 168,324評論 0 360
  • 文/不壞的土叔 我叫張陵犁罩,是天一觀的道長齐蔽。 經(jīng)常有香客問我,道長床估,這世上最難降的妖魔是什么含滴? 我笑而不...
    開封第一講書人閱讀 59,714評論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮丐巫,結(jié)果婚禮上谈况,老公的妹妹穿的比我還像新娘。我一直安慰自己递胧,他們只是感情好碑韵,可當(dāng)我...
    茶點故事閱讀 68,724評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缎脾,像睡著了一般祝闻。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上遗菠,一...
    開封第一講書人閱讀 52,328評論 1 310
  • 那天联喘,我揣著相機與錄音,去河邊找鬼辙纬。 笑死耸袜,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的牲平。 我是一名探鬼主播堤框,決...
    沈念sama閱讀 40,897評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼纵柿!你這毒婦竟也來了蜈抓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,804評論 0 276
  • 序言:老撾萬榮一對情侶失蹤昂儒,失蹤者是張志新(化名)和其女友劉穎沟使,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體渊跋,經(jīng)...
    沈念sama閱讀 46,345評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡腊嗡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,431評論 3 340
  • 正文 我和宋清朗相戀三年着倾,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片燕少。...
    茶點故事閱讀 40,561評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡卡者,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出客们,到底是詐尸還是另有隱情崇决,我是刑警寧澤,帶...
    沈念sama閱讀 36,238評論 5 350
  • 正文 年R本政府宣布底挫,位于F島的核電站恒傻,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏建邓。R本人自食惡果不足惜盈厘,卻給世界環(huán)境...
    茶點故事閱讀 41,928評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望官边。 院中可真熱鬧扑庞,春花似錦、人聲如沸拒逮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽滩援。三九已至栅隐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間玩徊,已是汗流浹背租悄。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留恩袱,地道東北人泣棋。 一個月前我還...
    沈念sama閱讀 48,983評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像畔塔,于是被迫代替她去往敵國和親潭辈。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,573評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 目錄 場景假設(shè) 調(diào)優(yōu)步驟和方法 Storm 的部分特性 Storm 并行度 Storm 消息機制 Storm UI...
    mtide閱讀 17,139評論 30 60
  • 1. Storm介紹: Storm是實時流計算框架澈吨。企業(yè)中典型實時分析框架搭建模式: Flume + Kafka ...
    奉先閱讀 1,663評論 0 3
  • Strom集群結(jié)構(gòu)是有一個主節(jié)點(nimbus)和多個工作節(jié)點(supervisor)組成的主從結(jié)構(gòu)把敢,主節(jié)點通過配...
    看山遠兮閱讀 2,874評論 0 7
  • Date: Nov 17-24, 2017 1. 目的 積累Storm為主的流式大數(shù)據(jù)處理平臺對實時數(shù)據(jù)處理的相關(guān)...
    一只很努力爬樹的貓閱讀 2,177評論 0 4
  • 第一百零三章 別了,蘭州谅辣。 來了修赞,東莞。 文雍選擇在除夕那天出發(fā)桑阶,聽說那天的列車是最寬松的柏副,走之前他把商校杜大姐那...
    何來雍雅閱讀 253評論 1 4