storm

  • 離線計(jì)算
    批量獲取數(shù)據(jù)晴弃、批量傳輸數(shù)據(jù)掩幢、周期性批量計(jì)算數(shù)據(jù)、數(shù)據(jù)展示(報(bào)表)
    代表技術(shù):sqoop批量導(dǎo)入數(shù)據(jù)上鞠、hdfs批量存儲(chǔ)數(shù)據(jù)际邻、mapreduce批量計(jì)算數(shù)據(jù)、hive批量計(jì)算數(shù)據(jù)旗国、任務(wù)調(diào)度
    在生產(chǎn)環(huán)境中安裝sqoop客戶端導(dǎo)入數(shù)據(jù)有生產(chǎn)風(fēng)險(xiǎn)枯怖。需要使用更安全的方式,比如用ftp采集能曾,內(nèi)天到ftp拿數(shù)據(jù)度硝。在一個(gè)公司內(nèi)部,對(duì)一份數(shù)據(jù)感興趣的部門很多寿冕,可以flume采集后蕊程,用kafka緩存,不同的部門根據(jù)需要拿數(shù)據(jù)驼唱。直接消費(fèi)或者存入hdfs
  • 流式計(jì)算
    數(shù)據(jù)實(shí)時(shí)產(chǎn)生藻茂、實(shí)時(shí)傳輸、實(shí)時(shí)計(jì)算玫恳、實(shí)時(shí)展示
    代表技術(shù):flume實(shí)時(shí)采集辨赐、kafka/metaq實(shí)時(shí)存儲(chǔ)數(shù)據(jù)、storm/jstorm實(shí)時(shí)計(jì)算數(shù)據(jù)京办、redis實(shí)時(shí)結(jié)果緩存掀序、mysql持久化存儲(chǔ)

Storm

用來實(shí)時(shí)計(jì)算源源不斷產(chǎn)生的數(shù)據(jù),如同流水線生產(chǎn)惭婿。
流式計(jì)算的一般架構(gòu):(如網(wǎng)站系統(tǒng))flume實(shí)時(shí)數(shù)據(jù)采集不恭、kafka臨時(shí)緩存數(shù)據(jù)叶雹、storm計(jì)算數(shù)據(jù)、redis結(jié)果存儲(chǔ)

Storm核心組件
storm核心組件

nimbus:資源分配换吧、任務(wù)調(diào)度
supervisor:接收任務(wù)折晦,啟動(dòng)和通知屬于自己管理的worker進(jìn)程。worker的數(shù)量根據(jù)端口號(hào)來沾瓦。一個(gè)worker里面不會(huì)運(yùn)行屬于不同的topology的執(zhí)行任務(wù)满着。
worker:執(zhí)行任務(wù)的具體組件(其實(shí)就是一個(gè)jvm)”┲簦可以執(zhí)行spout任務(wù)或者bolt任務(wù)漓滔。
zookeeper:保存分配任務(wù)信息、心跳信息乖篷、元數(shù)據(jù)信息
executor:可以理解為一個(gè)worker進(jìn)程中的工作線程响驴。一個(gè)executor中只能運(yùn)行隸屬于一個(gè)component(spout/bolt)的task。一個(gè)worker進(jìn)程中可以有一個(gè)或者多個(gè)executor線程撕蔼。
task:默認(rèn)情況下豁鲤,一個(gè)executor運(yùn)行一個(gè)task,非默認(rèn)情況可以有多個(gè)task鲸沮。每個(gè)component(spout/bolt)的并發(fā)度就是其對(duì)應(yīng)的task數(shù)量琳骡。(task也是各個(gè)節(jié)點(diǎn)之間進(jìn)行g(shù)rouping(partition)的單位)

Storm編程模型

storm編程模型

Topology:Storm中運(yùn)行的一個(gè)實(shí)時(shí)應(yīng)用程序
Datasource:外部數(shù)據(jù)源
Spout:在一個(gè)Topology中獲取源數(shù)據(jù)流的組件。將外部數(shù)據(jù)轉(zhuǎn)化為Storm內(nèi)部的數(shù)據(jù)讼溺,以Tuple為基本的傳輸單元下發(fā)給Bolt:接收Spout發(fā)送的數(shù)據(jù)楣号,或上游的bolt發(fā)送的數(shù)據(jù)。根據(jù)業(yè)務(wù)邏輯進(jìn)行處理怒坯。發(fā)送給下一個(gè)bolt或者存儲(chǔ)到某種介質(zhì)上(redis炫狱,mysql)。
Tuple:Storm內(nèi)部數(shù)據(jù)傳輸?shù)幕締卧拊常锩娣庋b了一個(gè)List對(duì)象视译,用來保存數(shù)據(jù)。
StreamGrouping:數(shù)據(jù)分組策略
---- 7種:ShuffleGrouping(Random函數(shù)random.nextInt(2))归敬、NonGrouping(Random函數(shù))酷含、FieldGrouping(Hash取模hashcode%num)、Local or ShuffleGrouping(本地或隨機(jī)汪茧,優(yōu)先本地)

  • 并發(fā)度
    topology在storm cluster中運(yùn)行時(shí)椅亚,并發(fā)主要和3個(gè)邏輯實(shí)體有關(guān):worker,executor舱污,task
    worker是一個(gè)進(jìn)程什往,executor是worker進(jìn)程中的工作線程。一個(gè)Executor中只能運(yùn)行隸屬于同一個(gè)component(spout/bolt)的task慌闭。一個(gè)Worker進(jìn)程中可以有一個(gè)或多個(gè)Executor線程别威。在默認(rèn)情況下,一個(gè)Executor運(yùn)行一個(gè)task驴剔。每個(gè)component(spout/bolt)的并發(fā)度就是這個(gè)component對(duì)應(yīng)的task數(shù)量省古。
    例:



    圖中是一個(gè)包含有兩個(gè) worker 進(jìn)程的拓?fù)洹F渲猩ナВ{(lán)色的 BlueSpout 有兩個(gè) executor豺妓,每個(gè) executor 中有一個(gè) task,并行度為 2布讹;綠色的 GreenBolt 有兩個(gè) executor琳拭,每個(gè) executor 有兩個(gè) task,并行度也為2描验;而黃色的YellowBolt 有 6 個(gè) executor白嘁,每個(gè) executor 中有一個(gè) task,并行度為 6膘流,因此絮缅,這個(gè)拓?fù)涞目偛⑿卸染褪?2 + 2 + 6 = 10。具體分配到每個(gè) worker 就有 10 / 2 = 5 個(gè) executor呼股。

一個(gè)worker只屬于一個(gè)topology,每個(gè)worker中運(yùn)行的task只能屬于這個(gè)topology耕魄。 反之,一個(gè)topology包含多個(gè)worker彭谁,其實(shí)就是這個(gè)topology運(yùn)行在多個(gè)worker上吸奴。一個(gè)topology要求的worker數(shù)量如果不被滿足,集群在任務(wù)分配時(shí)缠局,根據(jù)現(xiàn)有的worker先運(yùn)行topology则奥。如果當(dāng)前集群中worker數(shù)量為0,那么最新提交的topology將只會(huì)被標(biāo)識(shí)active甩鳄,不會(huì)運(yùn)行逞度,只有當(dāng)集群有了空閑資源之后,才會(huì)被運(yùn)行妙啃。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末档泽,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子揖赴,更是在濱河造成了極大的恐慌馆匿,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件燥滑,死亡現(xiàn)場(chǎng)離奇詭異渐北,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)铭拧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門赃蛛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恃锉,“玉大人,你說我怎么就攤上這事呕臂∑仆校” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵歧蒋,是天一觀的道長土砂。 經(jīng)常有香客問我,道長谜洽,這世上最難降的妖魔是什么萝映? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮阐虚,結(jié)果婚禮上序臂,老公的妹妹穿的比我還像新娘。我一直安慰自己敌呈,他們只是感情好贸宏,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著磕洪,像睡著了一般吭练。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上析显,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天鲫咽,我揣著相機(jī)與錄音,去河邊找鬼谷异。 笑死分尸,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的歹嘹。 我是一名探鬼主播箩绍,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼尺上!你這毒婦竟也來了材蛛?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤怎抛,失蹤者是張志新(化名)和其女友劉穎卑吭,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體马绝,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡豆赏,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片掷邦。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡白胀,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出耙饰,到底是詐尸還是另有隱情纹笼,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布苟跪,位于F島的核電站,受9級(jí)特大地震影響蔓涧,放射性物質(zhì)發(fā)生泄漏件已。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一元暴、第九天 我趴在偏房一處隱蔽的房頂上張望篷扩。 院中可真熱鬧,春花似錦茉盏、人聲如沸鉴未。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铜秆。三九已至,卻和暖如春讶迁,著一層夾襖步出監(jiān)牢的瞬間连茧,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國打工巍糯, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留啸驯,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓祟峦,卻偏偏與公主長得像罚斗,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子宅楞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 目錄 場(chǎng)景假設(shè) 調(diào)優(yōu)步驟和方法 Storm 的部分特性 Storm 并行度 Storm 消息機(jī)制 Storm UI...
    mtide閱讀 17,040評(píng)論 30 60
  • Storm入門系列之一:storm核心概念及特性 本文的將介紹一些 storm 入門的基礎(chǔ)知識(shí)针姿,包括 storm ...
    zhaif閱讀 3,079評(píng)論 0 17
  • 什么是實(shí)時(shí)流計(jì)算? 主要的處理模式可以分為:流處理咱筛,批處理 流處理是直接處理搓幌,有時(shí)也分為在線,離線,近線(st...
    Bloo_m閱讀 5,050評(píng)論 1 1
  • Date: Nov 17-24, 2017 1. 目的 積累Storm為主的流式大數(shù)據(jù)處理平臺(tái)對(duì)實(shí)時(shí)數(shù)據(jù)處理的相關(guān)...
    一只很努力爬樹的貓閱讀 2,158評(píng)論 0 4
  • 如果有一天,我們吵架了 請(qǐng)千萬不要拿我暴露給你的缺點(diǎn)來攻擊我 那會(huì)讓我覺得 為了你我連自己都背叛 可到頭來 又怎樣
    蓋玉閱讀 199評(píng)論 0 0