大數(shù)據(jù)Storm相比于Spark浊服、Hadoop有哪些優(yōu)勢(shì)(摘錄)

一、可能很多初學(xué)大數(shù)據(jù)的伙伴不知道strom是什么胚吁,先給大家介紹一下strom:

分布式實(shí)時(shí)計(jì)算系統(tǒng)牙躺,storm對(duì)于實(shí)時(shí)計(jì)算的意義類(lèi)似于hadoop對(duì)于批處理的意義。

storm的適用場(chǎng)景腕扶。

流數(shù)據(jù)處理孽拷。Storm可以用來(lái)處理源源不斷流進(jìn)來(lái)的消息,處理之后將結(jié)果寫(xiě)入到某個(gè)存儲(chǔ)中去半抱。

分布式rpc乓搬。由于storm的處理組件是分布式的思犁,而且處理延遲極低,所以可以作為一個(gè)通用的分布式rpc框架來(lái)使用进肯。當(dāng)然激蹲,其實(shí)我們的搜索引擎本身也是一個(gè)分布式rpc系統(tǒng)

二、然后我們?cè)倏聪耂torm江掩、Spark学辱、 Hadoop都有何特點(diǎn)

Storm: 分布式實(shí)時(shí)計(jì)算,強(qiáng)調(diào)實(shí)時(shí)性环形,常用于實(shí)時(shí)性要求較高的地方策泣;

Hadoop:分布式批處理計(jì)算,強(qiáng)調(diào)批處理抬吟,常用于數(shù)據(jù)挖掘萨咕、分析;

Spark:是一個(gè)基于內(nèi)存計(jì)算的開(kāi)源的集群計(jì)算系統(tǒng)火本,目的是讓數(shù)據(jù)分析更加快速, Spark 是一種與 Hadoop 相似的開(kāi)源集群計(jì)算環(huán)境危队,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負(fù)載方面表現(xiàn)得更加優(yōu)越钙畔,換句話(huà)說(shuō)茫陆,Spark 啟用了內(nèi)存分布數(shù)據(jù)集,除了能夠提供交互式查詢(xún)外擎析,它還可以?xún)?yōu)化迭代工作負(fù)載簿盅。

圖片發(fā)自簡(jiǎn)書(shū)App

三、strom的優(yōu)勢(shì)

1. 簡(jiǎn)單編程

在大數(shù)據(jù)處理方面相信大家對(duì)hadoop已經(jīng)耳熟能詳揍魂,基于GoogleMap/Reduce來(lái)實(shí)現(xiàn)的Hadoop為開(kāi)發(fā)者提供了map桨醋、reduce原語(yǔ),使并行批處理程序變得非常地簡(jiǎn)單和優(yōu)美现斋。同樣讨盒,Storm也為大數(shù)據(jù)的實(shí)時(shí)計(jì)算提供了一些簡(jiǎn)單優(yōu)美的原語(yǔ),這大大降低了開(kāi)發(fā)并行實(shí)時(shí)處理的任務(wù)的復(fù)雜性步责,幫助你快速返顺、高效的開(kāi)發(fā)應(yīng)用。

Spark提供的數(shù)據(jù)集操作類(lèi)型有很多種蔓肯,不像Hadoop只提供了Map和Reduce兩種操作遂鹊。比如map,filter, flatMap,sample, groupByKey, reduceByKey, union, join, cogroup,mapValues, sort,partionBy等多種操作類(lèi)型,他們把這些操作稱(chēng)為T(mén)ransformations蔗包。同時(shí)還提供Count, collect, reduce, lookup, save等多種actions秉扑。這些多種多樣的數(shù)據(jù)集操作類(lèi)型,給上層應(yīng)用者提供了方便。各個(gè)處理節(jié)點(diǎn)之間的通信模型不再像Hadoop那樣就是唯一的Data Shuffle一種模式舟陆。用戶(hù)可以命名误澳,物化,控制中間結(jié)果的分區(qū)等秦躯∫湮剑可以說(shuō)編程模型比Hadoop更靈活.。

2. 多語(yǔ)言支持

除了用java實(shí)現(xiàn)spout和bolt踱承,你還可以使用任何你熟悉的編程語(yǔ)言來(lái)完成這項(xiàng)工作倡缠,這一切得益于Storm所謂的多語(yǔ)言協(xié)議。多語(yǔ)言協(xié)議是Storm內(nèi)部的一種特殊協(xié)議茎活,允許spout或者bolt使用標(biāo)準(zhǔn)輸入和標(biāo)準(zhǔn)輸出來(lái)進(jìn)行消息傳遞昙沦,傳遞的消息為單行文本或者是json編碼的多行。

Storm支持多語(yǔ)言編程主要是通過(guò)ShellBolt载荔,ShellSpout和ShellProcess這些類(lèi)來(lái)實(shí)現(xiàn)的盾饮,這些類(lèi)都實(shí)現(xiàn)了IBolt 和 ISpout接口,以及讓shell通過(guò)java的ProcessBuilder類(lèi)來(lái)執(zhí)行腳本或者程序的協(xié)議懒熙。

可以看到丘损,采用這種方式,每個(gè)tuple在處理的時(shí)候都需要進(jìn)行json的編解碼煌珊,因此在吞吐量上會(huì)有較大影響。

3. 支持水平擴(kuò)展

在Storm集群中真正運(yùn)行topology的主要有三個(gè)實(shí)體:工作進(jìn)程泌豆、線(xiàn)程和任務(wù)定庵。Storm集群中的每臺(tái)機(jī)器上都可以運(yùn)行多個(gè)工作進(jìn)程,每個(gè)工作進(jìn)程又可創(chuàng)建多個(gè)線(xiàn)程踪危,每個(gè)線(xiàn)程可以執(zhí)行多個(gè)任務(wù)蔬浙,任務(wù)是真正進(jìn)行數(shù)據(jù)處理的實(shí)體,我們開(kāi)發(fā)的spout贞远、bolt就是作為一個(gè)或者多個(gè)任務(wù)的方式執(zhí)行的畴博。

因此,計(jì)算任務(wù)在多個(gè)線(xiàn)程蓝仲、進(jìn)程和服務(wù)器之間并行進(jìn)行俱病,支持靈活的水平擴(kuò)展。

4. 容錯(cuò)性強(qiáng)

如果在消息處理過(guò)程中出了一些異常袱结,Storm會(huì)重新安排這個(gè)出問(wèn)題的處理單元亮隙。Storm保證一個(gè)處理單元永遠(yuǎn)運(yùn)行(除非你顯式殺掉這個(gè)處理單元)。

5. 可靠的消息保證

Storm可以保證spout發(fā)出的每條消息都能被“完全處理”垢夹,這也是直接區(qū)別于其他實(shí)時(shí)系統(tǒng)的地方溢吻,如S4。

6. 快速的消息處理

用ZeroMQ作為底層消息隊(duì)列, 保證消息能快速被處理

7. 本地模式果元,支持快速編程測(cè)試

Storm有一種“本地模式”促王,也就是在進(jìn)程中模擬一個(gè)Storm集群的所有功能犀盟,以本地模式運(yùn)行topology跟在集群上運(yùn)行topology類(lèi)似,這對(duì)于我們開(kāi)發(fā)和測(cè)試來(lái)說(shuō)非常有用蝇狼。

圖片發(fā)自簡(jiǎn)書(shū)App

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末阅畴,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子题翰,更是在濱河造成了極大的恐慌恶阴,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,743評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件豹障,死亡現(xiàn)場(chǎng)離奇詭異冯事,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)血公,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)微猖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人犀勒,你說(shuō)我怎么就攤上這事副女。” “怎么了垦写?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,285評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵吕世,是天一觀(guān)的道長(zhǎng)。 經(jīng)常有香客問(wèn)我梯投,道長(zhǎng)命辖,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,485評(píng)論 1 283
  • 正文 為了忘掉前任分蓖,我火速辦了婚禮尔艇,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘么鹤。我一直安慰自己终娃,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布蒸甜。 她就那樣靜靜地躺著棠耕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪柠新。 梳的紋絲不亂的頭發(fā)上昧辽,一...
    開(kāi)封第一講書(shū)人閱讀 49,821評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音登颓,去河邊找鬼搅荞。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的咕痛。 我是一名探鬼主播痢甘,決...
    沈念sama閱讀 38,960評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼茉贡!你這毒婦竟也來(lái)了塞栅?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,719評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤腔丧,失蹤者是張志新(化名)和其女友劉穎放椰,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體愉粤,經(jīng)...
    沈念sama閱讀 44,186評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡砾医,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了衣厘。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片如蚜。...
    茶點(diǎn)故事閱讀 38,650評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖影暴,靈堂內(nèi)的尸體忽然破棺而出错邦,到底是詐尸還是另有隱情,我是刑警寧澤型宙,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布撬呢,位于F島的核電站,受9級(jí)特大地震影響妆兑,放射性物質(zhì)發(fā)生泄漏魂拦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評(píng)論 3 313
  • 文/蒙蒙 一箭跳、第九天 我趴在偏房一處隱蔽的房頂上張望晨另。 院中可真熱鬧潭千,春花似錦谱姓、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,757評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至狈癞,卻和暖如春茄靠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蝶桶。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,991評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工慨绳, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,370評(píng)論 2 360
  • 正文 我出身青樓脐雪,卻偏偏與公主長(zhǎng)得像厌小,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子战秋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容