簡(jiǎn)述傳統(tǒng)的數(shù)據(jù)批處理架構(gòu)和Lambda架構(gòu)計(jì)數(shù)

大規(guī)模的計(jì)數(shù)任務(wù)在實(shí)踐中出乎意料的困難,本文主要介紹傳統(tǒng)的批處理架構(gòu)實(shí)現(xiàn)計(jì)數(shù)任務(wù)和基于Lambda架構(gòu)實(shí)現(xiàn)計(jì)數(shù)吗跋。

傳統(tǒng)的批處理架構(gòu):

持續(xù)讀取數(shù)據(jù)的數(shù)據(jù)流每小時(shí)創(chuàng)建一次文件逢艘,這些文件通常被存儲(chǔ)在HDFS或MapR-FS等分布式文件系統(tǒng)中蒸绩。由調(diào)度程序安排批處理作業(yè)鳞青,用定期運(yùn)行的批處理作業(yè)來(lái)實(shí)現(xiàn)應(yīng)用程序的持續(xù)性涩哟。數(shù)據(jù)被持續(xù)地分割為文件;然后批處理作業(yè)將文件作為輸入盼玄,分析計(jì)算最近生成的一個(gè)文件,然后輸出計(jì)數(shù)結(jié)果潜腻,以此達(dá)到持續(xù)處理數(shù)據(jù)的效果埃儿。

這個(gè)架構(gòu)主要存在以下問(wèn)題:

太多獨(dú)立的部分:

為了計(jì)算數(shù)據(jù)中的事件數(shù),這種架構(gòu)動(dòng)用了太多的系統(tǒng)融涣。每一個(gè)系統(tǒng)都有學(xué)習(xí)成本和管理成本童番,還可能存在預(yù)知不到的bug精钮。

對(duì)時(shí)間的處理方法不明確:

假設(shè)需要設(shè)為每30分鐘計(jì)數(shù)一次。這個(gè)變動(dòng)涉及工作流調(diào)整邏輯剃斧,從而使DevOps問(wèn)題與業(yè)務(wù)需求混淆轨香。

預(yù)警:

假設(shè)除了每小時(shí)計(jì)數(shù)一次之外,還需要盡可能早地收到計(jì)數(shù)預(yù)警幼东。為了做到這一點(diǎn)臂容,可以在定期運(yùn)行的批處理作業(yè)之外,引入Strom來(lái)采集消息流根蟹,Strom實(shí)時(shí)提供近似的計(jì)數(shù)脓杉,批處理作業(yè)每小時(shí)提供準(zhǔn)確的計(jì)數(shù)。但是這樣一來(lái)就向架構(gòu)增加了他一個(gè)系統(tǒng)简逮,以及與之相關(guān)的新編程模型球散。

亂序事件流:

在實(shí)踐事件中,大多數(shù)事件流都是亂序的散庶,即事件的實(shí)際發(fā)生順序和數(shù)據(jù)中心所記錄的順序不一樣蕉堰,這就意味著本屬于前一批的事件可能被錯(cuò)誤地歸入當(dāng)前一批,并且批處理架構(gòu)很難解決這個(gè)問(wèn)題悲龟。

批處理作業(yè)的界限不清晰:

‘每小時(shí)’的定義含糊不清分個(gè)時(shí)間點(diǎn)實(shí)際上取決于不同系統(tǒng)之間的交互屋讶。充其量也只能做到大約每小時(shí)分割一次,而在分割時(shí)間點(diǎn)前后的事件既可能被歸入前一批躲舌,也可能被歸入當(dāng)前一批丑婿。將數(shù)據(jù)以小時(shí)為單位進(jìn)行分割,實(shí)際上是最簡(jiǎn)單的方法没卸。

Lambda架構(gòu):

Lambda架構(gòu)用定期運(yùn)行的批處理作業(yè)來(lái)實(shí)現(xiàn)應(yīng)用程序的持續(xù)性羹奉,并通過(guò)流處理器獲得預(yù)警。流處理器實(shí)時(shí)提供近似結(jié)果约计;批處理層最終會(huì)對(duì)近似結(jié)果予以糾正诀拭。

Lambda架構(gòu)存在的問(wèn)題:

開發(fā)周期長(zhǎng):

需要維護(hù)兩套分別跑在批處理和實(shí)時(shí)計(jì)算系統(tǒng)上面的代碼,當(dāng)數(shù)據(jù)源發(fā)生變更時(shí)煤蚌,需要同時(shí)對(duì)倆套代碼進(jìn)行更改

數(shù)據(jù)口徑不一致:

由于批量和實(shí)時(shí)計(jì)算走的是兩個(gè)計(jì)算框架和計(jì)算程序耕挨,算出的結(jié)果往往不同,需要經(jīng)常進(jìn)行數(shù)據(jù)核查和數(shù)據(jù)對(duì)比尉桩。



下一篇介紹一種全新的計(jì)數(shù)架構(gòu):Kappa架構(gòu)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末筒占,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子蜘犁,更是在濱河造成了極大的恐慌翰苫,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異奏窑,居然都是意外死亡导披,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門埃唯,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)撩匕,“玉大人,你說(shuō)我怎么就攤上這事墨叛≈贡希” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵巍实,是天一觀的道長(zhǎng)滓技。 經(jīng)常有香客問(wèn)我,道長(zhǎng)棚潦,這世上最難降的妖魔是什么令漂? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮丸边,結(jié)果婚禮上叠必,老公的妹妹穿的比我還像新娘。我一直安慰自己妹窖,他們只是感情好纬朝,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著骄呼,像睡著了一般共苛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蜓萄,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天隅茎,我揣著相機(jī)與錄音,去河邊找鬼嫉沽。 笑死辟犀,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的绸硕。 我是一名探鬼主播堂竟,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼玻佩!你這毒婦竟也來(lái)了出嘹?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤咬崔,失蹤者是張志新(化名)和其女友劉穎疚漆,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡娶聘,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了甚脉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丸升。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖牺氨,靈堂內(nèi)的尸體忽然破棺而出狡耻,到底是詐尸還是另有隱情,我是刑警寧澤猴凹,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布夷狰,位于F島的核電站,受9級(jí)特大地震影響挥萌,放射性物質(zhì)發(fā)生泄漏抖甘。R本人自食惡果不足惜傻谁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望进倍。 院中可真熱鬧,春花似錦购对、人聲如沸猾昆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)垂蜗。三九已至,卻和暖如春解幽,著一層夾襖步出監(jiān)牢的瞬間贴见,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工亚铁, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蝇刀,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓徘溢,卻偏偏與公主長(zhǎng)得像吞琐,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子然爆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359