##[Kappa]:比Lambda更好更靈活的實時處理架構(gòu)


//
Lambda架構(gòu) vs Kappa架構(gòu) - CSDN博客
http://blog.csdn.net/post_yuan/article/details/52241252
Lambda 架構(gòu)由Storm的作者Nathan Marz提出,其設計目的在于提供一個能滿足大數(shù)據(jù)系統(tǒng)關鍵特性的架構(gòu)渴语,包括高容錯矩距、低延遲习柠、可擴展等流炕。其整合離線計算與實時計算醇坝,融合不可變性孩锡、讀寫分離和復雜性隔離等原則撰洗,可集成Hadoop, Kafka, Spark,Storm等各類大數(shù)據(jù)組件滩届。

image.png

//
Kappa 架構(gòu)
Kappa 架構(gòu)是LinkedIn的Jay Kreps結(jié)合實際經(jīng)驗和個人體會集侯,針對Lambda架構(gòu)進行深度剖析,分析其優(yōu)缺點并采用的替代方案帜消。Lambda 架構(gòu)的一個很明顯的問題是需要維護兩套分別跑在批處理和實時計算系統(tǒng)上面的代碼棠枉,而且這兩套代碼得產(chǎn)出一模一樣的結(jié)果。因此對于設計這類系統(tǒng)的人來講泡挺,要面對的問題是:為什么我們不能改進流計算系統(tǒng)讓它能處理這些問題辈讶?為什么不能讓流系統(tǒng)來解決數(shù)據(jù)全量處理的問題?流計算天然的分布式特性注定其擴展性比較好娄猫,能否加大并發(fā)量來處理海量的歷史數(shù)據(jù)贱除?基于種種問題的考慮,Jay提出了Kappa這種替代方案媳溺。

image.png

那如何用流計算系統(tǒng)對全量數(shù)據(jù)進行重新計算月幌,步驟如下:
1、用Kafka或類似的分布式隊列保存數(shù)據(jù)悬蔽,需要幾天數(shù)據(jù)量就保存幾天扯躺。
2、當需要全量計算時蝎困,重新起一個流計算實例录语,從頭開始讀取數(shù)據(jù)進行處理,并輸出到一個結(jié)果存儲中禾乘。
3澎埠、當新的實例完成后,停止老的流計算實例始藕,并把老的一引起結(jié)果刪除蒲稳。
一個典型的Kappa架構(gòu)如下,

image.png

//
Kappa:比Lambda更好更靈活的實時處理架構(gòu) - bonelee - 博客園
http://www.cnblogs.com/bonelee/p/6603541.html
和Lambda架構(gòu)相比鳄虱,在Kappa架構(gòu)下弟塞,只有在有必要的時候才會對歷史數(shù)據(jù)進行重復計算,并且實時計算和批處理過程使用的是同一份代碼拙已【黾牵或許有些人會質(zhì)疑流式處理對于歷史數(shù)據(jù)的高吞吐量會力不從心,但是這可以通過控制新實例的并發(fā)數(shù)進行改善倍踪。

Kappa架構(gòu)的核心思想包括以下三點:
用Kafka或者類似的分布式隊列系統(tǒng)保存數(shù)據(jù)系宫,你需要幾天的數(shù)據(jù)量就保存幾天索昂。
當需要全量重新計算時,重新起一個流計算實例扩借,從頭開始讀取數(shù)據(jù)進行處理椒惨,并輸出到一個新的結(jié)果存儲中。
當新的實例做完后潮罪,停止老的流計算實例康谆,并把老的一些結(jié)果刪除。

//
可能有這樣回答:流計算給人的印象是對一些流式的嫉到、臨時的數(shù)據(jù)進行計算沃暗,將結(jié)果保存后就將原始數(shù)據(jù)丟棄了,因此它不適合用來處理歷史數(shù)據(jù)何恶。其實這種答案并不完全正確孽锥,對于基于Lambda架構(gòu)實現(xiàn)的Storm框架確實是這樣的,但對于后來出現(xiàn)的Spark并不是细层。

Storm是在2011年7月開源的惜辑,Spark是在2012年之后逐漸為人們所知的,因此在Nathan Marz設計Lambda架構(gòu)的時候疫赎,當時還并沒有一個框架既可以用于離線處理盛撑,又可以進行實時計算。但隨著Spark技術的發(fā)展捧搞,這一想法成為了可能撵彻,Spark本身可以用于批處理,而構(gòu)建在Spark之上的Spark Streaming又可以用于實時計算实牡,因此利用一套系統(tǒng)來應對批處理和實時計算相結(jié)合的業(yè)務完全是可行的。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末轴合,一起剝皮案震驚了整個濱河市创坞,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌受葛,老刑警劉巖题涨,帶你破解...
    沈念sama閱讀 216,843評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異总滩,居然都是意外死亡纲堵,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,538評論 3 392
  • 文/潘曉璐 我一進店門闰渔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來席函,“玉大人,你說我怎么就攤上這事冈涧∶剑” “怎么了正蛙?”我有些...
    開封第一講書人閱讀 163,187評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長营曼。 經(jīng)常有香客問我乒验,道長,這世上最難降的妖魔是什么蒂阱? 我笑而不...
    開封第一講書人閱讀 58,264評論 1 292
  • 正文 為了忘掉前任锻全,我火速辦了婚禮,結(jié)果婚禮上录煤,老公的妹妹穿的比我還像新娘鳄厌。我一直安慰自己,他們只是感情好辐赞,可當我...
    茶點故事閱讀 67,289評論 6 390
  • 文/花漫 我一把揭開白布部翘。 她就那樣靜靜地躺著,像睡著了一般响委。 火紅的嫁衣襯著肌膚如雪新思。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,231評論 1 299
  • 那天赘风,我揣著相機與錄音夹囚,去河邊找鬼。 笑死邀窃,一個胖子當著我的面吹牛荸哟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播瞬捕,決...
    沈念sama閱讀 40,116評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼鞍历,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了肪虎?” 一聲冷哼從身側(cè)響起劣砍,我...
    開封第一講書人閱讀 38,945評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎扇救,沒想到半個月后刑枝,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,367評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡迅腔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,581評論 2 333
  • 正文 我和宋清朗相戀三年装畅,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沧烈。...
    茶點故事閱讀 39,754評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡掠兄,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情徽千,我是刑警寧澤苫费,帶...
    沈念sama閱讀 35,458評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站双抽,受9級特大地震影響百框,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜牍汹,卻給世界環(huán)境...
    茶點故事閱讀 41,068評論 3 327
  • 文/蒙蒙 一铐维、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧慎菲,春花似錦嫁蛇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,692評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至解幼,卻和暖如春抑党,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背撵摆。 一陣腳步聲響...
    開封第一講書人閱讀 32,842評論 1 269
  • 我被黑心中介騙來泰國打工底靠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人特铝。 一個月前我還...
    沈念sama閱讀 47,797評論 2 369
  • 正文 我出身青樓暑中,卻偏偏與公主長得像,于是被迫代替她去往敵國和親鲫剿。 傳聞我的和親對象是個殘疾皇子鳄逾,可洞房花燭夜當晚...
    茶點故事閱讀 44,654評論 2 354

推薦閱讀更多精彩內(nèi)容