數(shù)據(jù)產(chǎn)品工作指北(4)-流式實時數(shù)倉框架

1闲擦、流式計算

流式計算時相對于批量計算提出的概念焕济,一般認為纷妆,批量計算的處理數(shù)據(jù)集是有界的,也就是說吼蚁,批量計算開始時,計算數(shù)據(jù)的范圍是已經(jīng)確定的问欠,計算時總是成批的計算某一周期內(nèi)的數(shù)據(jù)肝匆,或者是截止到某一時間點的數(shù)據(jù)。批計算時顺献,也能夠批量使用源數(shù)據(jù)旗国,并批量地得出周期性的計算結(jié)果,因而所需要的的計算資源和計算時間是比較長的注整。

流計算則更強調(diào)流式輸入和更低的計算延時能曾,以達到近似實時地得到計算結(jié)果的目的。數(shù)據(jù)流式的產(chǎn)生和輸入計算系統(tǒng)肿轨,以為著數(shù)據(jù)不需要跟批處理系統(tǒng)一樣必須要等待一個周期才能被同步到計算系統(tǒng)寿冕,而是每產(chǎn)生一條數(shù)據(jù)(或者是每一條的數(shù)據(jù)變化)都會被直接同步到計算系統(tǒng),參與到實時的計算中來椒袍。流計算系統(tǒng)面對的輸入數(shù)據(jù)驼唱,是連續(xù)不斷的數(shù)據(jù)流。如果將數(shù)據(jù)流進行周期性的截斷驹暑,可以理解為批處理的模型玫恳;但是大部分情況下,流計算會將數(shù)據(jù)流按照極短的周期進行小批量處理(SPARK平臺的計算方案)优俘,或者是針對每一條到來的數(shù)據(jù)都進行計算(STORM和FLINK的計算方案)京办。

2、流計算與批處理的區(qū)別

與傳統(tǒng)的數(shù)據(jù)處理一樣帆焕,流計算的整體流程也可以分為數(shù)據(jù)集成同步惭婿、數(shù)據(jù)處理計算、數(shù)據(jù)結(jié)果輸出幾個步驟。

數(shù)據(jù)集成同步审孽,是將業(yè)務(wù)源系統(tǒng)的數(shù)據(jù)同步到計算平臺的過程县袱。對于最原始的數(shù)據(jù)倉庫(即數(shù)倉與業(yè)務(wù)數(shù)據(jù)庫在同一數(shù)據(jù)庫的方案),數(shù)據(jù)是不需要進行同步就可以利用數(shù)據(jù)庫資源進行計算的佑力,但是這樣的弊端是數(shù)倉邏輯計算時會占用業(yè)務(wù)系統(tǒng)的計算資源式散,而且數(shù)倉只能建設(shè)成為一個個孤立的數(shù)據(jù)集合,無法達到數(shù)據(jù)打通的目的打颤。當(dāng)出現(xiàn)中央式的批處理數(shù)倉時暴拄,數(shù)據(jù)集成靠的是五花八門的集成工具,比如說datastage编饺、powercenter乖篷、kettle,這一類是通過往業(yè)務(wù)數(shù)據(jù)庫發(fā)起一個select請求進行數(shù)據(jù)同步的透且;另外一種同步的方案則是采用數(shù)據(jù)庫自帶的主從同步功能撕蔼,比如說MySQL的binlog同步,Oracle的dataguard秽誊、goldengate同步等鲸沮,不過這種方案總是有這樣那樣的缺陷,比如說你需要準(zhǔn)備一個結(jié)構(gòu)和源庫一樣的數(shù)據(jù)庫作為數(shù)倉锅论,有可能就達不到把多種異構(gòu)數(shù)據(jù)源集成到一個平臺的目的讼溺。流計算的數(shù)據(jù)同步,則是出于減少每次同步的數(shù)據(jù)量的目的最易,采用的是捕獲數(shù)據(jù)變化記錄流失化的方案怒坯,落到實處,就是監(jiān)聽數(shù)據(jù)庫的同步日志藻懒,將其寫入到消息系統(tǒng)中剔猿,生成消息流。對于MySQL嬉荆,可以監(jiān)聽binlog日志艳馒,將數(shù)據(jù)庫里面每行數(shù)據(jù)的增刪更新動作都捕獲起來,形成信息流员寇。

數(shù)據(jù)處理計算弄慰,就是數(shù)倉的關(guān)鍵部分,一般稱之為計算引擎蝶锋,包括了進行數(shù)據(jù)計算所需要的的臨時存儲陆爽、CPU資源和內(nèi)存資源。批處理平臺的計算引擎一般都是分布式處理框架扳缕,比如說hive慌闭;流計算的計算引擎則是集群安裝的spark别威、storm、flink平臺驴剔。流計算的計算引擎主要結(jié)局的問題是將數(shù)據(jù)流結(jié)構(gòu)化省古,并使用一系列流程化算子化技術(shù),合理的規(guī)范計算資源丧失,將數(shù)據(jù)進行正確的計算和輸出豺妓。

數(shù)據(jù)結(jié)果輸出,就是在計算過程或者計算完成時布讹,需要將計算結(jié)果輸出到數(shù)據(jù)展現(xiàn)依賴的數(shù)據(jù)庫琳拭,或者是中間存儲組件。批處理計算的結(jié)果描验,一般會輸出到MySQL數(shù)據(jù)庫進行數(shù)據(jù)展現(xiàn)白嘁。而流計算系統(tǒng)則會將中間結(jié)果輸出到信息系統(tǒng)中,給下游的計算做輸入膘流;對于最終計算結(jié)果絮缅,則會輸出到分析型數(shù)據(jù)庫,進行數(shù)據(jù)實時匯總展現(xiàn)呼股。

3耕魄、框架上的升級

舊的批處理框架如下:


新的流式處理框架如下:


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市卖怜,隨后出現(xiàn)的幾起案子屎开,更是在濱河造成了極大的恐慌阐枣,老刑警劉巖马靠,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蔼两,居然都是意外死亡甩鳄,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門额划,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妙啃,“玉大人,你說我怎么就攤上這事俊戳∫靖埃” “怎么了?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵抑胎,是天一觀的道長燥滑。 經(jīng)常有香客問我,道長阿逃,這世上最難降的妖魔是什么铭拧? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任赃蛛,我火速辦了婚禮,結(jié)果婚禮上搀菩,老公的妹妹穿的比我還像新娘呕臂。我一直安慰自己,他們只是感情好肪跋,可當(dāng)我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布歧蒋。 她就那樣靜靜地躺著,像睡著了一般澎嚣。 火紅的嫁衣襯著肌膚如雪疏尿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天易桃,我揣著相機與錄音褥琐,去河邊找鬼。 笑死晤郑,一個胖子當(dāng)著我的面吹牛敌呈,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播造寝,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼磕洪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了诫龙?” 一聲冷哼從身側(cè)響起析显,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎签赃,沒想到半個月后谷异,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡锦聊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年歹嘹,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片孔庭。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡尺上,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出圆到,到底是詐尸還是另有隱情怎抛,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布芽淡,位于F島的核電站马绝,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏吐绵。R本人自食惡果不足惜迹淌,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一河绽、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧唉窃,春花似錦耙饰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蔓涧,卻和暖如春件已,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背元暴。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工篷扩, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人茉盏。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓鉴未,卻偏偏與公主長得像,于是被迫代替她去往敵國和親鸠姨。 傳聞我的和親對象是個殘疾皇子铜秆,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容