企業(yè)大數(shù)據(jù)平臺(tái)倉庫架構(gòu)建設(shè)思路(李金波)

1 總體思路

新環(huán)境下的數(shù)據(jù)應(yīng)用特征

關(guān)鍵詞

安全蝇完、透明

大數(shù)據(jù)平臺(tái)特征

  • 更強(qiáng)大的計(jì)算和存儲(chǔ)能力
  • 多樣的編程接口和框架
  • 豐富的數(shù)據(jù)采集通道
  • 各種安全和管理措施

倉庫架構(gòu)設(shè)計(jì)原則

  • 自下而上+自上而下阳惹;
  • 高容錯(cuò)性封孙;
  • 數(shù)據(jù)質(zhì)量監(jiān)控貫穿整個(gè)數(shù)據(jù)流程旦棉;
  • 不怕數(shù)據(jù)冗余护姆,利用存儲(chǔ)換應(yīng)用和二;

2 模型設(shè)計(jì)

維度建模 OR 實(shí)體關(guān)系建模

  • 維度建模
    簡單幅虑,事實(shí)事務(wù)分析文兑,適合業(yè)務(wù)報(bào)表和BI盒刚。
  • 實(shí)體關(guān)系建模
    復(fù)雜,打散數(shù)據(jù)绿贞,適合復(fù)雜數(shù)據(jù)內(nèi)容(實(shí)體)的深度挖掘因块。

星型模型 AND 雪花模型

企業(yè)中二者并存,轉(zhuǎn)化為星型模型可以減少計(jì)算和存儲(chǔ)籍铁。

數(shù)據(jù)分層

上下分三層:

  • 集市層(用)
  • 中間層(通)
  • 基礎(chǔ)數(shù)據(jù)層(存)

流式數(shù)據(jù)以保證時(shí)效性涡上。

基礎(chǔ)數(shù)據(jù)層

數(shù)據(jù)采集、數(shù)據(jù)清洗拒名、數(shù)據(jù)歸類吩愧、數(shù)據(jù)結(jié)構(gòu)化、數(shù)據(jù)規(guī)范化增显。

中間層

  • 圍繞實(shí)體打通行為(join)
  • 從行為抽象關(guān)系
  • 冗余是個(gè)好手段(事實(shí)表冗余部分維度信息來提高計(jì)算)

集市層

集市之間垂直構(gòu)建雁佳。
集市層深度挖掘數(shù)據(jù)價(jià)值,集市層能夠快速試錯(cuò)同云。

流式數(shù)據(jù)集

  • 需求驅(qū)動(dòng)
  • 包含事實(shí)和維度
  • 結(jié)構(gòu)更扁平(介于成本糖权,不會(huì)涉及中間層)

3 數(shù)據(jù)架構(gòu)

數(shù)據(jù)采集

結(jié)構(gòu)化數(shù)據(jù)采集

全量采集
增量采集(CDC)
實(shí)時(shí)采集

日志結(jié)構(gòu)化

UDF、SerDes炸站、

非結(jié)構(gòu)化數(shù)據(jù)特征提取

視頻圖片語音文本標(biāo)簽(一般在數(shù)倉體系之外)星澳。

數(shù)據(jù)服務(wù)

數(shù)據(jù)服務(wù)化

統(tǒng)計(jì)服務(wù)(sum銷售總值)、分析服務(wù)(分析流式幾率)旱易、標(biāo)簽服務(wù)(有車禁偎、有孩標(biāo)簽)。

架構(gòu)設(shè)計(jì)中一些實(shí)用的點(diǎn)

  • 巧用虛擬節(jié)點(diǎn)
  • 強(qiáng)制分區(qū)
  • 計(jì)算框架應(yīng)用
  • 優(yōu)化關(guān)鍵路徑

4 數(shù)據(jù)治理

內(nèi)容建設(shè)
管理(元數(shù)據(jù)阀坏、保障)
保障
數(shù)據(jù)質(zhì)量(事前如暖、事中、時(shí)候)
數(shù)據(jù)生命周期管理

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末全释,一起剝皮案震驚了整個(gè)濱河市装处,隨后出現(xiàn)的幾起案子误债,更是在濱河造成了極大的恐慌浸船,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件寝蹈,死亡現(xiàn)場離奇詭異李命,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)箫老,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門封字,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事阔籽×髌蓿” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵笆制,是天一觀的道長绅这。 經(jīng)常有香客問我,道長在辆,這世上最難降的妖魔是什么证薇? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮匆篓,結(jié)果婚禮上浑度,老公的妹妹穿的比我還像新娘。我一直安慰自己鸦概,他們只是感情好箩张,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著完残,像睡著了一般伏钠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谨设,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天熟掂,我揣著相機(jī)與錄音,去河邊找鬼扎拣。 笑死赴肚,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的二蓝。 我是一名探鬼主播誉券,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼刊愚!你這毒婦竟也來了踊跟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤鸥诽,失蹤者是張志新(化名)和其女友劉穎商玫,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牡借,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拳昌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了钠龙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炬藤。...
    茶點(diǎn)故事閱讀 38,137評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡御铃,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出沈矿,到底是詐尸還是另有隱情上真,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布羹膳,位于F島的核電站谷羞,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏溜徙。R本人自食惡果不足惜湃缎,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蠢壹。 院中可真熱鬧嗓违,春花似錦、人聲如沸图贸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽疏日。三九已至偿洁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間沟优,已是汗流浹背涕滋。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留挠阁,地道東北人宾肺。 一個(gè)月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像侵俗,于是被迫代替她去往敵國和親锨用。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容