典型的數(shù)據(jù)倉庫建模方法論

ER模型:ER(Entity Relationship)實體關(guān)系模型在范式理論上符合3NF。數(shù)據(jù)倉庫中的3NF與OLTP系統(tǒng)中的3NF的區(qū)別在于挑宠,它是站在企業(yè)角度面向主題的抽象势告,而不是針對某個具體業(yè)務(wù)流程的實體對象關(guān)系的抽象哺眯。所以其具有以下幾個特點:

  • 需要全面了解企業(yè)業(yè)務(wù)和數(shù)據(jù)旱眯。
  • 試試周期非常長泵督。
  • 對建模人員的能力要求非常高败京。
    采用ER模型建設(shè)數(shù)據(jù)倉庫模型的出發(fā)點是整合數(shù)據(jù)没陡,將各個系統(tǒng)中的數(shù)據(jù)以整個企業(yè)角度按主題進(jìn)行相似性組合和合并,并進(jìn)行一致性處理番甩,為數(shù)據(jù)分析決策服務(wù)侵贵,但是并不能直接用于分析決策。

采用ER模型建模一般分為三個階段:

  • 高層模型:一個高度抽象的模型缘薛,描述主要的主題以及主題間的關(guān)系窍育,用于描述企業(yè)的業(yè)務(wù)主題概況。
  • 中層模型:在高層模型的基礎(chǔ)上宴胧,細(xì)化主題的數(shù)據(jù)項漱抓。
  • 物理模型(也叫底層模型):在中層模型的基礎(chǔ)上,考慮物理存儲恕齐,同時基于性能和平臺特點進(jìn)行物理模型的設(shè)計乞娄,也可能做一些表的合并,分區(qū)的設(shè)計等檐迟。

維度模型:從分析決策的需求出發(fā)構(gòu)建模型补胚,為分析需求服務(wù),因此它重點關(guān)注用戶如何更快速地完成需求分析追迟,同時具有較好的大規(guī)模復(fù)雜查詢的響應(yīng)性能。其典型的代表是星形模型骚腥,以及在一些特殊場景下使用的雪花模型敦间。其設(shè)計分為一下幾個步驟:

  • 選擇需要進(jìn)行分析決策的業(yè)務(wù)過程。業(yè)務(wù)過程可以是單個業(yè)務(wù)事件束铭,比如交易的支付廓块、退款等;也可以是某個事件的狀態(tài)契沫,比如當(dāng)前的賬戶余額等带猴;還可以是一系列相關(guān)業(yè)務(wù)事件組成的業(yè)務(wù)流程,具體需要看我們分析的是某些事件發(fā)生情況懈万,還是當(dāng)前狀態(tài)拴清,或是事件流轉(zhuǎn)效率靶病。
  • 選擇粒度。在事件分析中口予,我們要預(yù)判所有分析需要細(xì)分的程度娄周,從而決定選擇的粒度。粒度是維度的一個組合沪停。
  • 識別維表煤辨。選擇好粒度之后,就需要基于此粒度設(shè)計維表木张,包括緯度屬性众辨,用于分析時進(jìn)行分組和篩選。
  • 選擇事實舷礼。確定分析需要衡量的指標(biāo)鹃彻。

Data Vault模型:它是ER模型的衍生,其設(shè)計的出發(fā)點是為了實現(xiàn)數(shù)據(jù)的整合且轨,但不能直接用于數(shù)據(jù)分析決策浮声。

Anchor模型:它對Data Vault模型做了進(jìn)一步規(guī)范化處理,該模型將規(guī)范到6NF,基本變成了k-v結(jié)構(gòu)化模型旋奢。

以上文字均摘抄自:<<大數(shù)據(jù)之路-阿里巴巴大數(shù)據(jù)實踐>>,原書購買鏈接:https://www.amazon.cn/%E5%A4%A7%E6%95%B0%E6%8D%AE%E4%B9%8B%E8%B7%AF-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AE%9E%E8%B7%B5-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E6%95%B0%E6%8D%AE%E6%8A%80%E6%9C%AF%E5%8F%8A%E4%BA%A7%E5%93%81%E9%83%A8/dp/B071GW3JHM/ref=sr_1_1?ie=UTF8&qid=1503497929&sr=8-1&keywords=%E5%A4%A7%E6%95%B0%E6%8D%AE%E4%B9%8B%E8%B7%AF+%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AE%9E%E8%B7%B5

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末泳挥,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子至朗,更是在濱河造成了極大的恐慌屉符,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件锹引,死亡現(xiàn)場離奇詭異矗钟,居然都是意外死亡,警方通過查閱死者的電腦和手機嫌变,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進(jìn)店門吨艇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人腾啥,你說我怎么就攤上這事东涡。” “怎么了倘待?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵疮跑,是天一觀的道長。 經(jīng)常有香客問我凸舵,道長祖娘,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任啊奄,我火速辦了婚禮渐苏,結(jié)果婚禮上掀潮,老公的妹妹穿的比我還像新娘。我一直安慰自己整以,他們只是感情好胧辽,可當(dāng)我...
    茶點故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著公黑,像睡著了一般邑商。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上凡蚜,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天人断,我揣著相機與錄音,去河邊找鬼朝蜘。 笑死恶迈,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的谱醇。 我是一名探鬼主播暇仲,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼副渴!你這毒婦竟也來了奈附?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤煮剧,失蹤者是張志新(化名)和其女友劉穎斥滤,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勉盅,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡佑颇,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了草娜。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片挑胸。...
    茶點故事閱讀 40,090評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖宰闰,靈堂內(nèi)的尸體忽然破棺而出嗜暴,到底是詐尸還是另有隱情,我是刑警寧澤议蟆,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站萎战,受9級特大地震影響咐容,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蚂维,卻給世界環(huán)境...
    茶點故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一戳粒、第九天 我趴在偏房一處隱蔽的房頂上張望路狮。 院中可真熱鬧,春花似錦蔚约、人聲如沸奄妨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽砸抛。三九已至,卻和暖如春树枫,著一層夾襖步出監(jiān)牢的瞬間直焙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工砂轻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留奔誓,地道東北人。 一個月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓搔涝,卻偏偏與公主長得像厨喂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子庄呈,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 【Aipm引導(dǎo)頁】 https://58976235.wodemo.net/down/20170514/44034...
    Mr_洛寒閱讀 2,580評論 3 5
  • (開始) (標(biāo)題)iApc(/標(biāo)題)(鏈接)https://duming666.wodemo.net/down/2...
    獨名閱讀 1,541評論 1 3
  • 數(shù)據(jù)模型就是數(shù)據(jù)組織和存儲方法抒痒,它強調(diào)從業(yè)務(wù)幌绍、數(shù)據(jù)存取和使用角度合理存儲數(shù)據(jù)。有了適合業(yè)務(wù)和基礎(chǔ)數(shù)據(jù)存儲環(huán)境的模型...
    編程回憶錄閱讀 3,746評論 0 0
  • 夢到你一次又一次 嘿嘿故响,在夢里都不相信你了
    戲精w閱讀 156評論 0 0
  • 這一夜 不斷單曲循環(huán)《在人間》 這一夜 一根接一根抽了許多煙 這一夜 整個思緒任由泛濫成災(zāi) 這一夜 從未有過的難熬...
    文棠墨客閱讀 201評論 1 3