數(shù)據(jù)產(chǎn)品常用概念(事實表为居、維度表、數(shù)據(jù)模型)

? 這篇文章有些內(nèi)容是概念上的厘清讥巡,有些是實踐中獲得的知識肖爵。相信看完這篇文章,你會對大數(shù)據(jù)領(lǐng)域常說的“模型”有了一定的體感

? 先說大數(shù)據(jù)中模型的概念悄泥,所謂模型虏冻,應(yīng)該是現(xiàn)實事件的映射方式。但這么說又太過籠統(tǒng)弹囚,在數(shù)倉建設(shè)過程中厨相,事實表與維度表之間的關(guān)系就是一種模型。說到這里鸥鹉,你可能開始困惑蛮穿,什么是事實表和維度表呢?所以先介紹第一部分毁渗。

?? 事實表和維度表

直接上例子践磅。以汽車行業(yè)數(shù)據(jù)庫表為例,大家可能認為下面是一張記錄客戶購買了什么車的統(tǒng)計表灸异。但事實上府适,大的車企每天都有幾千個訂單,每年百萬級別的訂單(事實上如果只使用一張表肺樟,字段會更長)檐春,如果所有訂單信息以下面在這種狀態(tài)存儲,在進行分析及修改等操作時效率會比較低么伯。另外各個系統(tǒng)中如果不去進行維度的統(tǒng)一疟暖,最后會導(dǎo)致數(shù)據(jù)越來越難進行清洗分析,各個系統(tǒng)之間將會有很深的壁壘....

所以我們有必要將上面表格進行拆解。經(jīng)過分析俐巴,可以看到此表至少可由四部分組成:明細表朋贬、經(jīng)銷商維度表、地區(qū)維度表窜骄、車型維度表锦募、客戶維度表

具體拆解如下:將上面一張表拆分出了一張明細表和四種維度。明細表對比上面的表格邻遏,把大量漢字替換成了數(shù)字/編碼糠亩,這將對表格大小有大量的縮減。

當(dāng)其中維度信息有修改時准验,比如修改了經(jīng)銷商名稱赎线,也只需要變更經(jīng)銷商維度表中一條記錄即可,而明細表不用進行修改糊饱。


? ?通過以上例子垂寥,我們對維度表就有了一些體感。因此另锋,對維度表和事實表的定義如下:

? ? 事實表:表格中存儲了能體現(xiàn)實際數(shù)據(jù)或事實滞项,一般會由維度編碼和事實數(shù)據(jù)組成。上圖中明細表就是一張事實表夭坪∥呐校可能會有些人問,我在上面事實表中沒看到數(shù)據(jù)呀室梅?其實這樣的明細表一條數(shù)就代表了一個訂單戏仓,數(shù)量就是1,后續(xù)用來統(tǒng)計每日訂單亡鼠,只要進行sum操作就可以獲得訂單數(shù)了

? ? 維度表:表格中存放的有獨立的層次和屬性的數(shù)據(jù)赏殃。一般由維度編碼和對應(yīng)的維度名稱組成


? ?數(shù)據(jù)模型

了解了事實表和維度表后,終于可以介紹數(shù)據(jù)模型了间涵。常見的數(shù)據(jù)模型有3種:星形仁热、雪花形和星系形。這個很多文章中都有介紹浑厚,這里只簡單總結(jié)下股耽。

星形:類似下圖,事實表和維度表通過主鍵外鍵關(guān)聯(lián)钳幅,是最簡單的模型


雪花形:類似下圖,維度表不直接連接在事實表上炎滞,而是通過其他維度表進行來連接敢艰。這是星形的擴展,每個維度表又可以當(dāng)成小的事實表册赛。



星系模型:簡單的說就是各種事實表之間共享維度钠导。

至此震嫉,我們應(yīng)該弄明白了事實表和維度表的概念。但其中出現(xiàn)的幾個名詞又讓人心生困惑牡属,“屬性”是什么意思票堵?下一篇將說明這個。

大家有什么問題歡迎留言一起討論

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末逮栅,一起剝皮案震驚了整個濱河市悴势,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌措伐,老刑警劉巖特纤,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異侥加,居然都是意外死亡捧存,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門担败,熙熙樓的掌柜王于貴愁眉苦臉地迎上來昔穴,“玉大人,你說我怎么就攤上這事提前∩悼В” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵岖研,是天一觀的道長卿操。 經(jīng)常有香客問我,道長孙援,這世上最難降的妖魔是什么害淤? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮拓售,結(jié)果婚禮上窥摄,老公的妹妹穿的比我還像新娘。我一直安慰自己础淤,他們只是感情好崭放,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著鸽凶,像睡著了一般币砂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上玻侥,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天决摧,我揣著相機與錄音,去河邊找鬼。 笑死掌桩,一個胖子當(dāng)著我的面吹牛边锁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播波岛,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼茅坛,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了则拷?” 一聲冷哼從身側(cè)響起贡蓖,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎隔躲,沒想到半個月后摩梧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡宣旱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年仅父,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浑吟。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡笙纤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出组力,到底是詐尸還是另有隱情省容,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布燎字,位于F島的核電站腥椒,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏候衍。R本人自食惡果不足惜笼蛛,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蛉鹿。 院中可真熱鬧滨砍,春花似錦、人聲如沸妖异。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽他膳。三九已至响逢,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間矩乐,已是汗流浹背龄句。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工回论, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留散罕,地道東北人分歇。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像欧漱,于是被迫代替她去往敵國和親职抡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容