概述
維度建模法(Dimensional Modeling)是數(shù)據(jù)倉庫建模中比較常用的方法玩祟,最常見的數(shù)據(jù)模式包括 星型模式(Star Schema)、雪花模式(Snowflake Schema) 和 事實(shí)星座模式(Fact Constellation)或 星系模式(Galaxy Schema)。
在之前的文章中计螺, 我們提到了兩個(gè)關(guān)鍵的概念 事實(shí)表和維度表将塑。簡單來說褥赊,事實(shí)表就是用來存儲主題的主干內(nèi)容的跛蛋,維度表就是用來存儲事實(shí)的特性的熬的。比如你分析產(chǎn)品的銷售情況,你選擇按照區(qū)域來分析赊级,那么事實(shí)表中包含的就是產(chǎn)品的銷售總量押框,相對應(yīng)的維度表中包含的就是產(chǎn)品的區(qū)域信息,每個(gè)維度也可以有子維度理逊,比如區(qū)域而言橡伞,可以有國家,城市這個(gè)子維度晋被。
星型模式(Star Schema)
星型模式的核心是一個(gè)大的中心表(事實(shí)表)兑徘,一組小的附屬表(維表)。
雪花模式(Snowflake Schema)
雪花模式是星型模式的擴(kuò)展羡洛,其中某些維表被規(guī)范化挂脑,進(jìn)一步分解到附加表(維表)中。
我們可以看到地址表被進(jìn)一步細(xì)分出了城市(city)維翘县。supplier_type表被進(jìn)一步細(xì)分出來supplier維最域。
事實(shí)星座模式(Fact Constellation)或 星系模式(Galaxy Schema)
數(shù)據(jù)倉庫由多個(gè)主題構(gòu)成,包含多個(gè)事實(shí)表锈麸,而維表是公共的镀脂,可以共享,這種模式可以看做星型模式的匯集忘伞,因而稱作星系模式或者事實(shí)星座模式薄翅。
上圖所示,事實(shí)星座模式包含兩個(gè)事實(shí)表:sales和shipping氓奈,二者共享維表翘魄。
總結(jié)
星座模式是數(shù)據(jù)倉庫最長使用的數(shù)據(jù)模式,尤其是企業(yè)級數(shù)據(jù)倉庫(EDW)舀奶。這也是數(shù)據(jù)倉庫區(qū)別于數(shù)據(jù)集市的一個(gè)典型的特征暑竟,從根本上而言,數(shù)據(jù)倉庫數(shù)據(jù)模型的模式更多是為了避免冗余和數(shù)據(jù)復(fù)用育勺,套用現(xiàn)成的模式但荤,是設(shè)計(jì)數(shù)據(jù)倉庫最合理的選擇。當(dāng)然大數(shù)據(jù)技術(shù)體系下涧至,數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計(jì)腹躁,還是一個(gè)盲點(diǎn),探索中南蓬。