數(shù)據(jù)倉庫是體系結(jié)構(gòu)環(huán)境的核心痰憎,是決策支持系統(tǒng)處理的基礎(chǔ)震嫉。數(shù)據(jù)倉庫的建設(shè)中核心步驟是首先要對數(shù)據(jù)倉庫的結(jié)構(gòu)進行了解价卤、建立主題域、管控數(shù)據(jù)的粒度并對數(shù)據(jù)進行分區(qū)處理闯狱。下面我們就具體了解每一個過程煞赢。
一、數(shù)據(jù)倉庫的結(jié)構(gòu)
數(shù)據(jù)倉庫環(huán)境中存在著不同的細節(jié)級:早期細節(jié)級(通常存儲在海量存儲上)哄孤、當(dāng)前細節(jié)級照筑、輕度綜合數(shù)據(jù)級(數(shù)據(jù)集市級)以及高度綜合數(shù)據(jù)級。數(shù)據(jù)倉庫的結(jié)構(gòu)圖如下:
數(shù)據(jù)倉庫的數(shù)據(jù)流轉(zhuǎn)順序:
“1”數(shù)據(jù)由操作型環(huán)境導(dǎo)入到當(dāng)前細節(jié)數(shù)據(jù)瘦陈。
“2”由當(dāng)前細節(jié)數(shù)據(jù)到輕度匯總數(shù)據(jù)凝危。
“3”由輕度匯總到高度匯總數(shù)據(jù)。
如果數(shù)據(jù)已過它的生命周期晨逝,此時執(zhí)行“4”將數(shù)據(jù)轉(zhuǎn)入早期細節(jié)存儲蛾默。
二、數(shù)據(jù)倉庫主題域
數(shù)據(jù)倉庫是面向高層企業(yè)數(shù)據(jù)模型捉貌,已經(jīng)定義好的企業(yè)主題域支鸡。典型的主題域有:顧客、產(chǎn)品趁窃、交易或活動牧挣、政策、索賠醒陆、賬目瀑构。在具體項目實施中建立主題域應(yīng)該遵循以下三點:
1.數(shù)據(jù)倉庫中,每一個主要主題域都是以一組相關(guān)的物理表來具體實現(xiàn)的刨摩。
2.某一個主題域的所有物理表通過一個公共關(guān)鍵字聯(lián)系在一起寺晌。
3.當(dāng)數(shù)據(jù)圍繞主題組織時,每張物理表都有一個時間元素码邻。
三、數(shù)據(jù)倉庫中數(shù)據(jù)的粒度
數(shù)據(jù)倉庫中數(shù)據(jù)的粒度是數(shù)據(jù)倉庫設(shè)計中最重要的問題另假。數(shù)據(jù)倉庫中粒度的選擇應(yīng)當(dāng)在清楚地知道那些體系結(jié)構(gòu)部件需要從數(shù)據(jù)倉庫獲取數(shù)據(jù)的前提下進行像屋。粒度化存在選擇高粒度級還是低粒度級是個問題,以下對兩種粒度進行了對比边篮。
1.粒度化越低數(shù)據(jù)倉庫越靈活己莺,但是數(shù)據(jù)量大、查詢范圍大戈轿、存儲空間大凌受。
2.粒度化越高,丟失了細節(jié)數(shù)據(jù)思杯,降低了數(shù)據(jù)處理量胜蛉,對很多需要細節(jié)的數(shù)據(jù)分析不支持挠进。
對比兩種方式非常低的粒度會帶來大量數(shù)據(jù),系統(tǒng)最終會被巨大的數(shù)據(jù)量所壓垮誊册。非常高的粒度雖然處理起來高效领突,但卻不能進行許多需要細節(jié)數(shù)據(jù)的分析。
如何在高粒度和低粒度中權(quán)衡
高低粒度的權(quán)衡非常困難案怯,解決的方法是建立一個服務(wù)于不同類型查詢與分析的雙重粒度的多層數(shù)據(jù)倉庫君旦,可以有效的解決數(shù)據(jù)倉庫的粒度問題。
四嘲碱、數(shù)據(jù)倉庫數(shù)據(jù)的分區(qū)
數(shù)據(jù)分區(qū)是指把數(shù)據(jù)分散到可獨立處理的分離物理單元中去金砍。管理小的物理單元將比管理大的物理單元更加靈活。
分區(qū)標(biāo)準(zhǔn)多種多樣麦锯,例如恕稠,按:時間、業(yè)務(wù)范圍离咐、地理位置谱俭、組織單位等標(biāo)準(zhǔn)進行分區(qū)。
在數(shù)據(jù)倉庫建設(shè)中有兩種分區(qū)方法——在DBMS/操作系統(tǒng)層和在應(yīng)用層進行分區(qū)宵蛀,每一種分區(qū)方法都有各自的優(yōu)缺點昆著,通常,分區(qū)是在應(yīng)用層而非系統(tǒng)層進行的术陶。
五凑懂、小結(jié)
數(shù)據(jù)倉庫通常是有點及面,由個別到全部梧宫,有小到大的一個建設(shè)過程接谨。中間會遇到性能、協(xié)調(diào)塘匣、使用等上面的各種問題脓豪,這是就需要一步一步積累經(jīng)驗,優(yōu)化方法忌卤。數(shù)據(jù)倉庫并非一天建成扫夜,它是一個往復(fù)的過程,一步一步的實現(xiàn)的驰徊。