2019-03-09數(shù)據(jù)倉庫構(gòu)建步驟

數(shù)據(jù)倉庫構(gòu)建步驟

轉(zhuǎn)自?https://www.cnblogs.com/lcword/p/5858819.html

數(shù)據(jù)倉庫是面向主題的焚挠、集成的、不可更新的、隨時(shí)間的變化而不斷變化的,這些特點(diǎn)決定了數(shù)據(jù)倉庫的系統(tǒng)設(shè)計(jì)不能采用同開發(fā)傳統(tǒng)的OLTP數(shù)據(jù)庫一樣的設(shè)計(jì)方法。?

數(shù)據(jù)倉庫系統(tǒng)的原始需求不明確歧沪,且不斷變化與增加,開發(fā)者最初不能確切了解到用戶的明確而詳細(xì)的需求莲组,用戶所能提供的無非是需求的大的方向以及部分需求诊胞, 更不能較準(zhǔn)確地預(yù)見到以后的需求。因此胁编,采用原型法來進(jìn)行數(shù)據(jù)倉庫的開發(fā)是比較合適的厢钧,因?yàn)樵头ǖ乃枷胧菑臉?gòu)建系統(tǒng)的簡單的基本框架著手鳞尔,不斷豐富與完 善整個(gè)系統(tǒng)。但是早直,數(shù)據(jù)倉庫的設(shè)計(jì)開發(fā)又不同于一般意義上的原型法寥假,數(shù)據(jù)倉庫的設(shè)計(jì)是數(shù)據(jù)驅(qū)動的。這是因?yàn)閿?shù)據(jù)倉庫是在現(xiàn)存數(shù)據(jù)庫系統(tǒng)基礎(chǔ)上進(jìn)行開發(fā)霞扬,它 著眼于有效地抽取糕韧、綜合、集成和挖掘已有數(shù)據(jù)庫的數(shù)據(jù)資源喻圃,服務(wù)于企業(yè)高層領(lǐng)導(dǎo)管理決策分析的需要萤彩。但需要說明的是,數(shù)據(jù)倉庫系統(tǒng)開發(fā)是一個(gè)經(jīng)過不斷循 環(huán)斧拍、反饋而使系統(tǒng)不斷增長與完善的過程雀扶,這也是原型法區(qū)別于系統(tǒng)生命周期法的主要特點(diǎn)。因此肆汹,在數(shù)據(jù)倉庫的開發(fā)的整個(gè)過程中愚墓,自始至終要求決策人員和開發(fā) 者的共同參與和密切協(xié)作,要求保持靈活的頭腦昂勉,不做或盡量少做無效工作或重復(fù)工作浪册。?

數(shù)據(jù)倉庫的設(shè)計(jì)大體上可以分為以下幾個(gè)步驟:?

l? ???概念模型設(shè)計(jì);?

l? ???技術(shù)準(zhǔn)備工作岗照;?

l? ???邏輯模型設(shè)計(jì)村象;

l? ???物理模型設(shè)計(jì);?

l? ???數(shù)據(jù)倉庫生成攒至;?

l? ???數(shù)據(jù)倉庫運(yùn)行與維護(hù)厚者。?

下面我們六個(gè)主要設(shè)計(jì)步驟為主線,介紹在各個(gè)設(shè)計(jì)步驟中設(shè)計(jì)的基本內(nèi)容迫吐。?

第一節(jié)??概念模型設(shè)計(jì)

進(jìn)行概念模型設(shè)計(jì)所要完成的工作是:?

<1>界定系統(tǒng)邊界?

<2>確定主要的主題域及其內(nèi)容?

概念模型設(shè)計(jì)的成果是籍救,在原有的數(shù)據(jù)庫的基礎(chǔ)上建立了一個(gè)較為穩(wěn)固的概念模型。因?yàn)閿?shù)據(jù)倉庫是對原有數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)進(jìn)行集成和重組而形成的數(shù)據(jù)集合渠抹, 所以數(shù)據(jù)倉庫的概念模型設(shè)計(jì),首先要對原有數(shù)據(jù)庫系統(tǒng)加以分析理解闪萄,看在原有的數(shù)據(jù)庫系統(tǒng)中“有什么”梧却、“怎樣組織的”和“如何分布的”等,然后再來考慮 應(yīng)當(dāng)如何建立數(shù)據(jù)倉庫系統(tǒng)的概念模型败去。一方面放航,通過原有的數(shù)據(jù)庫的設(shè)計(jì)文檔以及在數(shù)據(jù)字典中的數(shù)據(jù)庫關(guān)系模式,可以對企業(yè)現(xiàn)有的數(shù)據(jù)庫中的內(nèi)容有一個(gè)完整 而清晰的認(rèn)識圆裕;另一方面广鳍,數(shù)據(jù)倉庫的概念模型是面向企業(yè)全局建立的荆几,它為集成來自各個(gè)面向應(yīng)用的數(shù)據(jù)庫的數(shù)據(jù)提供了統(tǒng)一的概念視圖。?

概念模型的設(shè)計(jì)是在較高的抽象層次上的設(shè)計(jì)赊时,因此建立概念模型時(shí)不用考慮具體技術(shù)條件的限制吨铸。?

1. 界定系統(tǒng)的邊界?

數(shù)據(jù)倉庫是面向決策分析的數(shù)據(jù)庫,我們無法在數(shù)據(jù)倉庫設(shè)計(jì)的最初就得到詳細(xì)而明確的需求祖秒,但是一些基本的方向性的需求還是擺在了設(shè)計(jì)人員的面前:?

l? ?? ?? ?要做的決策類型有哪些??

l? ?? ?? ?決策者感興趣的是什么問題??

l? ?? ?? ?這些問題需要什么樣的信息??

l? ?? ?? ?要得到這些信息需要包含原有數(shù)據(jù)庫系統(tǒng)的哪些部分的數(shù)據(jù)??

這樣诞吱,我們可以劃定一個(gè)當(dāng)前的大致的系統(tǒng)邊界,集中精力進(jìn)行最需要的部分的開發(fā)竭缝。因而房维,從某種意義上講,界定系統(tǒng)邊界的工作也可以看作是數(shù)據(jù)倉庫系統(tǒng)設(shè)計(jì)的需求分析抬纸,因?yàn)樗鼘Q策者的數(shù)據(jù)分析的需求用系統(tǒng)邊界的定義形式反映出來咙俩。?

2. 確定主要的主題域?

在這一步中,要確定系統(tǒng)所包含的主題域湿故,然后對每個(gè)主題域的內(nèi)容進(jìn)行較明確的描述阿趁,描述的內(nèi)容包括:?

l? ?? ?? ???主題域的公共碼鍵;?

l? ?? ?? ???主題域之間的聯(lián)系晓锻;?

l? ?? ?? ???充分代表主題的屬性組歌焦。

第二節(jié)??技術(shù)準(zhǔn)備工作

這一階段的工作包括:技術(shù)評估,技術(shù)環(huán)境準(zhǔn)備砚哆。?

這一階段的成果是:技術(shù)評估報(bào)告独撇、軟硬件配置方案、系統(tǒng)(軟躁锁、硬件)總體設(shè)計(jì)方案纷铣。管理數(shù)據(jù)倉庫的技術(shù)要求與管理操作型環(huán)境中的數(shù)據(jù)與處理的技術(shù)要求區(qū)別 很大,兩者所考慮的方面也不同战转。我們之所以在一般情況下總是將分析型數(shù)據(jù)與操作型數(shù)據(jù)分離開來搜立,將分析型數(shù)據(jù)單獨(dú)集中存放,也就是用數(shù)據(jù)倉庫來存放槐秧,技術(shù) 要求上的差異是一個(gè)重要原因啄踊。?

1. 技術(shù)評估?

進(jìn)行技術(shù)評估,就是確定數(shù)據(jù)倉庫的各項(xiàng)性能指標(biāo)刁标。一般情況下颠通,需要在這一步里確定的性能指標(biāo)包括:?

l? ?? ?? ???管理大數(shù)據(jù)量數(shù)據(jù)的能力;?

l? ?? ?? ???進(jìn)行靈活數(shù)據(jù)存取的能力膀懈;?

l? ?? ?? ???根據(jù)數(shù)據(jù)模型重組數(shù)據(jù)的能力顿锰;?

l? ?? ?? ???透明的數(shù)據(jù)發(fā)送和接收能力;?

l? ?? ?? ???周期性成批裝載數(shù)據(jù)的能力;?

l? ?? ?? ???可設(shè)定完成時(shí)間的作業(yè)管理能力硼控。?

2. 技術(shù)環(huán)境準(zhǔn)備?

一旦數(shù)據(jù)倉庫的體系化結(jié)構(gòu)的模型大體建好后刘陶,下一步的工作就是確定我們應(yīng)該怎樣來裝配這個(gè)體系化結(jié)構(gòu)模型,主要是確定對軟硬件配置的要求牢撼;我們主要考慮相關(guān)的問題:?

l? ?? ?? ???預(yù)期在數(shù)據(jù)倉庫上分析處理的數(shù)據(jù)量有多大??

l? ?? ?? ???如何減少或減輕競爭性存取程序的沖突??

l? ?? ?? ???數(shù)據(jù)倉庫的數(shù)據(jù)量有多大??

l? ?? ?? ???進(jìn)出數(shù)據(jù)倉庫的數(shù)據(jù)通信量有多大?等等匙隔。?

根據(jù)這些考慮,我們就可以確定各項(xiàng)軟硬件的配備要求浪默,并且在這一步工作結(jié)束時(shí)各項(xiàng)技術(shù)準(zhǔn)備工作應(yīng)已就緒牡直,可以裝載數(shù)據(jù)了。這些配備有:?

l? ?? ?? ???直接存取設(shè)備(DASD)纳决;?

l? ?? ?? ???網(wǎng)絡(luò)碰逸;?

l? ?? ?? ???管理直接存取設(shè)備(DASD)的操作系統(tǒng);?

l? ?? ?? ???進(jìn)出數(shù)據(jù)倉庫的界面(主要是數(shù)據(jù)查詢和分析工具)阔加;?

管理數(shù)據(jù)倉庫的軟件饵史,目前即選用數(shù)據(jù)庫管理系統(tǒng)及有關(guān)的選件,購買的DBMS產(chǎn)品不能滿足管理數(shù)據(jù)倉庫需要的胜榔,還應(yīng)考慮自己或軟件集成商開發(fā)有關(guān)模塊等等胳喷。?

第三節(jié)??邏輯模型設(shè)計(jì)

在這一步里進(jìn)行的工作主要有:?

l? ?? ?? ???分析主題域,確定當(dāng)前要裝載的主題夭织;?

l? ?? ?? ???確定粒度層次劃分吭露;?

l? ?? ?? ???確定數(shù)據(jù)分割策略;?

l? ?? ?? ???關(guān)系模式定義尊惰;?

l? ?? ?? ???記錄系統(tǒng)定義?

邏輯模型設(shè)計(jì)的成果是讲竿,對每個(gè)當(dāng)前要裝載的主題的邏輯實(shí)現(xiàn)進(jìn)行定義,并將相關(guān)內(nèi)容記錄在數(shù)據(jù)倉庫的元數(shù)據(jù)中弄屡,包括:?

l? ?? ?? ???適當(dāng)?shù)牧6葎澐郑?

l? ?? ?? ???合理的數(shù)據(jù)分割策略题禀;?

l? ?? ?? ???適當(dāng)?shù)谋韯澐郑?

l? ?? ?? ???定義合適的數(shù)據(jù)來源等。?

1. 分析主題域?

在概念模型設(shè)計(jì)中膀捷,我們確定了幾個(gè)基本的主題域迈嘹,但是,數(shù)據(jù)倉庫的設(shè)計(jì)方法是一個(gè)逐步求精的過程全庸,在進(jìn)行設(shè)計(jì)時(shí)纷宇,一般是一次一個(gè)主題或一次若干個(gè)主題地逐 步完成的甫煞。所以凛膏,我們必須對概念模型設(shè)計(jì)步驟中確定的幾個(gè)基本主題域進(jìn)行分析该窗,并選擇首先要實(shí)施的主題域。選擇第一個(gè)主題域所要考慮的是它要足夠大拌消,以便 使得該主題域能建設(shè)成為一個(gè)可應(yīng)用的系統(tǒng);它還要足夠小,以便于開發(fā)和較快地實(shí)施墩崩。如果所選擇的主題域很大并且很復(fù)雜氓英,我們甚至可以針對它的一個(gè)有意義的 子集來進(jìn)行開發(fā)。在每一次的反饋過程中鹦筹,都要進(jìn)行主題域的分析铝阐。?

2. 粒度層次劃分

數(shù)據(jù)倉庫邏輯設(shè)計(jì)中要解決的一個(gè)重要問題是決定數(shù)據(jù)倉庫的粒度劃分層次,粒度層次劃分適當(dāng)與否直接影響到數(shù)據(jù)倉庫中的數(shù)據(jù)量和所適合的查詢類型铐拐。確定數(shù)據(jù) 倉庫的粒度劃分徘键,可以使用在粒度劃分一節(jié)中介紹的方法,通過估算數(shù)據(jù)行數(shù)和所需的DASD數(shù)遍蟋,來確定是采用單一粒度還是多重粒度吹害,以及粒度劃分的層次。?

3. 確定數(shù)據(jù)分割策略?

在這一步里虚青,要選擇適當(dāng)?shù)臄?shù)據(jù)分割的標(biāo)準(zhǔn)它呀,一般要考慮以下幾方面因素:數(shù)據(jù)量(而非記錄行數(shù))、數(shù)據(jù)分析處理的實(shí)際情況棒厘、簡單易行以及粒度劃分策略等纵穿。數(shù) 據(jù)量的大小是決定是否進(jìn)行數(shù)據(jù)分割和如何分割的主要因素;數(shù)據(jù)分析處理的要求是選擇數(shù)據(jù)分割標(biāo)準(zhǔn)的一個(gè)主要依據(jù)奢人,因?yàn)閿?shù)據(jù)分割是跟數(shù)據(jù)分析處理的對象緊密 聯(lián)系的谓媒;我們還要考慮到所選擇的數(shù)據(jù)分割標(biāo)準(zhǔn)應(yīng)是自然的、易于實(shí)施的:同時(shí)也要考慮數(shù)據(jù)分割的標(biāo)準(zhǔn)與粒度劃分層次是適應(yīng)的何乎。?

4. 關(guān)系模式定義?

數(shù)據(jù)倉庫的每個(gè)主題都是由多個(gè)表來實(shí)現(xiàn)的句惯,這些表之間依靠主題的公共碼鍵聯(lián)系在一起,形成一個(gè)完整的主題宪赶。在概念模型設(shè)計(jì)時(shí)宗弯,我們就確定了數(shù)據(jù)倉庫的基本 主題,并對每個(gè)主題的公共碼鍵搂妻、基本內(nèi)容等做了描述在這一步里蒙保,我們將要對選定的當(dāng)前實(shí)施的主題進(jìn)行模式劃分,形成多個(gè)表欲主,并確定各個(gè)表的關(guān)系模式邓厕。?

第四節(jié)??物理模型設(shè)計(jì)

這一步所做的工作是確定數(shù)據(jù)的存儲結(jié)構(gòu),確定索引策略扁瓢,確定數(shù)據(jù)存放位置详恼,確定存儲分配。?

確定數(shù)據(jù)倉庫實(shí)現(xiàn)的物理模型引几,要求設(shè)計(jì)人員必須做到以下幾方面:?

l? ?? ?? ???要全面了解所選用的數(shù)據(jù)庫管理系統(tǒng)昧互,特別是存儲結(jié)構(gòu)和存取方法。?

l? ?? ?? ???了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻度敞掘、使用方式叽掘、數(shù)據(jù)規(guī)模以及響應(yīng)時(shí)間要求等,這些是對時(shí)間和空間效率進(jìn)行平衡和優(yōu)化的重要依據(jù)玖雁。?

l? ?? ?? ???了解外部存儲設(shè)備的特性更扁,如分塊原則,塊大小的規(guī)定赫冬,設(shè)備的I/O特性等浓镜。?

1. 確定數(shù)據(jù)的存儲結(jié)構(gòu)?

一個(gè)數(shù)據(jù)庫管理系統(tǒng)往往都提供多種存儲結(jié)構(gòu)供設(shè)計(jì)人員選用,不同的存儲結(jié)構(gòu)有不同的實(shí)現(xiàn)方式劲厌,各有各的適用范圍和優(yōu)缺點(diǎn)膛薛,設(shè)計(jì)人員在選擇合適的存儲結(jié)構(gòu)時(shí)應(yīng)該權(quán)衡三個(gè)方面的主要因素:存取時(shí)間、存儲空間利用率和維護(hù)代價(jià)脊僚。?

2. 確定索引策略?

數(shù)據(jù)倉庫的數(shù)據(jù)量很大相叁,因而需要對數(shù)據(jù)的存取路徑進(jìn)行仔細(xì)的設(shè)計(jì)和選擇。由于數(shù)據(jù)倉庫的數(shù)據(jù)都是不常更新的辽幌,因而可以設(shè)計(jì)多種多樣的索引結(jié)構(gòu)來提高數(shù)據(jù)存取效率增淹。?

在數(shù)據(jù)倉庫中,設(shè)計(jì)人員可以考慮對各個(gè)數(shù)據(jù)存儲建立專用的乌企、復(fù)雜的索引虑润,以獲得最高的存取效率,因?yàn)樵跀?shù)據(jù)倉庫中的數(shù)據(jù)是不常更新的加酵,也就是說每個(gè)數(shù)據(jù)存儲是穩(wěn)定的拳喻,因而雖然建立專用的、復(fù)雜的索引有一定的代價(jià)猪腕,但一旦建立就幾乎不需維護(hù)索引的代價(jià)冗澈。?

3. 確定數(shù)據(jù)存放位置?

我們說過,同一個(gè)主題的數(shù)據(jù)并不要求存放在相同的介質(zhì)上陋葡。在物理設(shè)計(jì)時(shí)亚亲,我們常常要按數(shù)據(jù)的重要程度、使用頻率以及對響應(yīng)時(shí)間的要求進(jìn)行分類腐缤,并將不同類 的數(shù)據(jù)分別存儲在不同的存儲設(shè)備中捌归。重要程度高、經(jīng)常存取并對響應(yīng)時(shí)間要求高的數(shù)據(jù)就存放在高速存儲設(shè)備上岭粤,如硬盤惜索;存取頻率低或?qū)Υ嫒№憫?yīng)時(shí)間要求低的 數(shù)據(jù)則可以放在低速存儲設(shè)備上,如磁盤或磁帶剃浇。?

數(shù)據(jù)存放位置的確定還要考慮到其它一些方法巾兆,如:決定是否進(jìn)行合并表猎物;是否對一些經(jīng)常性的應(yīng)用建立數(shù)據(jù)序列;對常用的臼寄、不常修改的表或?qū)傩允欠袢哂啻鎯Π赞取H绻捎昧诉@些技術(shù),就要記入元數(shù)據(jù)吉拳。?

4. 確定存儲分配?

許多數(shù)據(jù)庫管理系統(tǒng)提供了一些存儲分配的參數(shù)供設(shè)計(jì)者進(jìn)行物理優(yōu)化處理,如:塊的尺寸适揉、緩沖區(qū)的大小和個(gè)數(shù)等等留攒,它們都要在物理設(shè)計(jì)時(shí)確定。這同創(chuàng)建數(shù)據(jù)庫系統(tǒng)時(shí)的考慮是一樣的嫉嘀。?

第五節(jié)??數(shù)據(jù)倉庫的生成

在這一步里所要做的工作是接口編程炼邀,數(shù)據(jù)裝入。?

這一步工作的成果是剪侮,數(shù)據(jù)已經(jīng)裝入到數(shù)據(jù)倉庫中拭宁,可以在其上建立數(shù)據(jù)倉庫的應(yīng)用,即DSS應(yīng)用瓣俯。?

1. 設(shè)計(jì)接口?

將操作型環(huán)境下的數(shù)據(jù)裝載進(jìn)入數(shù)據(jù)倉庫環(huán)境杰标,需要在兩個(gè)不同環(huán)境的記錄系統(tǒng)之間建立一個(gè)接口。乍一看彩匕,建立和設(shè)計(jì)這個(gè)接口腔剂,似乎只要編制一個(gè)抽取程序就可 以了,事實(shí)上驼仪,在這一階段的工作中掸犬,的確對數(shù)據(jù)進(jìn)行了抽取,但抽取并不是全部的工作绪爸,這一接口還應(yīng)具有以下的功能:?

l? ?? ?? ???從面向應(yīng)用和操作的環(huán)境生成完整的數(shù)據(jù)湾碎;?

l? ?? ?? ???數(shù)據(jù)的基于時(shí)間的轉(zhuǎn)換;?

l? ?? ?? ???數(shù)據(jù)的凝聚奠货;?

l? ?? ?? ???對現(xiàn)有記錄系統(tǒng)的有效掃描介褥,以便以后進(jìn)行追加。?

當(dāng)然仇味,考慮這些因素的同時(shí)呻顽,還要考慮到物理設(shè)計(jì)的一些因素和技術(shù)條件限制,根據(jù)這些內(nèi)容丹墨,嚴(yán)格地制定規(guī)格說明廊遍,然后根據(jù)規(guī)格說明,進(jìn)行接口編程贩挣。從操作型 環(huán)境到數(shù)據(jù)倉庫環(huán)境的數(shù)據(jù)接口編程的過程和一般的編程過程并無區(qū)別喉前,它也包括偽碼開發(fā)没酣、編碼、編譯卵迂、檢錯(cuò)裕便、測試等步驟。?

在接口編程中见咒,要注意:?

l? ?? ?? ???保持高效性偿衰,這也是一般的編程所要求的;?

l? ?? ?? ???要保存完整的文檔記錄改览;?

l? ?? ?? ???要靈活下翎,易于改動;?

l? ?? ?? ???要能完整宝当、準(zhǔn)確地完成從操作型環(huán)境到數(shù)據(jù)倉庫環(huán)境的數(shù)據(jù)抽取视事、轉(zhuǎn)換與集成。?

2. 數(shù)據(jù)裝入?

在這一步里所進(jìn)行的就是運(yùn)行接口程序庆揩,將數(shù)據(jù)裝入到數(shù)據(jù)倉庫中俐东。主要的工作是:?

l? ?? ?? ???確定數(shù)據(jù)裝入的次序;?

l? ?? ?? ???清除無效或錯(cuò)誤數(shù)據(jù)订晌;?

l? ?? ?? ???數(shù)據(jù)“老化” 虏辫;?

l? ?? ?? ???數(shù)據(jù)粒度管理;?

l? ?? ?? ???數(shù)據(jù)刷新等腾仅。

最初只使用一部分?jǐn)?shù)據(jù)來生成第一個(gè)主題域乒裆,使得設(shè)計(jì)人員能夠輕易且迅速地對已做工作進(jìn)行調(diào)整,而且能夠盡早地提交到下一步驟推励,即數(shù)據(jù)倉庫的使用和維護(hù)鹤耍。這 樣既可以在經(jīng)濟(jì)上最快地得到回報(bào),又能夠通過最終用戶的使用验辞、盡早發(fā)現(xiàn)一些問題并提出新的需求稿黄,然后反饋給設(shè)計(jì)人員,設(shè)計(jì)人員繼續(xù)對系統(tǒng)改進(jìn)跌造、擴(kuò)展杆怕。

第六節(jié)??數(shù)據(jù)倉庫的使用和維護(hù)

在這一步中所要做的工作有建立DSS應(yīng)用,即使用數(shù)據(jù)倉庫理解需求壳贪,調(diào)整和完善系統(tǒng)陵珍,維護(hù)數(shù)據(jù)倉庫。?

建立企業(yè)的體系化環(huán)境违施,不僅包括建立起操作型和分析型的數(shù)據(jù)環(huán)境互纯,還應(yīng)包括在這一數(shù)據(jù)環(huán)境中建立起企業(yè)的各種應(yīng)用。數(shù)據(jù)倉庫裝入數(shù)據(jù)之后磕蒲,下一步工作是: 一方面留潦,使用數(shù)據(jù)倉庫中的數(shù)據(jù)服務(wù)于決策分析的目的只盹,也就是在數(shù)據(jù)倉庫中建立起DSS應(yīng)用;另一方面兔院,根據(jù)用戶使用情況和反饋來的新的需求殖卑,開發(fā)人員進(jìn)一 步完善系統(tǒng),并管理數(shù)據(jù)倉庫的一些日撤宦埽活動孵稽,如刷新數(shù)據(jù)倉庫的當(dāng)前詳細(xì)數(shù)據(jù)、將過時(shí)的數(shù)據(jù)轉(zhuǎn)化成歷史數(shù)據(jù)十偶、清除不再使用的數(shù)據(jù)肛冶、調(diào)整粒度級別等。我們把這 一步驟稱為數(shù)據(jù)倉庫的使用與維護(hù)扯键。?

1. 建立DSS應(yīng)用?

使用數(shù)據(jù)倉庫,即開發(fā)DSS應(yīng)用珊肃,與在操作型環(huán)境中的應(yīng)用開發(fā)有著本質(zhì)區(qū)別荣刑,開發(fā)DSS應(yīng)用不同于聯(lián)機(jī)事務(wù)處理應(yīng)用開發(fā)的顯著特點(diǎn)在于:?

l? ?? ?? ???DSS應(yīng)用開發(fā)是從數(shù)據(jù)出發(fā)的;?

l? ?? ?? ???DSS應(yīng)用的需求不能在開發(fā)初期明確了解伦乔;?

l? ?? ?? ???DSS應(yīng)用開發(fā)是一個(gè)不斷循環(huán)的過程厉亏,是啟發(fā)式的開發(fā)。?

DSS應(yīng)用主要可分為兩類:例行分析處理和啟發(fā)式分析處理烈和。例行分析處理是指那些重復(fù)進(jìn)行的分析處理爱只,它通常是屬于部門級的應(yīng)用,如部門統(tǒng)計(jì)分析招刹,報(bào)表分 析等等恬试;而個(gè)人級的分析應(yīng)用經(jīng)常是隨機(jī)性很大的,企業(yè)經(jīng)營者受到某種信息啟發(fā)而進(jìn)行的一些即席的分析處理疯暑,所以我們稱之為啟發(fā)式的分析處理训柴。?

DSS應(yīng)用開發(fā)的大致步驟如下:?

步驟l——確定所需的數(shù)據(jù)。為滿足DSS應(yīng)用的要求妇拯,我們必須從數(shù)據(jù)倉庫中確定一個(gè)可能用到的數(shù)據(jù)范圍幻馁。這是一個(gè)試探的過程。?

步驟2——編程抽取數(shù)據(jù)越锈。根據(jù)上面得到的數(shù)據(jù)范圍仗嗦,編寫一個(gè)抽取程序來獲得這些數(shù)據(jù)。為適應(yīng)分析需求多變的特點(diǎn)甘凭,要求所編寫的抽取程序應(yīng)該通用稀拐,易于修改。?

步驟3——合并數(shù)據(jù)对蒲。如果有多個(gè)數(shù)據(jù)抽取源钩蚊,要將抽取來的數(shù)據(jù)進(jìn)行合并贡翘、提煉,使數(shù)據(jù)符合分析處理的要求砰逻。?

步驟4——分析數(shù)據(jù)鸣驱。在上步準(zhǔn)備好的數(shù)據(jù)基礎(chǔ)上進(jìn)行分析處理,并看所得的結(jié)果是否滿足了原始的要求蝠咆,如果不能滿足踊东,則返回步驟1,開始新的一次循環(huán)刚操,否則就準(zhǔn)備最終分析結(jié)果報(bào)告闸翅。?

步驟5——回答問題。生成最終分析結(jié)果報(bào)告菊霜〖峒剑—般情況下,最終的分析結(jié)果報(bào)告是在許多次的循環(huán)后得到的鉴逞,因?yàn)橐淮畏治鎏幚砗苌偈窃谝淮窝h(huán)后就完成的记某。?

步驟6——例行化、一次分析處理的最后构捡、我們要決定是否將在上面已經(jīng)建立的分析處理例行化液南。如果建立的分析處理是重復(fù)進(jìn)行的部門級的DSS應(yīng)用,那么最好 是將它例行化勾徽,這樣在進(jìn)行下一次同樣的分析處理時(shí)滑凉,不必再重復(fù)上述六步的循環(huán)過程。而且喘帚,不斷地積累這種例行處理畅姊,形成一個(gè)集合,我們就可以通過組合這些 已有的處理來生成新的一個(gè)較大的復(fù)雜處理啥辨,或完成一個(gè)復(fù)雜處理的一部分涡匀。?

2. 理解需求,改善和完善系統(tǒng)溉知,維護(hù)數(shù)據(jù)倉庫?

數(shù)據(jù)倉庫的開發(fā)是逐步完善的原型法的開發(fā)方法陨瘩,它要求:要盡快地讓系統(tǒng)運(yùn)行起來,盡早產(chǎn)生效益级乍;要在系統(tǒng)運(yùn)行或使用中舌劳,不斷地理解需求,改善系統(tǒng)玫荣;不斷地考慮新的需求甚淡,完善系統(tǒng)。?

維護(hù)數(shù)據(jù)倉庫的工作主要是管理日常數(shù)據(jù)裝入的工作捅厂,包括刷新數(shù)據(jù)倉庫的當(dāng)前詳細(xì)數(shù)據(jù)贯卦,將過時(shí)的數(shù)據(jù)轉(zhuǎn)化成歷史數(shù)據(jù).清除不再使用的數(shù)據(jù)资柔,管理元數(shù)據(jù),等等撵割;另外贿堰,如何利用接口定期從操作型環(huán)境向數(shù)據(jù)倉庫追加數(shù)據(jù),確定數(shù)據(jù)倉庫的數(shù)據(jù)刷新頻率啡彬,等等羹与。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市庶灿,隨后出現(xiàn)的幾起案子纵搁,更是在濱河造成了極大的恐慌,老刑警劉巖往踢,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腾誉,死亡現(xiàn)場離奇詭異,居然都是意外死亡峻呕,警方通過查閱死者的電腦和手機(jī)妄辩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來山上,“玉大人,你說我怎么就攤上這事英支∨搴叮” “怎么了?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵干花,是天一觀的道長妄帘。 經(jīng)常有香客問我,道長池凄,這世上最難降的妖魔是什么抡驼? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮肿仑,結(jié)果婚禮上致盟,老公的妹妹穿的比我還像新娘。我一直安慰自己尤慰,他們只是感情好馏锡,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著伟端,像睡著了一般杯道。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上责蝠,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天党巾,我揣著相機(jī)與錄音萎庭,去河邊找鬼。 笑死齿拂,一個(gè)胖子當(dāng)著我的面吹牛驳规,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播创肥,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼达舒,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了叹侄?” 一聲冷哼從身側(cè)響起巩搏,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎趾代,沒想到半個(gè)月后贯底,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡撒强,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年禽捆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片飘哨。...
    茶點(diǎn)故事閱讀 38,161評論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡胚想,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出芽隆,到底是詐尸還是另有隱情浊服,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布胚吁,位于F島的核電站牙躺,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏腕扶。R本人自食惡果不足惜孽拷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望半抱。 院中可真熱鬧脓恕,春花似錦、人聲如沸窿侈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棉磨。三九已至江掩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背环形。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工策泣, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抬吟。 一個(gè)月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓萨咕,卻偏偏與公主長得像,于是被迫代替她去往敵國和親火本。 傳聞我的和親對象是個(gè)殘疾皇子危队,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容