圖書(shū):數(shù)據(jù)建模經(jīng)典教程
關(guān)鍵點(diǎn)
√ 路徑搜尋囊括所有被人類(lèi)或動(dòng)物使用的技術(shù)及工具,以實(shí)現(xiàn)從一個(gè)地點(diǎn)抵達(dá)到另外一個(gè)地點(diǎn)沮协。
√ 數(shù)據(jù)模型是一組由符號(hào)抛姑、文本組成的集合,用以準(zhǔn)確表達(dá)信息景觀榔昔,達(dá)到有效交流驹闰、溝通的目的。
√ 數(shù)據(jù)模型具有多種表現(xiàn)形式撒会,而最常見(jiàn)并得到廣泛理解的形式為電子表格嘹朗。
√ 數(shù)據(jù)模型形式是本書(shū)的主題之一,它與電子表格非常相似茧彤,但數(shù)據(jù)模型基于類(lèi)型骡显,包含相互作用和可擴(kuò)展性。
√ 數(shù)據(jù)建模是建立數(shù)據(jù)模型的過(guò)程曾掂,需要很多與技術(shù)無(wú)關(guān)的技能惫谤,如專心聆聽(tīng),盡可能提出大量問(wèn)題珠洗,甚至耐心溜歪。
關(guān)鍵點(diǎn)
√ 數(shù)據(jù)建模的兩大核心價(jià)值是交流性及精確性。
√ 無(wú)論是建模中许蓖,還是建模完成后蝴猪,都需要進(jìn)行交流、溝通膊爪。
√ 如果存在弱定義自阱、偽數(shù)據(jù)、模糊或缺失標(biāo)簽等3種情況米酬,數(shù)據(jù)模型的精確性將會(huì)降低沛豌。
√ 交流性和精確性使得數(shù)據(jù)模型成為一種構(gòu)建應(yīng)用程序的出色工具。
√ 數(shù)據(jù)模型還可以被應(yīng)用于理解已有應(yīng)用程序赃额、了解業(yè)務(wù)加派、執(zhí)行影響分析和培訓(xùn)團(tuán)隊(duì)成員。
關(guān)鍵點(diǎn)
√ 照相機(jī)上有4種設(shè)置跳芳,變焦芍锦、對(duì)焦、定時(shí)器飞盆、濾鏡娄琉,它們都可以被直接轉(zhuǎn)換到數(shù)據(jù)模型上次乓。變焦可以轉(zhuǎn)換為數(shù)據(jù)模型的范圍。對(duì)焦可以轉(zhuǎn)換為數(shù)據(jù)模型的抽象车胡。定時(shí)器轉(zhuǎn)換為時(shí)間設(shè)置檬输,用來(lái)決定數(shù)據(jù)模型獲取當(dāng)前的視圖,還是未來(lái)的視圖匈棘。過(guò)濾器轉(zhuǎn)換為功能設(shè)置,用來(lái)決定數(shù)據(jù)模型獲取的是業(yè)務(wù)視角析命,還是應(yīng)用程序視角主卫。
√ 用適當(dāng)?shù)哪P驮O(shè)置匹配建立模型的目標(biāo),可以提升數(shù)據(jù)模型以及它所支撐的應(yīng)用項(xiàng)目的質(zhì)量鹃愤。
√ 不要忘記關(guān)于圖像格式的可選項(xiàng)簇搅!人們更喜歡去看一份校樣(概念數(shù)據(jù)模型)、底片(邏輯數(shù)據(jù)模型)软吐,還是圖片(物理數(shù)據(jù)模型)瘩将?
實(shí)體類(lèi)型
關(guān)鍵點(diǎn)
√ 一個(gè)實(shí)體表示的是對(duì)于業(yè)務(wù)非常重要或值得獲取的事物及與之相關(guān)的信息集合。實(shí)體應(yīng)該符合六大種類(lèi)之一:誰(shuí)凹耙、什么姿现、何時(shí)、何地肖抱、為何及如何备典。
√ 實(shí)體由名詞或名詞詞組定義。
√ 實(shí)體實(shí)例是一個(gè)具體實(shí)體的呈現(xiàn)或者說(shuō)是實(shí)體的值意述。
√ 實(shí)體可以存在于概念提佣、邏輯、物理等3種細(xì)節(jié)水平上荤崇。
√ 實(shí)體可分為強(qiáng)實(shí)體和弱實(shí)體拌屏。
強(qiáng)實(shí)體可以獨(dú)立存在,用來(lái)表示相對(duì)獨(dú)立的人术荤、事或地點(diǎn)倚喂。例如,為了檢索某位特定顧客的信息喜每,可以在數(shù)據(jù)庫(kù)中使用顧客號(hào)進(jìn)行查找务唐。“這是Bob带兜,顧客號(hào)為123”枫笛。巧克力風(fēng)味的冰淇淋可以用C進(jìn)行檢索,冰淇淋大小為兩匙的信息可以用數(shù)字2進(jìn)行檢索刚照。
弱實(shí)體至少依賴于一個(gè)其他的實(shí)體刑巧,這意味著如果不引用其他實(shí)體的實(shí)例,就無(wú)法檢索弱實(shí)體的實(shí)例,例如啊楚,冰淇淋訂單可以由冰淇淋口味或冰淇淋大小吠冤,再結(jié)合冰淇淋訂單中的某些內(nèi)容(如序號(hào))進(jìn)行檢索。
屬性
域基本概念
以下為3種基本的域類(lèi)型恭理。
① 格式域?qū)?shù)據(jù)指定為數(shù)據(jù)庫(kù)中的標(biāo)準(zhǔn)類(lèi)型拯辙,如整型(Integer)、字符型(Character(30))颜价、日期(Date)等都是格式域涯保。
② 列表域類(lèi)似于一個(gè)下拉列表,它由一個(gè)可選的有限值的集合組成周伦,列表域是格式域的精簡(jiǎn)夕春,如“訂單狀態(tài)代碼”的格式域可以被置為Character(10),在此基礎(chǔ)上該域可以由一個(gè)(Open专挪、Shipped及志、Closed、Returned)列表域進(jìn)一步精簡(jiǎn)寨腔。
③ 范圍域的設(shè)置要求取值介于最小值與最大值之間速侈,例如,“訂單交付日期”必須為從今天到未來(lái)3個(gè)月中的某天脆侮。與列表域類(lèi)似锌畸,范圍域也是格式域的精簡(jiǎn)。
基于以下幾個(gè)原因靖避,域是非常有用的潭枣。
① 插入數(shù)據(jù)前,通過(guò)域的檢查來(lái)提高數(shù)據(jù)質(zhì)量幻捏。這是域存在的主要原因盆犁,通過(guò)限定屬性的可能取值來(lái)降低臟數(shù)據(jù)進(jìn)入數(shù)據(jù)庫(kù)的可能性。例如篡九,每一個(gè)表示金額的屬性被設(shè)置為“數(shù)量域”谐岁,該域要求數(shù)字的長(zhǎng)度上限為15且包括小數(shù)點(diǎn)后的兩位,顯然這是表示貨幣數(shù)額很好的一種方法榛臼,“銷(xiāo)售總額”若被設(shè)置為“數(shù)量域”伊佃,則不允許如R2D2這樣的值被添加。
② 數(shù)據(jù)模型的交流性更強(qiáng)沛善。當(dāng)我們?cè)跀?shù)據(jù)模型上設(shè)置了域航揉,就意味著數(shù)據(jù)模型的一個(gè)屬性必須具備一個(gè)特定域的特征,這樣數(shù)據(jù)模型就變成更容易被理解的交流工具金刁。例如帅涂,我們可以讓“銷(xiāo)售總額”“凈銷(xiāo)售額”“標(biāo)價(jià)銷(xiāo)售額”3個(gè)屬性都可以共享一個(gè)“數(shù)量域”议薪,進(jìn)而共享域的特征,它們的取值都被限定為“貨幣”媳友。
③ 使得新建模型斯议、維護(hù)現(xiàn)有模型變得更有效率。當(dāng)一位模型構(gòu)建師開(kāi)始一項(xiàng)新工程時(shí)醇锚,可以使用一組標(biāo)準(zhǔn)域來(lái)節(jié)省時(shí)間哼御,而無(wú)需重新創(chuàng)建。例如焊唬,所有與數(shù)量有關(guān)的屬性艇搀,都可以同時(shí)與數(shù)量域關(guān)聯(lián),這樣可以極大節(jié)省分析求晶、設(shè)計(jì)時(shí)間。
關(guān)鍵點(diǎn)
√ 對(duì)業(yè)務(wù)而言衷笋,屬性是非常重要性的特征芳杏,其值用以識(shí)別、描述辟宗、評(píng)估實(shí)體實(shí)例爵赵。
√ 域中往往包含一組驗(yàn)證標(biāo)準(zhǔn),使得域可以被多個(gè)屬性應(yīng)用泊脐。
√ 域的不同類(lèi)型包括:格式域空幻、列表域、范圍域
關(guān)系
存在兩種類(lèi)型的數(shù)據(jù)規(guī)則容客,結(jié)構(gòu)完整型(structural integrity秕铛,SI)和參照完整型(referential integrity,RI)缩挑。結(jié)構(gòu)規(guī)則(又被稱為基數(shù)規(guī)則)定義了參與某個(gè)關(guān)系的實(shí)體實(shí)例的數(shù)量但两,例如:
每種產(chǎn)品可以出現(xiàn)在一個(gè)或多個(gè)訂單行上。
每個(gè)訂單行上有且僅有一則產(chǎn)品供置。
每位學(xué)生必須有唯一的學(xué)號(hào)谨湘。
RI規(guī)則專注于確保取值的有效性。
訂單行不能脫離有效的產(chǎn)品而存在芥丧。
索賠不能脫離對(duì)應(yīng)的政策而存在紧阔。
學(xué)生不能脫離有效的學(xué)號(hào)而存在。
關(guān)鍵點(diǎn)
√ 數(shù)據(jù)模型中的規(guī)則即為關(guān)系续担,關(guān)系被表示成一條連接兩個(gè)實(shí)體的線段擅耽,用來(lái)說(shuō)明實(shí)體間的規(guī)則或?qū)Ш铰窂健?/p>
√ 數(shù)據(jù)規(guī)則指示數(shù)據(jù)間如何關(guān)聯(lián),行為規(guī)則指示當(dāng)屬性包含有某特定值時(shí)赤拒,需要采取什么操作秫筏。
√ 基數(shù)是由關(guān)系兩端的符號(hào)所表示的诱鞠,它定義了每個(gè)實(shí)體可以參與一個(gè)關(guān)系的次數(shù)。有3種簡(jiǎn)單的選項(xiàng):0这敬、1和多航夺。
√ 標(biāo)簽是出現(xiàn)在關(guān)系線上的動(dòng)詞。標(biāo)簽應(yīng)該在可能的情況下盡量詳細(xì)崔涂,來(lái)確保數(shù)據(jù)模型的準(zhǔn)確度阳掐。
√ 遞歸關(guān)系是存在于來(lái)自同一實(shí)體的實(shí)例間的規(guī)則。
√ 子類(lèi)型可以將一些類(lèi)似的屬性或?qū)⒁恍┫嗨魄矣嘘P(guān)聯(lián)的實(shí)體的關(guān)系進(jìn)行分組冷蚂。
8.4 創(chuàng)建一個(gè)概念數(shù)據(jù)模型
關(guān)鍵點(diǎn)
√ 概念是對(duì)于你的用戶而言缭保,既基礎(chǔ)又至關(guān)重要的關(guān)鍵觀念。
√ 概念數(shù)據(jù)模型由一組符合和文本構(gòu)成蝙茶,用來(lái)為特定的用戶艺骂,針對(duì)特定的業(yè)務(wù)需求或應(yīng)用程序范圍,描述關(guān)鍵概念以及概念間的相互規(guī)則隆夯。
√ 關(guān)系概念模型包括概念钳恕、概念定義以及表示業(yè)務(wù)規(guī)則的概念間的相互關(guān)系。維度概念模型包括概念蹄衷、概念定義以及在不同層級(jí)分析量度時(shí)所用的導(dǎo)航路徑忧额。
√ 建立概念數(shù)據(jù)模型的5個(gè)基本步驟
使用5個(gè)步驟進(jìn)行概念數(shù)據(jù)建模
步驟1:詢問(wèn)5個(gè)策略性的問(wèn)題
1.應(yīng)用程序?qū)⒁鍪裁矗?br>
2.“正如”還是“將要”?
3.統(tǒng)計(jì)分析是必須的嗎愧口?
4.誰(shuí)是用戶睦番?
5.靈活性還是簡(jiǎn)潔性?
步驟2:概念的識(shí)別與定義
步驟3:創(chuàng)建關(guān)系
對(duì)于維度模型
對(duì)于維度模型耍属,我們需要對(duì)上一步匯總的問(wèn)題進(jìn)行處理并創(chuàng)建一個(gè)粒度矩陣(Grain Matrix)托嚣。粒度矩陣是一張二維表,列由根據(jù)業(yè)務(wù)問(wèn)題而形成的量度構(gòu)成恬涧,行由根據(jù)業(yè)務(wù)問(wèn)題而形成的維度級(jí)別構(gòu)成注益。
步驟4:明確最有效的形式
軸技術(shù)是把要測(cè)度的業(yè)務(wù)過(guò)程置于中心(如學(xué)生屬性),然后每個(gè)軸表示一個(gè)維度溯捆,軸上的每一個(gè)刻痕表示不同細(xì)節(jié)水平的丑搔、可能被檢索的各個(gè)度量計(jì)中的測(cè)度。
步驟5:檢查并確認(rèn)
創(chuàng)建維度邏輯數(shù)據(jù)模型
圖9.8所示為本章之前我們所學(xué)習(xí)到的維度數(shù)據(jù)模型提揍。
Account Balance **( **賬戶余額 **) **是一個(gè)量度計(jì)的示例啤月,是一個(gè)包含相關(guān)測(cè)度的實(shí)體,它有別于關(guān)系數(shù)據(jù)模型中的人劳跃、地點(diǎn)谎仲、事件或事物刨仑。在本示例中辙诞,量度計(jì)包含的一組測(cè)度只有一個(gè)賬戶余額數(shù)(Account Balance Amount)。通常士八,一組測(cè)度作為一個(gè)整體官卡,來(lái)測(cè)度所關(guān)注的是業(yè)務(wù)過(guò)程,如利潤(rùn)率仔涩、員工滿意度或銷(xiāo)售柑肴。
圖9.8 賬戶維度邏輯數(shù)據(jù)模型
量度計(jì)可以被進(jìn)一步劃分為以下4種類(lèi)型之一。
聚集:又稱為概括。聚集量度計(jì)中存儲(chǔ)信息的粒度層次要高于事務(wù)粒度層次。對(duì)焦提供了用戶友好洒试、快速數(shù)據(jù)訪問(wèn)的結(jié)構(gòu)和報(bào)表工具。此例中的Account Balance即為一個(gè)聚集。
原子:其中包含了業(yè)務(wù)中可用的最低層的細(xì)節(jié)數(shù)據(jù),其細(xì)節(jié)水平層次與操作型系統(tǒng)中存在的細(xì)節(jié)水平一致,諸如訂單輸入系統(tǒng)蜡吧。在銀行賬號(hào)管理中畔乙,一個(gè)原子事實(shí)的例子為個(gè)人銀行賬戶的取款和存款交易返咱。
累積:又稱之為累加难述。累積關(guān)注的是完成一次業(yè)務(wù)流程需要多長(zhǎng)時(shí)間。例如两入,從開(kāi)始申請(qǐng)一直到完成房屋抵押貸款所經(jīng)歷的時(shí)間將被記錄在一張累積事實(shí)表中。
快照:記錄了實(shí)體生命周期中與特定步驟相關(guān)的時(shí)間信息。例如,銷(xiāo)售的快照信息可能包含訂單何時(shí)被創(chuàng)建坎吻、確認(rèn)刊头、運(yùn)輸您机、交付以及支付某宪。
區(qū)域、賬戶和月份都是維度示例壶谒,用3條水平線組成的圖標(biāo)加以標(biāo)識(shí)挑社。每個(gè)維度都是用來(lái)增加量度指標(biāo)的主題阱当,所有過(guò)濾表箭、排序和求和等不同的應(yīng)用需求都使用同樣的維度崔拥。維度擁有自身的屬性慈俯。一個(gè)維度又可以進(jìn)一步劃分為以下6種維度類(lèi)型洋闽。
固定維度:又稱之為0型漸變維度(Slowly Changing Dimension刊懈,SCD)户矢,固定維度中包含的值不隨時(shí)間改變挂洛。例如,性別是一種固定維度眠砾,其值為“男”和“女”虏劲。
退化維度:維度的屬性都被移至事實(shí)表中。最典型的退化維度是原始維度中僅包含單一的數(shù)據(jù)屬性褒颈,比如類(lèi)似訂單號(hào)這樣的事務(wù)標(biāo)識(shí)柒巫。
多值維度:多值維度可以用來(lái)解決屬性或字段存在多值的情況。例如谷丸,健康護(hù)理單中所包含的“診斷”欄目就可能存在多值的情況堡掏。但需要注意的是最好的模型應(yīng)該是其中的每個(gè)屬性只有單一的值。對(duì)于健康護(hù)理單的建模刨疼,我們可以創(chuàng)建一個(gè)多值結(jié)構(gòu)來(lái)存儲(chǔ)診斷信息泉唁,且為每種診斷賦以權(quán)重,并確保所有的權(quán)重和為“1”揩慕。
不齊整維度:在一個(gè)不齊整的維度(表)中亭畜,至少有一個(gè)成員的父成員在該維度(表)的直接上級(jí)維度(表)中缺失。不齊整維度允許層級(jí)的深度是不確定的迎卤,例如拴鸵,由國(guó)家、州止吐、市組成的3級(jí)維度中,某些城市如華盛頓地區(qū)便沒(méi)有與之對(duì)應(yīng)的州侨糟。
收縮維度:收縮維度依附于測(cè)度計(jì)碍扔,并且通常只包含少量非量度性屬性。收縮維度經(jīng)常應(yīng)用于處理大塊文本數(shù)據(jù)秕重,文本與測(cè)度計(jì)通常具有相同的細(xì)節(jié)水平不同,而且為了節(jié)省空間和提高檢索效率,大塊文本數(shù)據(jù)會(huì)被存儲(chǔ)在獨(dú)立于數(shù)據(jù)庫(kù)的結(jié)構(gòu)中。
漸變類(lèi)型 **0 **~ **6 **:漸變維度(SCD)類(lèi)型0和固定維度的概念一致二拐,其值不隨時(shí)間變化服鹅。SCD類(lèi)型1意味著僅僅存儲(chǔ)當(dāng)前維度成員的值,而忽略數(shù)值的歷史變化百新。SCD類(lèi)型2意味著需要存儲(chǔ)所有的歷史數(shù)據(jù)(類(lèi)型2是種時(shí)間機(jī)器)企软。SCD類(lèi)型3意味著僅僅需要記錄一部分歷史信息,如當(dāng)前狀態(tài)和最近狀態(tài)或當(dāng)前狀態(tài)和原始狀態(tài)饭望。SCD類(lèi)型6則表示存在復(fù)雜維度仗哨,該維度的歷史可能存在多種變化。比如铅辞,維度的組成部分1符合SCD1厌漂,組成部分2符合SCD2,組成部分3符合SCD3斟珊,即1+2+3=6苇倡。類(lèi)型0、1囤踩、2旨椒、3是構(gòu)成復(fù)雜、先進(jìn)歷史信息(如類(lèi)型6)所需的組件高职。
關(guān)鍵點(diǎn)
√ 邏輯數(shù)據(jù)模型用來(lái)描述詳細(xì)的業(yè)務(wù)解決方案钩乍。
√ 關(guān)系邏輯數(shù)據(jù)模型描述的是業(yè)務(wù)運(yùn)轉(zhuǎn)過(guò)程,而維度邏輯數(shù)據(jù)模型則描述的是如何對(duì)業(yè)務(wù)實(shí)施監(jiān)測(cè)怔锌。
√ 規(guī)范化就是一個(gè)用正規(guī)的方法提出業(yè)務(wù)疑問(wèn)的過(guò)程寥粹,以確保每個(gè)屬性都是單值的,并且提供一個(gè)完全的埃元、唯一的依賴于主鍵的事實(shí)涝涤。
√ 抽象通過(guò)重定義和將一些實(shí)體、屬性岛杀、關(guān)系在模型范圍內(nèi)結(jié)合成更通用的條目阔拳,為數(shù)據(jù)模型注入靈活性。
√ 維度數(shù)據(jù)模型涉及一些特有的类嗤、重要的概念糊肠,如量度計(jì)、維度等遗锣。
√ 量度計(jì)可以被進(jìn)一步劃分為聚集货裹、原子、累積和快照4種類(lèi)型精偿。
√ 維度又可以進(jìn)一步劃分為固定維度弧圆、退化維度赋兵、多值維度、不齊整維度搔预、收縮維度和漸變維度6種類(lèi)型霹期。
Rolldown和Rollup。Rolldown指主從表合并至從表拯田,Rollup指主從表合并至主表历造。
Rolldown:移除父類(lèi)型實(shí)體,并將父類(lèi)型實(shí)體中的所有屬性和關(guān)系都拷貝至相應(yīng)的子類(lèi)型實(shí)體中勿锅。
Rollup:移除子類(lèi)型實(shí)體帕膜,并將子類(lèi)型實(shí)體中的所有屬性和關(guān)系都拷貝至相應(yīng)的父類(lèi)型實(shí)體中,并增加類(lèi)型碼溢十,以區(qū)分各子類(lèi)型垮刹。
Identity:將子類(lèi)型符號(hào)轉(zhuǎn)換為一系列一對(duì)一關(guān)系,并分別連接父類(lèi)型和各個(gè)子類(lèi)型张弛。
關(guān)鍵點(diǎn)
√ 物理數(shù)據(jù)模型指使用由邏輯數(shù)據(jù)模型定義的業(yè)務(wù)解決方案荒典,構(gòu)建下一層次的技術(shù)解決方案。
√ Rolldown是指一對(duì)關(guān)系中的父實(shí)體消失吞鸭,并且將父實(shí)體中所有的列和關(guān)系都下移至子實(shí)體寺董。
√ Rollup是指一列或多列的組合可能在同一個(gè)實(shí)體內(nèi)被重復(fù)兩次或多次。
√ 星型模式的結(jié)果為組成維度的一組表被平鋪(flattened)到單個(gè)表中刻剥。
√ 視圖是一種虛擬表遮咖,是由SQL查詢定義的作用于真正存儲(chǔ)數(shù)據(jù)的表(或其他視圖)之上的“視窗”或窗口視圖。
√ 索引是一個(gè)值造虏,是指向表中該值實(shí)例的指針御吞。
√ 分區(qū)指一個(gè)表被劃分為兩個(gè)或多個(gè)表。垂直分區(qū)指表中的列被劃分漓藕,而水平分區(qū)為表中的行被劃分陶珠。
In-The-Know模板
用來(lái)獲取對(duì)數(shù)據(jù)需求有所貢獻(xiàn)和驗(yàn)證功能的人員及文檔。其中記錄了相關(guān)人員的姓名享钞、角色和聯(lián)系信息揍诽,同時(shí)羅列了一些重要資源的出處,例如栗竖,對(duì)完成數(shù)據(jù)模型交付起到至關(guān)重要的一些文檔(業(yè)務(wù)暑脆、功能需求文檔等)的出處。如果不將以上內(nèi)容記錄下來(lái)狐肢,而只是依靠記憶添吗,一段時(shí)間過(guò)后很容易將一些重要信息遺失。
表11.1 In-The-Know模板示例
以下說(shuō)明表11.1中各列的作用处坪。
- **條目: **該列用來(lái)列舉概念名稱根资,此處列舉的概念來(lái)自概念數(shù)據(jù)模型或概念列表(之后會(huì)討論到的一項(xiàng)技術(shù))。表11.1中羅列的是客戶和商品同窘。
- **資源: **該列為信息源玄帕。在本模板中,該列可以被擴(kuò)展而存儲(chǔ)任何有用的信息想邦,其中包括人員裤纹、需求、文檔丧没、報(bào)告等鹰椒,但在進(jìn)行描述時(shí)盡量做到具體化。如果一個(gè)概念對(duì)應(yīng)多個(gè)資源呕童,此時(shí)每個(gè)資源在表中占單獨(dú)的一行漆际,如表11.1中的Tom Jones、客戶分類(lèi)列表和當(dāng)前商品報(bào)表夺饲。
- **類(lèi)型: **為每一個(gè)資源指定通用分類(lèi)奸汇,由于這里使用的是被廣泛使用的通用模板,所以將每一個(gè)資源指定最恰當(dāng)?shù)姆诸?lèi)顯得十分重要往声。例如擂找,表11.1中的主題專家顧問(wèn)、參考文檔和報(bào)告報(bào)表浩销。當(dāng)In-The-Know模板記錄的信息量非常大時(shí)贯涎,對(duì)資源進(jìn)行分類(lèi)就顯得更為重要。
- **角色/如何使用: **該列用來(lái)說(shuō)明羅列的資源對(duì)于項(xiàng)目開(kāi)發(fā)為何是有價(jià)值的慢洋。為什么要在模板中列舉出各種資源塘雳?明確化!例如且警,表11.1中的客戶介紹人粉捻、數(shù)據(jù)管理員、驗(yàn)證并創(chuàng)建新的客戶分類(lèi)斑芜、查閱當(dāng)前商品信息肩刃。
- **出處/聯(lián)系: **該列提供如何查找資源的路徑。如果資源是文檔杏头,則該列中記錄了文檔在公共硬盤(pán)驅(qū)動(dòng)器上的路徑盈包,或者記錄了在某服務(wù)器或網(wǎng)站中的位置。如果資源是人醇王,則該列中記錄了此人的電話號(hào)碼或電子郵箱呢燥。例如,表11.1中的212-555-1212寓娩,S:/customer/ custclsfn.xls和www.item.com叛氨。
In-The-Know模板用來(lái)獲取對(duì)數(shù)據(jù)需求有所貢獻(xiàn)和驗(yàn)證功能的人員及文檔呼渣。對(duì)信息進(jìn)行標(biāo)準(zhǔn)化格式設(shè)置可以實(shí)現(xiàn)以下幾個(gè)目標(biāo)。
- **提供了方便寞埠、完整的參考列表屁置。 **模板不僅易于閱讀而且提供了用于查找人、文檔等資源所必需的所有類(lèi)型的信息仁连。即便整個(gè)項(xiàng)目在交付使用多年之后蓝角,該列表對(duì)于可能出現(xiàn)的功能性或技術(shù)性問(wèn)題的解決,依然具有現(xiàn)實(shí)意義饭冬。
- **可用資源列表便于發(fā)現(xiàn)缺失或冗余使鹅。 **模板的使用突顯了任何缺失信息。例如昌抠,很容易發(fā)現(xiàn)模板中是否缺失關(guān)于商品的報(bào)表患朱,一旦缺失一些關(guān)鍵的參考文檔,都會(huì)引起模型構(gòu)造師及管理層的注意炊苫。
- **充當(dāng)一份標(biāo)志文件麦乞。 **例如,某人被當(dāng)作與某特定概念相關(guān)的資源記錄在模板中劝评,那么管理層將十分留意此人的工作狀況并有可能對(duì)此人的工作時(shí)間進(jìn)行必要的調(diào)整姐直。這樣便極大降低了當(dāng)有用戶咨詢某問(wèn)題如何解決時(shí),卻發(fā)現(xiàn)此人正在進(jìn)行其他工作的可能性蒋畜。
關(guān)鍵點(diǎn)
√ In-The-Know模板用來(lái)獲取對(duì)數(shù)據(jù)需求有所貢獻(xiàn)和驗(yàn)證功能的人員及文檔声畏。
√ 概念列表羅列了對(duì)于業(yè)務(wù)非常重要的關(guān)鍵概念,而無(wú)需使用數(shù)據(jù)建模符號(hào)姻成。
√ 家族樹(shù)是一種用來(lái)在應(yīng)用系統(tǒng)范圍內(nèi)插龄,為每個(gè)概念或?qū)傩垣@取信息源或其他關(guān)鍵元數(shù)據(jù)的電子表格。
結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)
關(guān)鍵點(diǎn)
√ 結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)的兩種基本形式科展。數(shù)據(jù)模型是結(jié)構(gòu)化數(shù)據(jù)的抽象均牢。非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)的本質(zhì)區(qū)別在于:結(jié)構(gòu)化數(shù)據(jù)可以被改變,而非結(jié)構(gòu)化數(shù)據(jù)則不可以才睹。
√ 分類(lèi)技術(shù)的使用可以實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的抽象徘跪。分類(lèi)技術(shù)可以將原始的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變具有類(lèi)別屬性的文本。
√ 分類(lèi)與非結(jié)構(gòu)化數(shù)據(jù)的關(guān)系類(lèi)似于數(shù)據(jù)模型與結(jié)構(gòu)化數(shù)據(jù)的關(guān)系琅攘。
√ 分類(lèi)是對(duì)文本進(jìn)行抽象的基礎(chǔ)垮庐。對(duì)文本進(jìn)行抽象的價(jià)值體現(xiàn)在消除原始文本中的專業(yè)詞匯,可以使用查詢語(yǔ)言進(jìn)行文本檢索坞琴,還可以對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行組織哨查。
√ 本體中不僅含有與分類(lèi)類(lèi)似的詞匯列表,還包含不同詞匯間的相互關(guān)系剧辐。
元數(shù)據(jù)是一個(gè)文本寒亥、聲音或圖像邮府,用來(lái)描述“用戶”需要什么,或者用來(lái)描述“用戶”需要觀看或體驗(yàn)什么溉奕。這里的“用戶”可以是人挟纱、組織或軟件程序。元數(shù)據(jù)的重要性在于它有助于明確腐宋、檢索到真正的數(shù)據(jù)。
名詞解釋
抽象: 通過(guò)重定義和對(duì)模型中的一些屬性檀轨、實(shí)體胸竞、關(guān)系進(jìn)行合并,得到一些通用的概念参萄,這樣為數(shù)據(jù)模型帶來(lái)一定的靈活性卫枝。例如,可以將“員工” “顧客”抽象為一個(gè)更通用的“人”的概念讹挎,人可以擔(dān)任不同的角色校赤,員工、顧客只是其中的兩種筒溃。
參與者: 是系統(tǒng)外部的直接使用者马篮。參與者包括用戶、外部設(shè)備怜奖、其他軟件系統(tǒng)浑测。在UML用例圖中,參與者用簡(jiǎn)筆小人表示歪玲。
敏捷: 敏捷意味著“快速”“熟練”迁央。通常以快速、高品質(zhì)軟件交付為目的滥崩,進(jìn)行應(yīng)用系統(tǒng)敏捷開(kāi)發(fā)。敏捷開(kāi)發(fā)采用多個(gè)子項(xiàng)目迭代的方式逐步完成整個(gè)項(xiàng)目工程的開(kāi)發(fā)。敏捷開(kāi)發(fā)的支持者認(rèn)為以項(xiàng)目迭代方式進(jìn)行開(kāi)發(fā)可以比傳統(tǒng)的軟件開(kāi)發(fā)方式花費(fèi)更短的時(shí)間來(lái)實(shí)現(xiàn)高品質(zhì)軟件系統(tǒng)脊髓。但反對(duì)者則認(rèn)為敏捷開(kāi)發(fā)關(guān)注的是軟件開(kāi)發(fā)的時(shí)間花銷(xiāo)曼追,但往往忽略企業(yè)視角下的宏觀應(yīng)用需求。
聚合: 是一種強(qiáng)關(guān)聯(lián)關(guān)系短条,表示一個(gè)整合的對(duì)象由多個(gè)組件構(gòu)成崇摄。聚合最顯著的特征有傳遞性和反對(duì)稱性。
備用鍵: 由一個(gè)或多個(gè)屬性構(gòu)成慌烧,具備唯一性逐抑、穩(wěn)定性、強(qiáng)制性和最小化等特點(diǎn)屹蚊,可以唯一識(shí)別實(shí)體實(shí)例厕氨,但并沒(méi)有被選擇充當(dāng)主鍵进每。
關(guān)聯(lián)實(shí)體: 用于解決多對(duì)多關(guān)系的實(shí)體。
屬性: 有時(shí)被稱為“數(shù)據(jù)元素”命斧,是業(yè)務(wù)處理中的重要特征田晚。屬性值可以用以識(shí)別、描述国葬、評(píng)估實(shí)體實(shí)例贤徒。例如,屬性“Claim Number”(索賠號(hào))可以識(shí)別每個(gè)索賠汇四,屬性“Student Last Name”(學(xué)生的姓氏)用來(lái)描述每個(gè)學(xué)生的姓接奈。屬性“Gross Sales Amount”(銷(xiāo)售總額)用來(lái)評(píng)估交易中獲取的財(cái)政收入。
橋接表 :用來(lái)解決維度與量度計(jì)間的多對(duì)多關(guān)系通孽,即一個(gè)給定的量度計(jì)實(shí)例可能對(duì)應(yīng)多個(gè)維度實(shí)例序宦。橋接表是邏輯層面上多對(duì)多關(guān)系的解決辦法,但是基于報(bào)表工具的不同背苦,物理層面上的解決結(jié)構(gòu)可能會(huì)多種多樣互捌。
候選鍵 :一個(gè)或多個(gè)可以唯一標(biāo)識(shí)實(shí)體實(shí)例的屬性。候選鍵可以是主鍵行剂,也可以是備用鍵秕噪。
基數(shù): 表示一個(gè)實(shí)體的多少實(shí)例與另一個(gè)實(shí)體的實(shí)例發(fā)生關(guān)聯(lián),基數(shù)由出現(xiàn)在關(guān)系域兩端的符號(hào)表示厚宰。
類(lèi): 根據(jù)一組具有相同屬性的事物抽象而成的類(lèi)型或類(lèi)別巢价。類(lèi)是面向?qū)ο蟮姆治觥⒃O(shè)計(jì)和開(kāi)發(fā)的基礎(chǔ)固阁。類(lèi)與數(shù)據(jù)模型中的實(shí)體非常接近壤躲,即在實(shí)體的基礎(chǔ)上添加了表示功能的操作。與類(lèi)聯(lián)系最緊密的另一條術(shù)語(yǔ)是對(duì)象备燃。
類(lèi)字: 類(lèi)中一個(gè)屬性的名稱碉克,如總額(Amount)、編號(hào)(Code)及名稱(Name)并齐,可以為各個(gè)類(lèi)字指定通用域漏麦。
概念: 對(duì)于用戶而言,既基礎(chǔ)又至關(guān)重要的關(guān)鍵觀念况褪∷赫辏基礎(chǔ)意味著建模工程師和業(yè)務(wù)人員進(jìn)行模型講解或討論過(guò)程中,這一概念會(huì)被不斷提及测垛。至關(guān)重要?jiǎng)t意味著如果沒(méi)有這一概念捏膨,業(yè)務(wù)會(huì)被極大地改變,甚至不可能存在。
概念數(shù)據(jù)模型 :在特定業(yè)務(wù)或應(yīng)用系統(tǒng)范圍內(nèi)号涯,表示關(guān)鍵概念及其關(guān)系的一組符合和文本的集合目胡。
一致性維度: 整個(gè)平臺(tái)或多個(gè)部門(mén)共用的維度,而不僅僅只是某個(gè)業(yè)務(wù)單獨(dú)使用链快,支持企業(yè)一致性查詢誉己。一致性維度并不要求每個(gè)維度相同,而是要求每個(gè)維度擁有共同的超集域蜗。一致性維度支持跨多個(gè)數(shù)據(jù)集市的信息導(dǎo)航及查詢巨双。
數(shù)據(jù)模型: 準(zhǔn)確表示業(yè)務(wù)信息的一組符號(hào)、文本集合霉祸。在數(shù)據(jù)模型里可以把“客戶”這兩個(gè)字用矩形框起來(lái)筑累,表示一些實(shí)際、具體的客戶脉执,如Bob、IBM戒劫、Walmart半夷。線段表示兩個(gè)概念間的關(guān)系,如用線段表示一個(gè)“客戶”可以擁有一個(gè)或多個(gè)“賬戶”迅细。
數(shù)據(jù)建模工程師: 負(fù)責(zé)確認(rèn)巫橄、記錄數(shù)據(jù)需求并執(zhí)行數(shù)據(jù)建模過(guò)程。
數(shù)據(jù)建模: 是一個(gè)了解茵典、掌握數(shù)據(jù)需求并與具體實(shí)現(xiàn)技術(shù)無(wú)關(guān)的過(guò)程湘换,是成功實(shí)現(xiàn)應(yīng)用系統(tǒng)的必備過(guò)程。
退化維度: 維度的屬性都被移至事實(shí)表中统阿。最典型的退化維度是原始維度中僅包含單一的數(shù)據(jù)屬性彩倚,比如類(lèi)似訂單號(hào)這樣的事務(wù)標(biāo)識(shí)。
反規(guī)范化: 是選擇性地違反規(guī)范化規(guī)則并在模型中重新引入冗余的過(guò)程扶平。反規(guī)范化的主要目的在于額外的冗余有助于降低數(shù)據(jù)檢索時(shí)間帆离。同時(shí),反規(guī)范化還有助于創(chuàng)建一個(gè)用戶友好的模型结澄。
依賴實(shí)體: 又被稱之為弱實(shí)體哥谷,弱實(shí)體依賴于一個(gè)或多個(gè)其他實(shí)體而存在。弱實(shí)體的存在可以依賴于獨(dú)立實(shí)體麻献,也可以依賴于其他弱實(shí)體们妥。建模中,使用圓角框表示弱實(shí)體勉吻。
維度: 是用來(lái)增加量度指標(biāo)的主題监婶,所有過(guò)濾、排序和求和等不同的應(yīng)用需求都使用同樣的維度齿桃。維度通常使用層級(jí)結(jié)構(gòu)進(jìn)行組織压储。
域: 是某一屬性所有可能取值的集合鲜漩。
實(shí)體: 表示的是對(duì)于業(yè)務(wù)非常重要或值得獲取的事物及與之相關(guān)的信息集合。每個(gè)實(shí)體都由一個(gè)名詞或名詞詞組定義集惋,并符合六大種類(lèi)之一孕似,即誰(shuí)、什么刮刑、何時(shí)喉祭、何地、為何及如何雷绢。
實(shí)體實(shí)例: 是一個(gè)具體實(shí)體的呈現(xiàn)或者說(shuō)是實(shí)體的值泛烙,如實(shí)體“顧客”可以被一些如Bob、Joe翘紊、Jane等具體的姓名實(shí)例化蔽氨,實(shí)體“賬戶”則可能有諸如Bob's checking account、Bob's savings account帆疟、Joe's brokerage account等的實(shí)例鹉究。
可擴(kuò)展標(biāo)記語(yǔ)言(XML): 是使用人們可以識(shí)讀的標(biāo)簽進(jìn)行數(shù)據(jù)層次化組織的一種數(shù)據(jù)模型。人們以及軟件應(yīng)用系統(tǒng)都可以使用XML進(jìn)行信息交換和共享踪宠。XML與數(shù)據(jù)模型類(lèi)似自赔,都是非常有用的工具。XML易于理解柳琢,具備技術(shù)獨(dú)立性绍妨,而且使用簡(jiǎn)單的語(yǔ)法表示復(fù)雜的程序問(wèn)題。概念數(shù)據(jù)模型有別于邏輯數(shù)據(jù)模型和物理數(shù)據(jù)模型柬脸。同樣的道理他去,XML也將數(shù)據(jù)內(nèi)容與格式(如藍(lán)色,Arial倒堕,15號(hào)字體)規(guī)則區(qū)分開(kāi)來(lái)孤页。
事實(shí): 參閱測(cè)度。
非事實(shí)型事實(shí): 不包含任何事實(shí)的事實(shí)表涩馆,用來(lái)統(tǒng)計(jì)行施、記錄維度間關(guān)系事件出現(xiàn)的次數(shù)。
字段: 表示物理屬性魂那,又被稱之為列蛾号。
外鍵: 一個(gè)與其他實(shí)體關(guān)聯(lián)的屬性。使用外鍵可以從數(shù)據(jù)庫(kù)管理系統(tǒng)中的一個(gè)實(shí)體導(dǎo)航至另外一個(gè)涯雅。
正向工程: 從建立概念數(shù)據(jù)模型開(kāi)始鲜结,直到數(shù)據(jù)庫(kù)實(shí)現(xiàn)結(jié)束的應(yīng)用系統(tǒng)設(shè)計(jì)過(guò)程。
粒度: 表示維度數(shù)據(jù)模型中量度計(jì)可用的最低細(xì)節(jié)程度。
粒度矩陣 :一張描述每一個(gè)事實(shí)或測(cè)度細(xì)節(jié)水平的二維表格精刷,是構(gòu)造星型模式維度模型的基礎(chǔ)拗胜。
層級(jí) :排列對(duì)象、命名怒允、值埂软、類(lèi)別等的方法,表示“在……之上”“在……之下”或“與……在同一水平”纫事。
獨(dú)立實(shí)體: 也稱之為核實(shí)體勘畔,獨(dú)立實(shí)體表示與業(yè)務(wù)相關(guān)的對(duì)象,該實(shí)體的識(shí)別不依賴于模型中的其他實(shí)體丽惶。建模中炫七,使用矩形框表示獨(dú)立實(shí)體。
索引: 是指向檢索對(duì)象的指針钾唬。索引直接指向數(shù)據(jù)在磁盤(pán)空間中的存儲(chǔ)位置万哪,極大提高檢索速度。索引最好建立在經(jīng)常被檢索且其值很少被更新的屬性上抡秆。
倒排入口(IE) :非唯一索引奕巍,又被稱之為輔助鍵。
雜項(xiàng)維度: 包含所有可能的小聯(lián)合體及具有某種關(guān)聯(lián)的標(biāo)志琅轧、指示符的集合伍绳。
鍵—值: NoSQL數(shù)據(jù)庫(kù)中允許只使用兩列(Key踊挠,Value)進(jìn)行數(shù)據(jù)存儲(chǔ)乍桂,可以將一些復(fù)雜的數(shù)據(jù)存儲(chǔ)在“值”列。
邏輯數(shù)據(jù)模型(LDM): 是為了解決特定業(yè)務(wù)需求而形成的業(yè)務(wù)解決方案效床。邏輯模型以業(yè)務(wù)需求為基礎(chǔ)睹酌,忽略與軟件環(huán)境、硬件環(huán)境等具體問(wèn)題有關(guān)的模型實(shí)現(xiàn)的復(fù)雜性剩檀。
測(cè)度 :維度數(shù)據(jù)模型量度計(jì)中的一個(gè)屬性憋沿,用來(lái)回答一個(gè)或多個(gè)業(yè)務(wù)問(wèn)題。
元數(shù)據(jù): 是一個(gè)文本沪猴、聲音或圖像辐啄,用來(lái)描述“用戶”需要什么,或者用來(lái)描述“用戶”需要觀看或體驗(yàn)什么运嗜。這里的“用戶”可以是人壶辜、組織或軟件程序。
量度計(jì) :是一個(gè)包含相關(guān)測(cè)度的實(shí)體担租,一組測(cè)度作為一個(gè)整體砸民,來(lái)測(cè)度所關(guān)注的業(yè)務(wù)過(guò)程,如利潤(rùn)率、員工滿意度或銷(xiāo)售岭参。
模型: 是一組文字及各類(lèi)符號(hào)的集合反惕,用來(lái)將一個(gè)復(fù)雜的概念簡(jiǎn)單化。
自然鍵: 又被稱之為業(yè)務(wù)鍵演侯,自然鍵是在業(yè)務(wù)系統(tǒng)中標(biāo)識(shí)實(shí)體的唯一標(biāo)識(shí)符姿染。
網(wǎng)絡(luò): 實(shí)體間或?qū)嶓w實(shí)例間的多對(duì)多關(guān)系。
規(guī)范化: 是應(yīng)用一組規(guī)則對(duì)事物進(jìn)行整理的過(guò)程蚌本,確保每個(gè)屬性都是單值的盔粹,并且提供一個(gè)完全的、唯一的依賴于主鍵的事實(shí)程癌。
對(duì)象: 源于面向?qū)ο蟮某绦蛟O(shè)計(jì)舷嗡,并伴隨類(lèi)出現(xiàn),類(lèi)似于實(shí)體實(shí)例嵌莉,即在通用數(shù)據(jù)屬性描述的基礎(chǔ)上又結(jié)合了對(duì)通用行為的描述进萄。對(duì)象分為業(yè)務(wù)對(duì)象、接口對(duì)象及控制對(duì)象锐峭。
本體 :組織信息的形式化方法中鼠,即將各事物歸類(lèi)到各類(lèi)別并對(duì)各類(lèi)別進(jìn)行關(guān)聯(lián)。被引用最多的本體論的定義來(lái)自Tom Gruber“概念化的明確規(guī)范”沿癞。換言之援雇,本體是一種模型,模型則是使用一套標(biāo)準(zhǔn)來(lái)對(duì)復(fù)雜現(xiàn)實(shí)世界中事物進(jìn)行簡(jiǎn)化椎扬。
NoSQL: 一類(lèi)非關(guān)系型數(shù)據(jù)庫(kù)惫搏。NoSQL并不是一個(gè)很好的命名,因?yàn)樵撁Q并不能很好地表示其含義蚕涤,此類(lèi)數(shù)據(jù)庫(kù)不強(qiáng)調(diào)數(shù)據(jù)查詢(SQL源自關(guān)系型數(shù)據(jù)庫(kù))而更關(guān)注數(shù)據(jù)存儲(chǔ)筐赔。
分區(qū): 指對(duì)一種結(jié)構(gòu)的劃分或割裂。特別在數(shù)據(jù)庫(kù)物理設(shè)計(jì)過(guò)程中揖铜,分區(qū)指將一個(gè)表劃分為兩個(gè)或多個(gè)表茴丰。垂直分區(qū)指表中的列被劃分,而水平分區(qū)為表中的行被劃分天吓。水平分區(qū)及垂直分區(qū)常常被結(jié)合在一起使用贿肩,即當(dāng)行被劃分時(shí),只有某些特定的列包含在該行集合中龄寞。
物理數(shù)據(jù)模型: 表示詳細(xì)的技術(shù)解決方案汰规。物理數(shù)據(jù)模型是針對(duì)特定的硬件、軟件環(huán)境對(duì)邏輯數(shù)據(jù)模型進(jìn)行必要調(diào)整的產(chǎn)物萄焦。物理數(shù)據(jù)模型設(shè)計(jì)時(shí)控轿,常常需要做一定的折中處理冤竹,兼顧速度、空間茬射、安全等因素鹦蠕。
主鍵: 可以唯一標(biāo)識(shí)實(shí)體實(shí)例的一個(gè)或多個(gè)屬性的組合,并被選定為唯一標(biāo)識(shí)符在抛。
應(yīng)用: 是一種大型的钟病、集中組織的計(jì)劃,其中可能包含多個(gè)工程刚梭。通常應(yīng)用具有起始日期肠阱,但如果成功,則沒(méi)有結(jié)束日期朴读。應(yīng)用可能是非常復(fù)雜且需要長(zhǎng)期模型化的任務(wù)屹徘。例如,可以包括數(shù)據(jù)倉(cāng)庫(kù)(data warehouse)衅金、操作數(shù)據(jù)存儲(chǔ)(operational data store)及客戶關(guān)系管理系統(tǒng)(customer relationship management system)噪伊。
工程: 指完整的軟件系統(tǒng)開(kāi)發(fā),經(jīng)常由一組按期交付的成果構(gòu)成氮唯。例如鉴吹,可以包括銷(xiāo)售數(shù)據(jù)集市(sales data mart)、經(jīng)紀(jì)人交易應(yīng)用(broker trading application)惩琉、預(yù)定系統(tǒng)(reservation system)及對(duì)現(xiàn)有應(yīng)用的加強(qiáng)豆励。
遞歸關(guān)系: 同一實(shí)體的兩個(gè)實(shí)例相互關(guān)聯(lián)。例如瞒渠,一個(gè)組織可以向另一個(gè)組織報(bào)告良蒸。
關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng): 1970年IBM E. F. Codd 發(fā)明的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)第1次商業(yè)使用于1979年。
關(guān)系模型: 描述業(yè)務(wù)工作過(guò)程在孝,其中還描述有業(yè)務(wù)規(guī)則诚啃。例如淮摔,一個(gè)客戶必須至少擁有一個(gè)賬戶私沮,一個(gè)產(chǎn)品必須有一個(gè)縮寫(xiě)產(chǎn)品名。
關(guān)系: 描述了數(shù)據(jù)模型中的規(guī)則和橙。在實(shí)體聯(lián)系圖中仔燕,關(guān)系由連接兩個(gè)實(shí)體間的線段表示。
逆向工程: 從數(shù)據(jù)庫(kù)開(kāi)始了解現(xiàn)存的應(yīng)用系統(tǒng)魔招,即根據(jù)現(xiàn)有數(shù)據(jù)庫(kù)逐層向上晰搀,直到構(gòu)建出相應(yīng)的概念模型。
輔助鍵 :是經(jīng)常被訪問(wèn)的办斑,或者需要被快速檢索到的一個(gè)或多個(gè)屬性(如果多于一個(gè)屬性外恕,稱之為復(fù)合輔助鍵)杆逗。輔助鍵無(wú)需具備唯一、穩(wěn)定鳞疲、不可為空等特征罪郊。
半結(jié)構(gòu)化數(shù)據(jù): 半結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)的唯一差別在于:半結(jié)構(gòu)化數(shù)據(jù)需要查看數(shù)據(jù)本身來(lái)確定結(jié)構(gòu),而結(jié)構(gòu)化數(shù)據(jù)只需要檢查屬性名稱尚洽。半結(jié)構(gòu)化數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)的一個(gè)處理步驟悔橄。
快照測(cè)度: 記錄了實(shí)體生命周期中與特定步驟相關(guān)的時(shí)間信息。例如腺毫,銷(xiāo)售的快照信息可能包含訂單何時(shí)被創(chuàng)建癣疟、確認(rèn)、運(yùn)輸潮酒、交付以及支付睛挚。
漸變維度: 用來(lái)描述實(shí)體數(shù)據(jù)變化,漸變維度(SCD)類(lèi)型0和固定維度的概念一致急黎,其值不隨時(shí)間變化竞川。SCD類(lèi)型1意味著僅僅存儲(chǔ)當(dāng)前維度成員的值,而忽略數(shù)值的歷史變化叁熔。SCD類(lèi)型2意味著需要存儲(chǔ)所有的歷史數(shù)據(jù)(類(lèi)型2是種時(shí)間機(jī)器)委乌。SCD類(lèi)型3意味著僅僅需要記錄一部分歷史信息,如當(dāng)前狀態(tài)和最近狀態(tài)或當(dāng)前狀態(tài)和原始狀態(tài)荣回。SCD類(lèi)型6則表示存在復(fù)雜維度遭贸,該維度的歷史可能存在多種變化。
雪花維度 :一個(gè)物理維度建模結(jié)構(gòu)心软,其中分別實(shí)現(xiàn)每一組表壕吹,在結(jié)構(gòu)上非常類(lèi)似于邏輯維度模型。
電子表格: 是紙質(zhì)工作表格的一種表示形式删铃,表單中包含由行和列構(gòu)成的網(wǎng)格耳贬,網(wǎng)格中的每個(gè)單元格可以存放文本或數(shù)字,表單中的列通常表示不同類(lèi)型的信息猎唁。
涉眾: 一個(gè)關(guān)注于項(xiàng)目實(shí)現(xiàn)成果與否的人或組織咒劲。
星型模式: 是常見(jiàn)的一種維度物理數(shù)據(jù)模型結(jié)構(gòu)。星型模式的結(jié)果為組成維度的一組表被平鋪(flattened)到單個(gè)表中诫隅。事實(shí)表處于模型的中心腐魂,與事實(shí)表相關(guān)的每一個(gè)維度都被置于最低的細(xì)節(jié)水平。
結(jié)構(gòu)化數(shù)據(jù): 根據(jù)簡(jiǎn)單的類(lèi)字而命名的數(shù)據(jù)逐纬。簡(jiǎn)單意味著如果數(shù)據(jù)可以被分解蛔屹,那么只能通過(guò)規(guī)范化實(shí)現(xiàn)。
例如:
訂單日期
客戶姓名
銷(xiāo)售總值
子類(lèi)型化: 將多個(gè)實(shí)體中共同的屬性合并為一組豁生,同時(shí)保留每個(gè)實(shí)體的獨(dú)立屬性兔毒。
概括: 聚集量度計(jì)中存儲(chǔ)信息的粒度層次要高于事務(wù)粒度層次漫贞。
代理鍵: 替代自然鍵的實(shí)體唯一標(biāo)識(shí)符,通常由一個(gè)固定大小的育叁、無(wú)人工干預(yù)的绕辖、系統(tǒng)自動(dòng)產(chǎn)生的計(jì)數(shù)器生成,代理鍵不具備任何業(yè)務(wù)含義擂红,是IT設(shè)計(jì)人員根據(jù)整合仪际、性能等因素添加的一列屬性。
分類(lèi): 是一種樹(shù)形結(jié)構(gòu)昵骤。子節(jié)點(diǎn)只能有一個(gè)父節(jié)點(diǎn)树碱,父節(jié)點(diǎn)可以有一個(gè)或多個(gè)子節(jié)點(diǎn)。如果一個(gè)子節(jié)點(diǎn)存在多個(gè)父節(jié)點(diǎn)变秦,那么該子節(jié)點(diǎn)必須為每個(gè)父節(jié)點(diǎn)重復(fù)一次成榜。分類(lèi)的示例有產(chǎn)品類(lèi)別、關(guān)系數(shù)據(jù)模型中的超類(lèi)/子類(lèi)蹦玫、維度數(shù)據(jù)模型中的維度層級(jí)赎婚。
UML: 面向?qū)ο蠓治龊驮O(shè)計(jì)的主流建模工具,由Jacobsen樱溉、Booch挣输、Rumbaugh整合早期面向?qū)ο蠼?biāo)準(zhǔn)形成的。
非結(jié)構(gòu)化數(shù)據(jù):根據(jù) 復(fù)雜文本或?qū)ο箢?lèi)字而命名的數(shù)據(jù)福贞。復(fù)雜意味著數(shù)據(jù)可以徹底分解成不同類(lèi)型的數(shù)據(jù)撩嚼。
用例: 在面向?qū)ο蟮姆治鲋校x的工作流流程挖帘,以識(shí)別對(duì)象完丽、數(shù)據(jù)及其方法。
視圖: 是一種虛擬表拇舀,是由SQL查詢定義作用于真正存儲(chǔ)數(shù)據(jù)的表(或其他視圖)之上的“視窗”或窗口視圖逻族。
路徑搜尋: 囊括所有被人類(lèi)或動(dòng)物使用的技術(shù)及工具,以實(shí)現(xiàn)從一個(gè)地點(diǎn)抵達(dá)到另外一個(gè)骄崩。如果一位旅行者用天空中的星斗導(dǎo)航聘鳞,那么星斗便是他的路徑搜尋工具。同理刁赖,地圖搁痛、指南針也都是此類(lèi)工具长搀。所有的模型也是路徑搜尋工具宇弛。地圖可以幫助旅行者游覽一座城市,組織結(jié)構(gòu)圖可以幫助員工理解組織間的相互關(guān)系源请,設(shè)計(jì)藍(lán)圖則可以幫助建筑師交流建造計(jì)劃枪芒。