(2021.01.02 Sun)
概念
函數(shù)依賴(functional dependency, FD): 如果關(guān)系R的兩個(gè)元組(即兩行數(shù)據(jù))在屬性A1, A2, ..., An上一致明刷,即它們對(duì)應(yīng)于這些屬性的分量值都相等,那么它們必定在其他屬性B1, B2, ..., Bm上也一致淤齐。該函數(shù)的依賴形式記為笔宿,并稱為“A1, A2, ..., An函數(shù)決定B1, B2, ..., Bm”。通常玛瘸,F(xiàn)D的右邊可能是單屬性演怎。一個(gè)函數(shù)依賴等價(jià)于一組FD:
鍵key: 如果下列條件滿足嚷炉,就認(rèn)為一個(gè)或多個(gè)屬性集是關(guān)系R的鍵十厢。
- 這些屬性函數(shù)決定關(guān)系的所有其他屬性等太。或蛮放,關(guān)系R不可能存在兩個(gè)不同的元組澈驼,他們具有相同的值。
- 在的真子集中筛武,沒(méi)有一個(gè)能函數(shù)決定R的所有其他屬性】嫠或徘六,鍵必須是最小的(minimal)。
當(dāng)鍵只包括一個(gè)單獨(dú)的屬性A時(shí)榴都,稱A(而不是{A})是鍵待锈。
超鍵superkey: 一個(gè)包含鍵的屬性集叫做超鍵(superkey),它是鍵的超集的簡(jiǎn)寫(xiě)嘴高。因此每個(gè)鍵都是超鍵竿音。然而某些超鍵不是(最小化的)鍵。每個(gè)超鍵都滿足鍵的第一個(gè)條件拴驮,即它函數(shù)決定了關(guān)系中所有其他屬性春瞬。但超鍵不需要滿足第二個(gè)條件,即最小化套啤。
超鍵有時(shí)被稱為鍵宽气。而對(duì)最小化的鍵,也就是這里的鍵潜沦,有時(shí)被稱為候選鍵candidate key萄涯。異常(anomaly): 當(dāng)試圖在一個(gè)關(guān)系中包含過(guò)多信息時(shí),產(chǎn)生的問(wèn)題(如冗余)稱為異常anomaly唆鸡。異常的基本類型有
- 冗余(redundancy)涝影。信息沒(méi)有必要的在多個(gè)元組中重復(fù)。
- 異常更新(update anomaly)争占∪悸撸可能修改了某個(gè)元組的信息序目,但是沒(méi)有改變其他元組中的相同信息。
- 刪除異常(delete anomaly)唆樊。如果一個(gè)值變成空集宛琅,就可能帶來(lái)丟失信息的副作用。
函數(shù)依賴的規(guī)則
假設(shè)已經(jīng)知道關(guān)系滿足一些FD集合逗旁。通常從這些已知FD中還能推導(dǎo)出這個(gè)關(guān)系上必定存在的其他FD嘿辟。發(fā)現(xiàn)其他FD的能力,對(duì)于討論怎樣設(shè)計(jì)一個(gè)好的關(guān)系模式很有必要片效。
如果關(guān)系R中的屬性Y是FD屬性X的红伦,則滿足以下兩個(gè)條件
- 屬性Y函數(shù)依賴于屬性X
- 屬性Y不函數(shù)依賴于屬性X的任一個(gè)真子集X'。
如果屬性Y值函數(shù)依賴于屬性X的某一個(gè)真子集X'淀衣,則稱屬性Y局部依賴于屬性X昙读。
如果關(guān)系中的主鍵是單屬性的,則非鍵屬性對(duì)主鍵肯定都是完全函數(shù)依賴的膨桥。當(dāng)關(guān)系中的主鍵是復(fù)合屬性時(shí)蛮浑,則非鍵屬性對(duì)主鍵的函數(shù)依賴就有完全與部分兩種可能。
在關(guān)系R中只嚣,若沮稚,(),册舞,蕴掏,則稱Z傳遞依賴于X。
關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)流程
(2022.01.03 Mon)
- 系統(tǒng)分析:按照提出的設(shè)計(jì)任務(wù)收集相關(guān)的數(shù)據(jù)和確定數(shù)據(jù)處理的流程调鲸,并分析各業(yè)務(wù)的輸入數(shù)據(jù)盛杰、輸出數(shù)據(jù)、各類數(shù)據(jù)的使用頻度及各部門(mén)之間交換數(shù)據(jù)的數(shù)量和處理功能與要求藐石。最后應(yīng)整理出“需求說(shuō)明書(shū)”即供,作為以后各階段工作的基礎(chǔ)。
*概念設(shè)計(jì):根據(jù)需求說(shuō)明書(shū)于微,進(jìn)一步細(xì)致了解各業(yè)務(wù)處理過(guò)程中數(shù)據(jù)的名稱募狂、類型、長(zhǎng)度角雷、數(shù)量祸穷、取值范圍,使用一種能為大多數(shù)人理解的形式描述所需數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu)勺三,并與任何計(jì)算機(jī)硬件雷滚、軟件無(wú)關(guān),即所謂概念結(jié)構(gòu)說(shuō)明吗坚。比較常用的是實(shí)體-關(guān)系圖描述(E-R圖)祈远。 - 邏輯設(shè)計(jì):目標(biāo)是產(chǎn)生一個(gè)具體的DBMS可以處理的模式呆万。這個(gè)模式能夠滿足全部用戶的要求。前述E-R圖可以轉(zhuǎn)換成任何類型的數(shù)據(jù)庫(kù)模式车份。當(dāng)吧E-R圖轉(zhuǎn)換成關(guān)系模式(data schema?)時(shí)谋减,要把其中所有實(shí)體型轉(zhuǎn)換成關(guān)系模式,并把所有聯(lián)系帶上相連實(shí)體型的主關(guān)鍵字后也轉(zhuǎn)換成關(guān)系模式扫沼。同時(shí)出爹,可應(yīng)用關(guān)系的規(guī)范化理論,選擇性能好的關(guān)系模式缎除。
這一階段還要同時(shí)對(duì)應(yīng)用程序進(jìn)行邏輯設(shè)計(jì)严就,即對(duì)每個(gè)處理程序給出數(shù)據(jù)存儲(chǔ)的方法及程序結(jié)構(gòu)及各模式間的接口。 - 物理設(shè)計(jì):主要確定數(shù)據(jù)庫(kù)的存儲(chǔ)記錄格式器罐、索引組成梢为、空間大小估算等。同步開(kāi)發(fā)應(yīng)用程序轰坊。
- 數(shù)據(jù)庫(kù)的實(shí)現(xiàn)和維護(hù):在具體的硬軟件平臺(tái)上建立數(shù)據(jù)庫(kù)的結(jié)構(gòu)铸董,裝入數(shù)據(jù);完成應(yīng)用程序并上機(jī)調(diào)試運(yùn)行肴沫;在運(yùn)行過(guò)程中評(píng)價(jià)庫(kù)結(jié)構(gòu)的合理性粟害、存儲(chǔ)效率、處理效率和應(yīng)用程序的功能等樊零;根據(jù)需要調(diào)整、修改和維護(hù)數(shù)據(jù)庫(kù)孽文。
關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)的基本步驟
- 研究初始的模式設(shè)計(jì)存在的問(wèn)題
- 引入“分解”思想驻襟,把一個(gè)初始關(guān)系模式(若干屬性的集合)分解為兩個(gè)(或多個(gè))較小的模式
- 引入“Boyce-Codd范式”(Boyce-Codd Normalisation Format, BCNF),消除上述問(wèn)題
- 當(dāng)解釋怎樣通過(guò)分解關(guān)系模式來(lái)確保BCNF條件時(shí)芋哭,把上面的幾點(diǎn)結(jié)合起來(lái)沉衣。
分解關(guān)系(decompose)
一般用分解關(guān)系的方法來(lái)消除異常。關(guān)系R的分解設(shè)計(jì)分離R的屬性减牺,以構(gòu)造兩個(gè)新的關(guān)系模式豌习。
給定一個(gè)關(guān)系,把它分解為和拔疚,并且滿足:
這里的是投影(projection)肥隆。投影操作用來(lái)從關(guān)系R生成一個(gè)新關(guān)系,這個(gè)關(guān)系只包含原來(lái)關(guān)系R中的不分裂稚失,而只包含關(guān)系R屬性所代表的的列栋艳。
關(guān)系數(shù)據(jù)庫(kù)的規(guī)范化處理
在關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)過(guò)程中,初始的關(guān)系模式通常需要改進(jìn)句各,尤其在消除冗余方面吸占。一般來(lái)說(shuō)晴叨,冗余等問(wèn)題是由于模式試圖將過(guò)多的內(nèi)容合并到一個(gè)關(guān)系中而造成的。我們使用異常(anomaly)來(lái)指代這些問(wèn)題矾屯。
使用函數(shù)依賴(functional dependency)這一概念來(lái)定義關(guān)系模式的規(guī)范形式兼蕊,稱為規(guī)范化(normalisation)。規(guī)范化的影響在于可以將關(guān)系分解(decompose)為兩個(gè)或多個(gè)關(guān)系以消除異常件蚕。多值依賴(multivalued dependency)孙技,直觀的表示了一個(gè)條件:關(guān)系的一個(gè)或多個(gè)屬性獨(dú)立于其他若干個(gè)屬性。這些依賴也可以導(dǎo)致關(guān)系的規(guī)范構(gòu)造和分解骤坐,以消除冗余绪杏。
關(guān)系的第一、二纽绍、三范式
- 第一范式(1NF):所有符合關(guān)系定義的關(guān)系都稱為規(guī)范關(guān)系蕾久,即第一范式,記為1NF拌夏。表中的每一列都是不可拆分的最小單元僧著,保證每個(gè)屬性的原子性。
為了與規(guī)范關(guān)系相區(qū)別障簿,有時(shí)也把某些屬性有重復(fù)組或空白值的二維表稱為非規(guī)范關(guān)系盹愚。非規(guī)范關(guān)系可轉(zhuǎn)變?yōu)橐?guī)范關(guān)系。比如把空白值用特殊符號(hào)標(biāo)記站故,也可以在值空白時(shí)將表拆開(kāi)皆怕。
一個(gè)1NF關(guān)系可能是個(gè)結(jié)構(gòu)不太好的關(guān)系,可能存在如下問(wèn)題:- 數(shù)據(jù)冗余大西篓,記錄重復(fù)
- 修改異常愈腾,由于數(shù)據(jù)冗余大,難免疏漏
- 插入一場(chǎng)岂津,
- 刪除異常
- 第二范式2NF:若關(guān)系虱黄,且每個(gè)非主屬性均完全函數(shù)依賴于主鍵,則稱關(guān)系R是第二范式的吮成,即橱乱。也就是表中所有列必須依賴于主鍵,不能有任何一列與主鍵沒(méi)有關(guān)系粱甫。2NF存在的問(wèn)題和1NF相似泳叠。
- 第三范式3NF:若有關(guān)系,且關(guān)系中的每個(gè)非主屬性均不傳遞依賴于主鍵茶宵,則稱關(guān)系R是第三范式的析二,即。也就是屬性于主鍵直接相關(guān)而非間接相關(guān),或表中每一列只依賴于主鍵叶摄。要求一個(gè)表中不包含已包含在其他表中的非主鍵屬性属韧。
3NF由于消除可能存在的部分函數(shù)依賴和傳遞函數(shù)依賴,因而具有較好的性能蛤吓。但是宵喂,3NF中沒(méi)有限制某些主屬性對(duì)主鍵之間的函數(shù)依賴,故又提出了BCNF范式会傲,作為對(duì)3NF的修正锅棕。
BCNF范式
定義:當(dāng)且僅當(dāng)關(guān)系R中每個(gè)決定因素都是候選鍵時(shí),則稱關(guān)系R是Boyce-Codd范式淌山,即裸燎。
所謂決定因素,是關(guān)系模式中的一個(gè)屬性或?qū)傩约靡桑渌承傩曰驅(qū)傩约耆瘮?shù)依賴于它德绿。
一個(gè)BCNF關(guān)系必定是3NF的,但是一個(gè)3NF的關(guān)系未必是BCNF的退渗。
重復(fù)選擇使用適當(dāng)?shù)姆纸庖莆龋梢园讶魏我粋€(gè)關(guān)系模式分解為帶有下列重要性質(zhì)的具有多個(gè)屬性的子集:
- 以這些子集為模式的關(guān)系都屬于BCNF
- 原始關(guān)系中的數(shù)據(jù)都被正確的反映在分解后的關(guān)系上,或会油,原始關(guān)系應(yīng)該能從分解后的幾個(gè)關(guān)系實(shí)例中重構(gòu)个粱。
Reference
1 匙彥斌等主編,計(jì)算機(jī)軟件技術(shù)基礎(chǔ)教程翻翩,天津大學(xué)出版社
2 Jeffery U.等著都许,岳麗華等譯,數(shù)據(jù)庫(kù)系統(tǒng)基礎(chǔ)教程嫂冻,機(jī)械工業(yè)出版社