關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì), since 2022-01-02

(2021.01.02 Sun)

概念

  • 函數(shù)依賴(functional dependency, FD): 如果關(guān)系R的兩個(gè)元組(即兩行數(shù)據(jù))在屬性A1, A2, ..., An上一致明刷,即它們對(duì)應(yīng)于這些屬性的分量值都相等,那么它們必定在其他屬性B1, B2, ..., Bm上也一致淤齐。該函數(shù)的依賴形式記為A_1A_2 \cdots A_n \rightarrow B_1B_2 \cdots B_m笔宿,并稱為“A1, A2, ..., An函數(shù)決定B1, B2, ..., Bm”。通常玛瘸,F(xiàn)D的右邊可能是單屬性演怎。一個(gè)函數(shù)依賴A_1A_2 \cdots A_n \rightarrow B_1B_2 \cdots B_m等價(jià)于一組FD:
    A_1A_2 \cdots A_n \rightarrow B_1
    A_1A_2 \cdots A_n \rightarrow B_2
    \cdots
    A_1A_2 \cdots A_n \rightarrow B_m

  • 鍵key: 如果下列條件滿足嚷炉,就認(rèn)為一個(gè)或多個(gè)屬性集{A_1, A_2, \cdots, A_n}是關(guān)系R的鍵十厢。

  1. 這些屬性函數(shù)決定關(guān)系的所有其他屬性等太。或蛮放,關(guān)系R不可能存在兩個(gè)不同的元組澈驼,他們具有相同的A_1, A_2, \cdots, A_n值。
  2. {A_1, A_2, \cdots, A_n}的真子集中筛武,沒(méi)有一個(gè)能函數(shù)決定R的所有其他屬性】嫠或徘六,鍵必須是最小的(minimal)。
    當(dāng)鍵只包括一個(gè)單獨(dú)的屬性A時(shí)榴都,稱A(而不是{A})是鍵待锈。
  • 超鍵superkey: 一個(gè)包含鍵的屬性集叫做超鍵(superkey),它是鍵的超集的簡(jiǎn)寫(xiě)嘴高。因此每個(gè)鍵都是超鍵竿音。然而某些超鍵不是(最小化的)鍵。每個(gè)超鍵都滿足鍵的第一個(gè)條件拴驮,即它函數(shù)決定了關(guān)系中所有其他屬性春瞬。但超鍵不需要滿足第二個(gè)條件,即最小化套啤。
    超鍵有時(shí)被稱為鍵宽气。而對(duì)最小化的鍵,也就是這里的鍵潜沦,有時(shí)被稱為候選鍵candidate key萄涯。

  • 異常(anomaly): 當(dāng)試圖在一個(gè)關(guān)系中包含過(guò)多信息時(shí),產(chǎn)生的問(wèn)題(如冗余)稱為異常anomaly唆鸡。異常的基本類型有

  1. 冗余(redundancy)涝影。信息沒(méi)有必要的在多個(gè)元組中重復(fù)。
  2. 異常更新(update anomaly)争占∪悸撸可能修改了某個(gè)元組的信息序目,但是沒(méi)有改變其他元組中的相同信息。
  3. 刪除異常(delete anomaly)唆樊。如果一個(gè)值變成空集宛琅,就可能帶來(lái)丟失信息的副作用。

函數(shù)依賴的規(guī)則

假設(shè)已經(jīng)知道關(guān)系滿足一些FD集合逗旁。通常從這些已知FD中還能推導(dǎo)出這個(gè)關(guān)系上必定存在的其他FD嘿辟。發(fā)現(xiàn)其他FD的能力,對(duì)于討論怎樣設(shè)計(jì)一個(gè)好的關(guān)系模式很有必要片效。

如果關(guān)系R中的屬性Y是FD屬性X的红伦,則滿足以下兩個(gè)條件

  1. 屬性Y函數(shù)依賴于屬性X
  2. 屬性Y不函數(shù)依賴于屬性X的任一個(gè)真子集X'。

如果屬性Y值函數(shù)依賴于屬性X的某一個(gè)真子集X'淀衣,則稱屬性Y局部依賴于屬性X昙读。

如果關(guān)系中的主鍵是單屬性的,則非鍵屬性對(duì)主鍵肯定都是完全函數(shù)依賴的膨桥。當(dāng)關(guān)系中的主鍵是復(fù)合屬性時(shí)蛮浑,則非鍵屬性對(duì)主鍵的函數(shù)依賴就有完全與部分兩種可能。

在關(guān)系R中只嚣,若X\rightarrow Y沮稚,(Y \nsubseteq X),Y not \rightarrow X册舞,Y \rightarrow Z蕴掏,則稱Z傳遞依賴于X

關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)流程

(2022.01.03 Mon)


數(shù)據(jù)庫(kù)設(shè)計(jì)一般步驟.jpg
  • 系統(tǒng)分析:按照提出的設(shè)計(jì)任務(wù)收集相關(guān)的數(shù)據(jù)和確定數(shù)據(jù)處理的流程调鲸,并分析各業(yè)務(wù)的輸入數(shù)據(jù)盛杰、輸出數(shù)據(jù)、各類數(shù)據(jù)的使用頻度及各部門(mén)之間交換數(shù)據(jù)的數(shù)量和處理功能與要求藐石。最后應(yīng)整理出“需求說(shuō)明書(shū)”即供,作為以后各階段工作的基礎(chǔ)。
    *概念設(shè)計(jì):根據(jù)需求說(shuō)明書(shū)于微,進(jìn)一步細(xì)致了解各業(yè)務(wù)處理過(guò)程中數(shù)據(jù)的名稱募狂、類型、長(zhǎng)度角雷、數(shù)量祸穷、取值范圍,使用一種能為大多數(shù)人理解的形式描述所需數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu)勺三,并與任何計(jì)算機(jī)硬件雷滚、軟件無(wú)關(guān),即所謂概念結(jié)構(gòu)說(shuō)明吗坚。比較常用的是實(shí)體-關(guān)系圖描述(E-R圖)祈远。
  • 邏輯設(shè)計(jì):目標(biāo)是產(chǎn)生一個(gè)具體的DBMS可以處理的模式呆万。這個(gè)模式能夠滿足全部用戶的要求。前述E-R圖可以轉(zhuǎn)換成任何類型的數(shù)據(jù)庫(kù)模式车份。當(dāng)吧E-R圖轉(zhuǎn)換成關(guān)系模式(data schema?)時(shí)谋减,要把其中所有實(shí)體型轉(zhuǎn)換成關(guān)系模式,并把所有聯(lián)系帶上相連實(shí)體型的主關(guān)鍵字后也轉(zhuǎn)換成關(guān)系模式扫沼。同時(shí)出爹,可應(yīng)用關(guān)系的規(guī)范化理論,選擇性能好的關(guān)系模式缎除。
    這一階段還要同時(shí)對(duì)應(yīng)用程序進(jìn)行邏輯設(shè)計(jì)严就,即對(duì)每個(gè)處理程序給出數(shù)據(jù)存儲(chǔ)的方法及程序結(jié)構(gòu)及各模式間的接口。
  • 物理設(shè)計(jì):主要確定數(shù)據(jù)庫(kù)的存儲(chǔ)記錄格式器罐、索引組成梢为、空間大小估算等。同步開(kāi)發(fā)應(yīng)用程序轰坊。
  • 數(shù)據(jù)庫(kù)的實(shí)現(xiàn)和維護(hù):在具體的硬軟件平臺(tái)上建立數(shù)據(jù)庫(kù)的結(jié)構(gòu)铸董,裝入數(shù)據(jù);完成應(yīng)用程序并上機(jī)調(diào)試運(yùn)行肴沫;在運(yùn)行過(guò)程中評(píng)價(jià)庫(kù)結(jié)構(gòu)的合理性粟害、存儲(chǔ)效率、處理效率和應(yīng)用程序的功能等樊零;根據(jù)需要調(diào)整、修改和維護(hù)數(shù)據(jù)庫(kù)孽文。

關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)的基本步驟

  1. 研究初始的模式設(shè)計(jì)存在的問(wèn)題
  2. 引入“分解”思想驻襟,把一個(gè)初始關(guān)系模式(若干屬性的集合)分解為兩個(gè)(或多個(gè))較小的模式
  3. 引入“Boyce-Codd范式”(Boyce-Codd Normalisation Format, BCNF),消除上述問(wèn)題
  4. 當(dāng)解釋怎樣通過(guò)分解關(guān)系模式來(lái)確保BCNF條件時(shí)芋哭,把上面的幾點(diǎn)結(jié)合起來(lái)沉衣。

分解關(guān)系(decompose)

一般用分解關(guān)系的方法來(lái)消除異常。關(guān)系R的分解設(shè)計(jì)分離R的屬性减牺,以構(gòu)造兩個(gè)新的關(guān)系模式豌习。

給定一個(gè)關(guān)系R(A_1, A_2, \cdots, A_n),把它分解為S(B_1, B_2, \cdots, B_m)T(C_1, C_2, \cdots, C_k)拔疚,并且滿足:

  1. {A_1, A_2, \cdots, A_n} = {B_1, B_2, \cdots, B_m} \cup {C_1, C_2, \cdots, C_k}
  2. S = \pi_{B_1, B_2, \cdots, B_m}(R)
  3. T = \pi_{C_1, C_2, \cdots, C_k}(R)

這里的\pi_{B_1, B_2, \cdots, B_m}(R)投影(projection)肥隆。投影操作用來(lái)從關(guān)系R生成一個(gè)新關(guān)系,這個(gè)關(guān)系只包含原來(lái)關(guān)系R中的不分裂稚失,而\pi_{B_1, B_2, \cdots, B_m}(R)只包含關(guān)系R屬性B_1, B_2, \cdots, B_m所代表的的列栋艳。

關(guān)系數(shù)據(jù)庫(kù)的規(guī)范化處理

在關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)過(guò)程中,初始的關(guān)系模式通常需要改進(jìn)句各,尤其在消除冗余方面吸占。一般來(lái)說(shuō)晴叨,冗余等問(wèn)題是由于模式試圖將過(guò)多的內(nèi)容合并到一個(gè)關(guān)系中而造成的。我們使用異常(anomaly)來(lái)指代這些問(wèn)題矾屯。

使用函數(shù)依賴(functional dependency)這一概念來(lái)定義關(guān)系模式的規(guī)范形式兼蕊,稱為規(guī)范化(normalisation)。規(guī)范化的影響在于可以將關(guān)系分解(decompose)為兩個(gè)或多個(gè)關(guān)系以消除異常件蚕。多值依賴(multivalued dependency)孙技,直觀的表示了一個(gè)條件:關(guān)系的一個(gè)或多個(gè)屬性獨(dú)立于其他若干個(gè)屬性。這些依賴也可以導(dǎo)致關(guān)系的規(guī)范構(gòu)造和分解骤坐,以消除冗余绪杏。

關(guān)系的第一、二纽绍、三范式

  • 第一范式(1NF):所有符合關(guān)系定義的關(guān)系都稱為規(guī)范關(guān)系蕾久,即第一范式,記為1NF拌夏。表中的每一列都是不可拆分的最小單元僧著,保證每個(gè)屬性的原子性。
    為了與規(guī)范關(guān)系相區(qū)別障簿,有時(shí)也把某些屬性有重復(fù)組或空白值的二維表稱為非規(guī)范關(guān)系盹愚。非規(guī)范關(guān)系可轉(zhuǎn)變?yōu)橐?guī)范關(guān)系。比如把空白值用特殊符號(hào)標(biāo)記站故,也可以在值空白時(shí)將表拆開(kāi)皆怕。
    一個(gè)1NF關(guān)系可能是個(gè)結(jié)構(gòu)不太好的關(guān)系,可能存在如下問(wèn)題:
    • 數(shù)據(jù)冗余大西篓,記錄重復(fù)
    • 修改異常愈腾,由于數(shù)據(jù)冗余大,難免疏漏
    • 插入一場(chǎng)岂津,
    • 刪除異常
  • 第二范式2NF:若關(guān)系R\in 1NF虱黄,且每個(gè)非主屬性均完全函數(shù)依賴于主鍵,則稱關(guān)系R是第二范式的吮成,即R\in2NF橱乱。也就是表中所有列必須依賴于主鍵,不能有任何一列與主鍵沒(méi)有關(guān)系粱甫。2NF存在的問(wèn)題和1NF相似泳叠。
  • 第三范式3NF:若有關(guān)系R\in2NF,且關(guān)系中的每個(gè)非主屬性均不傳遞依賴于主鍵茶宵,則稱關(guān)系R是第三范式的析二,即R\in3NF。也就是屬性于主鍵直接相關(guān)而非間接相關(guān),或表中每一列只依賴于主鍵叶摄。要求一個(gè)表中不包含已包含在其他表中的非主鍵屬性属韧。
    3NF由于消除可能存在的部分函數(shù)依賴和傳遞函數(shù)依賴,因而具有較好的性能蛤吓。但是宵喂,3NF中沒(méi)有限制某些主屬性對(duì)主鍵之間的函數(shù)依賴,故又提出了BCNF范式会傲,作為對(duì)3NF的修正锅棕。

BCNF范式

定義:當(dāng)且僅當(dāng)關(guān)系R中每個(gè)決定因素都是候選鍵時(shí),則稱關(guān)系R是Boyce-Codd范式淌山,即R\in BCNF裸燎。
所謂決定因素,是關(guān)系模式中的一個(gè)屬性或?qū)傩约靡桑渌承傩曰驅(qū)傩约耆瘮?shù)依賴于它德绿。
一個(gè)BCNF關(guān)系必定是3NF的,但是一個(gè)3NF的關(guān)系未必是BCNF的退渗。

重復(fù)選擇使用適當(dāng)?shù)姆纸庖莆龋梢园讶魏我粋€(gè)關(guān)系模式分解為帶有下列重要性質(zhì)的具有多個(gè)屬性的子集:

  1. 以這些子集為模式的關(guān)系都屬于BCNF
  2. 原始關(guān)系中的數(shù)據(jù)都被正確的反映在分解后的關(guān)系上,或会油,原始關(guān)系應(yīng)該能從分解后的幾個(gè)關(guān)系實(shí)例中重構(gòu)个粱。

Reference

1 匙彥斌等主編,計(jì)算機(jī)軟件技術(shù)基礎(chǔ)教程翻翩,天津大學(xué)出版社
2 Jeffery U.等著都许,岳麗華等譯,數(shù)據(jù)庫(kù)系統(tǒng)基礎(chǔ)教程嫂冻,機(jī)械工業(yè)出版社

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末胶征,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子絮吵,更是在濱河造成了極大的恐慌弧烤,老刑警劉巖忱屑,帶你破解...
    沈念sama閱讀 207,248評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蹬敲,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡莺戒,警方通過(guò)查閱死者的電腦和手機(jī)伴嗡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,681評(píng)論 2 381
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)从铲,“玉大人瘪校,你說(shuō)我怎么就攤上這事。” “怎么了阱扬?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,443評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵泣懊,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我麻惶,道長(zhǎng)馍刮,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,475評(píng)論 1 279
  • 正文 為了忘掉前任窃蹋,我火速辦了婚禮卡啰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘警没。我一直安慰自己匈辱,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,458評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布杀迹。 她就那樣靜靜地躺著亡脸,像睡著了一般。 火紅的嫁衣襯著肌膚如雪佛南。 梳的紋絲不亂的頭發(fā)上梗掰,一...
    開(kāi)封第一講書(shū)人閱讀 49,185評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音嗅回,去河邊找鬼及穗。 笑死,一個(gè)胖子當(dāng)著我的面吹牛绵载,可吹牛的內(nèi)容都是我干的埂陆。 我是一名探鬼主播,決...
    沈念sama閱讀 38,451評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼娃豹,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼焚虱!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起懂版,我...
    開(kāi)封第一講書(shū)人閱讀 37,112評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤鹃栽,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后躯畴,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體民鼓,經(jīng)...
    沈念sama閱讀 43,609評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,083評(píng)論 2 325
  • 正文 我和宋清朗相戀三年蓬抄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了丰嘉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,163評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡嚷缭,死狀恐怖饮亏,靈堂內(nèi)的尸體忽然破棺而出耍贾,到底是詐尸還是另有隱情,我是刑警寧澤路幸,帶...
    沈念sama閱讀 33,803評(píng)論 4 323
  • 正文 年R本政府宣布荐开,位于F島的核電站,受9級(jí)特大地震影響简肴,放射性物質(zhì)發(fā)生泄漏誓焦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,357評(píng)論 3 307
  • 文/蒙蒙 一着帽、第九天 我趴在偏房一處隱蔽的房頂上張望杂伟。 院中可真熱鬧,春花似錦仍翰、人聲如沸赫粥。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,357評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)越平。三九已至,卻和暖如春灵迫,著一層夾襖步出監(jiān)牢的瞬間秦叛,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,590評(píng)論 1 261
  • 我被黑心中介騙來(lái)泰國(guó)打工瀑粥, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留挣跋,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,636評(píng)論 2 355
  • 正文 我出身青樓狞换,卻偏偏與公主長(zhǎng)得像避咆,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子修噪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,925評(píng)論 2 344

推薦閱讀更多精彩內(nèi)容