數(shù)據(jù)庫索引,是數(shù)據(jù)庫管理系統(tǒng)中一個排序的數(shù)據(jù)結(jié)構(gòu),以協(xié)助快速查詢剪勿、更新數(shù)據(jù)庫表中數(shù)據(jù)。索引的實現(xiàn)通常使用B樹及其變種B+樹方庭。
在數(shù)據(jù)之外厕吉,數(shù)據(jù)庫系統(tǒng)還維護著滿足特定查找算法的數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)以某種方式引用(指向)數(shù)據(jù)械念,這樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實現(xiàn)高級查找算法头朱。這種數(shù)據(jù)結(jié)構(gòu),就是索引龄减。
為表設(shè)置索引要付出代價的:一是增加了數(shù)據(jù)庫的存儲空間项钮,二是在插入和修改數(shù)據(jù)時要花費較多的時間(因為索引也要隨之變動)。
圖展示了一種可能的索引方式。左邊是數(shù)據(jù)表烁巫,一共有兩列七條記錄署隘,最左邊的是數(shù)據(jù)記錄的物理地址(注意邏輯上相鄰的記錄在磁盤上也并不是一定物理相鄰的)。為了加快Col2的查找亚隙,可以維護一個右邊所示的二叉查找樹磁餐,每個節(jié)點分別包含索引鍵值和一個指向?qū)?yīng)數(shù)據(jù)記錄物理地址的指針,這樣就可以運用二叉查找在O(log2n)的復(fù)雜度內(nèi)獲取到相應(yīng)數(shù)據(jù)阿弃。
創(chuàng)建索引可以大大提高系統(tǒng)的性能诊霹。
一,通過創(chuàng)建唯一性索引渣淳,可以保證數(shù)據(jù)庫表中每一行數(shù)據(jù)的唯一性脾还。二,可以大大加快數(shù)據(jù)的檢索速度入愧,這也是創(chuàng)建索引的最主要的原因鄙漏。三,可以加速表和表之間的連接砂客,特別是在實現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義泥张。四,在使用分組和排序子句進行數(shù)據(jù)檢索時鞠值,同樣可以顯著減少查詢中分組和排序的時間媚创。五,通過使用索引彤恶,可以在查詢的過程中钞钙,使用優(yōu)化隱藏器,提高系統(tǒng)的性能声离。
增加索引有如此多的優(yōu)點芒炼,為什么不對表中的每一個列創(chuàng)建一個索引呢?因為术徊,增加索引也有許多不利的方面本刽。
一,創(chuàng)建索引和維護索引要耗費時間赠涮,這種時間隨著數(shù)據(jù)量的增加而增加子寓。二,索引需要占物理空間笋除,除了數(shù)據(jù)表占數(shù)據(jù)空間之外斜友,每一個索引還要占一定的物理空間,如果要建立聚簇索引垃它,那么需要的空間就會更大鲜屏。三烹看,當(dāng)對表中的數(shù)據(jù)進行增加、刪除和修改的時候洛史,索引也要動態(tài)的維護惯殊,這樣就降低了數(shù)據(jù)的維護速度。
索引是建立在數(shù)據(jù)庫表中的某些列的上面也殖。在創(chuàng)建索引的時候靠胜,應(yīng)該考慮在哪些列上可以創(chuàng)建索引,在哪些列上不能創(chuàng)建索引毕源。
一般來說,應(yīng)該在這些列上創(chuàng)建索引:
一陕习、在經(jīng)常需要搜索的列上霎褐,可以加快搜索的速度;二该镣、在作為主鍵的列上冻璃,強制該列的唯一性和組織表中數(shù)據(jù)的排列結(jié)構(gòu);三损合、在經(jīng)常用在連接的列上省艳,這些列主要是一些外鍵,可以加快連接的速度嫁审;四跋炕、在經(jīng)常需要根據(jù)范圍進行搜索的列上創(chuàng)建索引,因為索引已經(jīng)排序律适,其指定的范圍是連續(xù)的辐烂;五、在經(jīng)常需要排序的列上創(chuàng)建索引捂贿,因為索引已經(jīng)排序纠修,這樣查詢可以利用索引的排序,加快排序查詢時間厂僧;六扣草、在經(jīng)常使用在WHERE子句中的列上面創(chuàng)建索引,加快條件的判斷速度颜屠。
同樣辰妙,對于有些列不應(yīng)該創(chuàng)建索引。一般來說汽纤,不應(yīng)該創(chuàng)建索引的的這些列具有下列特點:
一上岗,對于那些在查詢中很少使用或者參考的列不應(yīng)該創(chuàng)建索引。這是因為蕴坪,既然這些列很少使用到肴掷,因此有索引或者無索引敬锐,并不能提高查詢速度。相反呆瞻,由于增加了索引台夺,反而降低了系統(tǒng)的維護速度和增大了空間需求。二痴脾,對于那些只有很少數(shù)據(jù)值的列也不應(yīng)該增加索引颤介。這是因為,由于這些列的取值很少赞赖,例如人事表的性別列滚朵,在查詢的結(jié)果中,結(jié)果集的數(shù)據(jù)行占了表中數(shù)據(jù)行的很大比例前域,即需要在表中搜索的數(shù)據(jù)行的比例很大辕近。增加索引匿垄,并不能明顯加快檢索速度移宅。三,對于那些定義為text, image和bit數(shù)據(jù)類型的列不應(yīng)該增加索引椿疗。這是因為漏峰,這些列的數(shù)據(jù)量要么相當(dāng)大,要么取值很少届榄。四浅乔,當(dāng)修改性能遠遠大于檢索性能時,不應(yīng)該創(chuàng)建索引痒蓬。這是因為童擎,修改性能和檢索性能是互相矛盾的。當(dāng)增加索引時攻晒,會提高檢索性能儒拂,但是會降低修改性能霍转。當(dāng)減少索引時指黎,會提高修改性能硼端,降低檢索性能。因此给梅,當(dāng)修改性能遠遠大于檢索性能時假丧,不應(yīng)該創(chuàng)建索引。
根據(jù)數(shù)據(jù)庫的功能动羽,可以在數(shù)據(jù)庫設(shè)計器中創(chuàng)建三種索引:唯一索引包帚、主鍵索引和聚集索引。
唯一索引
唯一索引是不允許其中任何兩行具有相同索引值的索引运吓。當(dāng)現(xiàn)有數(shù)據(jù)中存在重復(fù)的鍵值時渴邦,大多數(shù)數(shù)據(jù)庫不允許將新創(chuàng)建的唯一索引與表一起保存疯趟。數(shù)據(jù)庫還可能防止添加將在表中創(chuàng)建重復(fù)鍵值的新數(shù)據(jù)。例如谋梭,如果在employee表中職員的姓(lname)上創(chuàng)建了唯一索引信峻,則任何兩個員工都不能同姓。
主鍵索引
數(shù)據(jù)庫表經(jīng)常有一列或列組合瓮床,其值唯一標(biāo)識表中的每一行盹舞。該列稱為表的主鍵。 在數(shù)據(jù)庫關(guān)系圖中為表定義主鍵將自動創(chuàng)建主鍵索引隘庄,主鍵索引是唯一索引的特定類型踢步。該索引要求主鍵中的每個值都唯一。當(dāng)在查詢中使用主鍵索引時丑掺,它還允許對數(shù)據(jù)的快速訪問贾虽。
聚集索引
在聚集索引中,表中行的物理順序與鍵值的邏輯(索引)順序相同吼鱼。一個表只能包含一個聚集索引。如果某索引不是聚集索引绰咽,則表中行的物理順序與鍵值的邏輯順序不匹配菇肃。與非聚集索引相比,聚集索引通常提供更快的數(shù)據(jù)訪問速度取募。