?聚簇索引是一種數(shù)據(jù)存儲(chǔ)方式恋脚,它實(shí)際上是在同一個(gè)結(jié)構(gòu)中保存了B+樹(shù)索引和數(shù)據(jù)行腺办,InnoDB表是按照聚簇索引組織的(類似于Oracle的索引組織表)。
InnoDB通過(guò)主鍵聚簇?cái)?shù)據(jù)慧起,如果沒(méi)有定義主鍵菇晃,會(huì)選擇一個(gè)唯一的非空索引代替,如果沒(méi)有這樣的索引蚓挤,會(huì)隱式定義個(gè)主鍵作為聚簇索引磺送。
對(duì)于非聚簇索引表來(lái)說(shuō)(右圖),表數(shù)據(jù)和索引是分成存儲(chǔ)的灿意,主鍵索引和二級(jí)索引存儲(chǔ)上沒(méi)有任何區(qū)別估灿。
而對(duì)于聚簇索引表來(lái)說(shuō)(左圖),表數(shù)據(jù)是和主鍵一起存儲(chǔ)的缤剧,主鍵索引的葉結(jié)點(diǎn)存儲(chǔ)行數(shù)據(jù)馅袁,二級(jí)索引的葉結(jié)點(diǎn)存儲(chǔ)行的主鍵值。
聚簇索引表最大限度地提高了I/O密集型應(yīng)用的性能荒辕,但它也有以下幾個(gè)限制:
1)插入速度嚴(yán)重依賴于插入順序汗销,按照主鍵的順序插入是最快的方式犹褒,否則將會(huì)出現(xiàn)頁(yè)分裂,嚴(yán)重影響性能弛针。因此叠骑,對(duì)于InnoDB表,我們一般都會(huì)定義一個(gè)自增的ID列為主鍵削茁。
2)更新主鍵的代價(jià)很高宙枷,因?yàn)閷?huì)導(dǎo)致被更新的行移動(dòng)。因此茧跋,對(duì)于InnoDB表慰丛,我們一般定義主鍵為不可更新。
3)二級(jí)索引訪問(wèn)需要兩次索引查找瘾杭,第一次找到主鍵值诅病,第二次根據(jù)主鍵值找到行數(shù)據(jù)。
二級(jí)索引的葉節(jié)點(diǎn)存儲(chǔ)的是主鍵值富寿,而不是行指針(非聚簇索引存儲(chǔ)的是指針或者說(shuō)是地址)睬隶,這是為了減少當(dāng)出現(xiàn)行移動(dòng)或數(shù)據(jù)頁(yè)分裂時(shí)二級(jí)索引的維護(hù)工作,但會(huì)讓二級(jí)索引占用更多的空間页徐。
聚簇索引的葉節(jié)點(diǎn)就是數(shù)據(jù)節(jié)點(diǎn),而非聚簇索引的頁(yè)節(jié)點(diǎn)仍然是索引檢點(diǎn)银萍,并保留一個(gè)鏈接指向?qū)?yīng)數(shù)據(jù)塊变勇。
聚簇索引主鍵的插入速度要比非聚簇索引主鍵的插入速度慢很多。
相比之下贴唇,聚簇索引適合排序搀绣,非聚簇索引不適合用在排序的場(chǎng)合。因?yàn)榫鄞厮饕旧硪呀?jīng)是按照物理順序放置的戳气,排序很快链患。非聚簇索引則沒(méi)有按序存放,需要額外消耗資源來(lái)排序瓶您。
當(dāng)你需要取出一定范圍內(nèi)的數(shù)據(jù)時(shí)麻捻,用聚簇索引也比用非聚簇索引好。