在 MySQL 中券腔,主要有四種類型的索引阱驾,分別為: B-Tree 索引, Hash 索引且叁, Fulltext 索引和 R-Tree 索引都哭。我們主要分析B-Tree 索引。
B-Tree 索引是 MySQL 數(shù)據(jù)庫中使用最為頻繁的索引類型逞带,除了 Archive 存儲引擎之外的其他所有的存儲引擎都支持 B-Tree 索引。Archive 引擎直到 MySQL 5.1 才支持索引纱新,而且只支持索引單個 AUTO_INCREMENT 列展氓。
不僅僅在 MySQL 中是如此,實際上在其他的很多數(shù)據(jù)庫管理系統(tǒng)中B-Tree 索引也同樣是作為最主要的索引類型脸爱,這主要是因為 B-Tree 索引的存儲結(jié)構(gòu)在數(shù)據(jù)庫的數(shù)據(jù)檢索中有非常優(yōu)異的表現(xiàn)遇汞。
一般來說, MySQL 中的 B-Tree 索引的物理文件大多都是以 Balance Tree 的結(jié)構(gòu)來存儲的,也就是所有實際需要的數(shù)據(jù)都存放于 Tree 的 Leaf Node(葉子節(jié)點) 空入,而且到任何一個 Leaf Node 的最短路徑的長度都是完全相同的络它,所以我們大家都稱之為 B-Tree 索引。當(dāng)然歪赢,可能各種數(shù)據(jù)庫(或 MySQL 的各種存儲引擎)在存放自己的 B-Tree 索引的時候會對存儲結(jié)構(gòu)稍作改造化戳。如 Innodb 存儲引擎的 B-Tree 索引實際使用的存儲結(jié)構(gòu)實際上是 B+Tree,也就是在 B-Tree 數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上做了很小的改造埋凯,在每一個Leaf Node 上面出了存放索引鍵的相關(guān)信息之外点楼,還存儲了指向與該 Leaf Node 相鄰的后一個 LeafNode 的指針信息(增加了順序訪問指針),這主要是為了加快檢索多個相鄰 Leaf Node 的效率考慮白对。
下面主要討論MyISAM和InnoDB兩個存儲引擎的索引實現(xiàn)方式:
- MyISAM索引實現(xiàn):MyISAM索引文件和數(shù)據(jù)文件是分離的掠廓,索引文件僅保存數(shù)據(jù)記錄的地址。
1)主鍵索引:
MyISAM引擎使用B+Tree作為索引結(jié)構(gòu)甩恼,葉節(jié)點的data域存放的是數(shù)據(jù)記錄的地址蟀瞧。下圖是MyISAM主鍵索引的原理圖:
這里設(shè)表一共有三列,假設(shè)我們以Col1為主鍵条摸,圖myisam1是一個MyISAM表的主索引(Primary key)示意黄橘。可以看出MyISAM的索引文件僅僅保存數(shù)據(jù)記錄的地址屈溉。
2)輔助索引(Secondary key)
在MyISAM中塞关,主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別,只是主索引要求key是唯一的子巾,而輔助索引的key可以重復(fù)帆赢。如果我們在Col2上建立一個輔助索引,則此索引的結(jié)構(gòu)如下圖所示:
同樣也是一顆B+Tree线梗,data域保存數(shù)據(jù)記錄的地址椰于。因此,MyISAM中索引檢索的算法為首先按照B+Tree搜索算法搜索索引仪搔,如果指定的Key存在瘾婿,則取出其data域的值,然后以data域的值為地址烤咧,讀取相應(yīng)數(shù)據(jù)記錄偏陪。
MyISAM的索引方式也叫做“非聚集”的,之所以這么稱呼是為了與InnoDB的聚集索引區(qū)分煮嫌。 - InnoDB索引實現(xiàn)
然InnoDB也使用B+Tree作為索引結(jié)構(gòu)笛谦,但具體實現(xiàn)方式卻與MyISAM截然不同.
1)主鍵索引:
MyISAM索引文件和數(shù)據(jù)文件是分離的,索引文件僅保存數(shù)據(jù)記錄的地址昌阿。而在InnoDB中饥脑,表數(shù)據(jù)文件本身就是按B+Tree組織的一個索引結(jié)構(gòu)恳邀,這棵樹的葉節(jié)點data域保存了完整的數(shù)據(jù)記錄。這個索引的key是數(shù)據(jù)表的主鍵灶轰,因此InnoDB表數(shù)據(jù)文件本身就是主索引谣沸。
(圖inndb主鍵索引)是InnoDB主索引(同時也是數(shù)據(jù)文件)的示意圖,可以看到葉節(jié)點包含了完整的數(shù)據(jù)記錄笋颤。這種索引叫做聚集索引乳附。因為InnoDB的數(shù)據(jù)文件本身要按主鍵聚集,所以InnoDB要求表必須有主鍵(MyISAM可以沒有)椰弊,如果沒有顯式指定许溅,則MySQL系統(tǒng)會自動選擇一個可以唯一標(biāo)識數(shù)據(jù)記錄的列作為主鍵,如果不存在這種列秉版,則MySQL自動為InnoDB表生成一個隱含字段作為主鍵贤重,這個字段長度為6個字節(jié),類型為長整形清焕。
2). InnoDB的輔助索引
InnoDB的所有輔助索引都引用主鍵作為data域并蝗。例如,下圖為定義在Col3上的一個輔助索引:
InnoDB 表是基于聚簇索引建立的秸妥。因此InnoDB 的索引能提供一種非彻鐾#快速的主鍵查找性能。不過粥惧,它的輔助索引(Secondary Index键畴, 也就是非主鍵索引)也會包含主鍵列,所以突雪,如果主鍵定義的比較大起惕,其他索引也將很大。如果想在表上定義 咏删、很多索引惹想,則爭取盡量把主鍵定義得小一些。InnoDB 不會壓縮索引督函。
文字符的ASCII碼作為比較準(zhǔn)則嘀粱。聚集索引這種實現(xiàn)方式使得按主鍵的搜索十分高效,但是輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵辰狡,然后用主鍵到主索引中檢索獲得記錄锋叨。
不同存儲引擎的索引實現(xiàn)方式對于正確使用和優(yōu)化索引都非常有幫助,例如知道了InnoDB的索引實現(xiàn)后搓译,就很容易明白
1為什么不建議使用過長的字段作為主鍵悲柱,因為所有輔助索引都引用主索引,過長的主索引會令輔助索引變得過大些己;
2用非單調(diào)的字段作為主鍵在InnoDB中不是個好主意豌鸡,因為InnoDB數(shù)據(jù)文件本身是一顆B+Tree,非單調(diào)的主鍵會造成在插入新記錄時數(shù)據(jù)文件為了維持B+Tree的特性而頻繁的分裂調(diào)整段标,十分低效涯冠,而使用自增字段作為主鍵則是一個很好的選擇。
InnoDB索引和MyISAM索引的區(qū)別:
一是主索引的區(qū)別逼庞,InnoDB的數(shù)據(jù)文件本身就是索引文件蛇更。而MyISAM的索引和數(shù)據(jù)是分開的。
二是輔助索引的區(qū)別:InnoDB的輔助索引data域存儲相應(yīng)記錄主鍵的值而不是地址赛糟。而MyISAM的輔助索引和主索引沒有多大區(qū)別派任。