索引(Index)是幫助MySQL高效獲取數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。
MyISAM索引實(shí)現(xiàn)
MyISAM引擎使用B+Tree作為索引結(jié)構(gòu),葉節(jié)點(diǎn)的data域存放的是數(shù)據(jù)記錄的地址。下圖是MyISAM索引的原理圖:
這里設(shè)表一共有三列,假設(shè)我們以Col1為主鍵丧叽,則圖8是一個(gè)MyISAM表的主索引(Primary key)示意」悖可以看出MyISAM的索引文件僅僅保存數(shù)據(jù)記錄的地址踊淳。在MyISAM中,主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別陕靠,只是主索引要求key是唯一的迂尝,而輔助索引的key可以重復(fù)。如果我們?cè)贑ol2上建立一個(gè)輔助索引剪芥,則此索引的結(jié)構(gòu)如下圖所示:
同樣也是一顆B+Tree垄开,data域保存數(shù)據(jù)記錄的地址。因此税肪,MyISAM中索引檢索的算法為首先按照B+Tree搜索算法搜索索引溉躲,如果指定的Key存在,則取出其data域的值益兄,然后以data域的值為地址锻梳,讀取相應(yīng)數(shù)據(jù)記錄。
MyISAM的索引方式也叫做“非聚集”的净捅,之所以這么稱呼是為了與InnoDB的聚集索引區(qū)分疑枯。
InnoDB 索引實(shí)現(xiàn)
InnoDB的數(shù)據(jù)文件本身就是索引文件。
MyISAM索引文件和數(shù)據(jù)文件是分離的蛔六,索引文件僅保存數(shù)據(jù)記錄的地址荆永。而在InnoDB中,表數(shù)據(jù)文件本身就是按B+Tree組織的一個(gè)索引結(jié)構(gòu)国章,這棵樹的葉節(jié)點(diǎn)data域保存了完整的數(shù)據(jù)記錄具钥。這個(gè)索引的key是數(shù)據(jù)表的主鍵,因此InnoDB表數(shù)據(jù)文件本身就是主索引液兽。
圖10是InnoDB主索引(同時(shí)也是數(shù)據(jù)文件)的示意圖骂删,可以看到葉節(jié)點(diǎn)包含了完整的數(shù)據(jù)記錄。這種索引叫做聚集索引抵碟。因?yàn)镮nnoDB的數(shù)據(jù)文件本身要按主鍵聚集,所以InnoDB要求表必須有主鍵(MyISAM可以沒有)坏匪,如果沒有顯式指定拟逮,則MySQL系統(tǒng)會(huì)自動(dòng)選擇一個(gè)可以唯一標(biāo)識(shí)數(shù)據(jù)記錄的列作為主鍵,如果不存在這種列适滓,則MySQL自動(dòng)為InnoDB表生成一個(gè)隱含字段作為主鍵敦迄,這個(gè)字段長(zhǎng)度為6個(gè)字節(jié),類型為長(zhǎng)整形。
第二個(gè)與MyISAM索引的不同是InnoDB的輔助索引data域存儲(chǔ)相應(yīng)記錄主鍵的值而不是地址罚屋。換句話說(shuō)苦囱,InnoDB的所有輔助索引都引用主鍵作為data域。例如脾猛,圖11為定義在Col3上的一個(gè)輔助索引:
聚集索引這種實(shí)現(xiàn)方式使得按主鍵的搜索十分高效撕彤,但是輔助索引搜索需要檢索兩遍索引:首先檢索輔助索引獲得主鍵,然后用主鍵到主索引中檢索獲得記錄猛拴。
了解不同存儲(chǔ)引擎的索引實(shí)現(xiàn)方式對(duì)于正確使用和優(yōu)化索引都非常有幫助羹铅,例如知道了InnoDB的索引實(shí)現(xiàn)后,就很容易明白為什么不建議使用過長(zhǎng)的字段作為主鍵愉昆,因?yàn)樗休o助索引都引用主索引职员,過長(zhǎng)的主索引會(huì)令輔助索引變得過大。再例如跛溉,用非單調(diào)的字段作為主鍵在InnoDB中不是個(gè)好主意焊切,因?yàn)镮nnoDB數(shù)據(jù)文件本身是一顆B+Tree,非單調(diào)的主鍵會(huì)造成在插入新記錄時(shí)數(shù)據(jù)文件為了維持B+Tree的特性而頻繁的分裂調(diào)整芳室,十分低效专肪,而使用自增字段作為主鍵則是一個(gè)很好的選擇。
最左前綴原理與相關(guān)優(yōu)化
titles表的主索引為<emp_no, title, from_date>渤愁,還有一個(gè)輔助索引<emp_no>牵祟。為了避免多個(gè)索引使事情變復(fù)雜(MySQL的SQL優(yōu)化器在多索引時(shí)行為比較復(fù)雜),這里我們將輔助索引drop掉:
SHOW INDEX FROM employees.titles;
+--------+------------+----------+--------------+-------------+-----------+-------------+------+------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Null | Index_type |
+--------+------------+----------+--------------+-------------+-----------+-------------+------+------------+
| titles | 0 | PRIMARY | 1 | emp_no | A | NULL | | BTREE |
| titles | 0 | PRIMARY | 2 | title | A | NULL | | BTREE |
| titles | 0 | PRIMARY | 3 | from_date | A | 443308 | | BTREE |
| titles | 1 | emp_no | 1 | emp_no | A | 443308 | | BTREE |
+--------+------------+----------+--------------+-------------+-----------+-------------+------+------------+
ALTER TABLE employees.titles DROP INDEX emp_no;
理論上索引對(duì)順序是敏感的抖格,但是由于MySQL的查詢優(yōu)化器會(huì)自動(dòng)調(diào)整where子句的條件順序以使用適合的索引
EXPLAIN SELECT * FROM employees.titles WHERE emp_no='10001' AND title='Senior Engineer' AND from_date='1986-06-26';
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+
| 1 | SIMPLE | titles | const | PRIMARY | PRIMARY | 59 | const,const,const | 1 | |
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+
EXPLAIN SELECT * FROM employees.titles WHERE from_date='1986-06-26' AND emp_no='10001' AND title='Senior Engineer';
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+
| 1 | SIMPLE | titles | const | PRIMARY | PRIMARY | 59 | const,const,const | 1 | |
+----+-------------+--------+-------+---------------+---------+---------+-------------------+------+-------+