聚集索引和二級索引
每個InnoDB表都有一個特殊的索引叫做聚集索引(clustered index)勾栗,這個索引上存放了所有表中的行反症。通常,聚集索引是主鍵的同義詞。
- 若在表上定義了主鍵簿透,那么就會把這個主鍵作為聚集索引。最好給每張表都定義一個主鍵解藻。如果沒有邏輯上唯一非空的一列或多列老充,就給表加一個自增的列作為主鍵。
- 若沒有定義主鍵螟左,mysql會使用第一個沒有Null值的唯一索引作為聚集索引
- 若沒有主鍵或合適的唯一索引啡浊,InnoDB會內(nèi)部生成一個叫做gen_clust_index的隱藏聚集索引,這個索引包含所有列和一個行ID胶背。行是按照行ID的順序排列的巷嚣。行ID是一個6字節(jié)的區(qū)域,新行寫入是單調(diào)遞增钳吟。因此廷粒,行的排列順序是按照物理寫入的順序。
聚集索引如何加速查詢
通過聚集索引訪問一行是很快的红且,因為掃描索引可以直接定位一整行的數(shù)據(jù)评雌。如果表很大,相較于那種將行數(shù)據(jù)分散在不同索引記錄頁的存儲結(jié)構(gòu)直焙,聚集索引的這種結(jié)構(gòu)更加節(jié)約磁盤IO操作。
二級索引和聚集索引之間的關(guān)系
所有非聚集索引都是二級索引砂轻。在InnoDB中奔誓,每個二級索引中的記錄都含有對應(yīng)的主鍵列值,也就是這個二級索引中的唯一標(biāo)志搔涝。InnoDB就是通過主鍵列值來搜索聚集索引中的行厨喂。
如果主鍵很長,那二級索引自然就會占用更多的空間庄呈,所以最好使用較短的主鍵蜕煌。
索引的物理結(jié)構(gòu)
除了空間索引之外,InnoDB索引都使用B-tree數(shù)據(jù)結(jié)構(gòu)诬留⌒奔停空間索引使用R-trees,這是一種專門用于多維數(shù)據(jù)的特殊的索引結(jié)構(gòu)文兑。索引記錄存放在B-tree或R-tree結(jié)構(gòu)的葉子頁上盒刚。索引頁的默認(rèn)大小為16k。
當(dāng)新紀(jì)錄寫入聚集索引時绿贞,每個頁會預(yù)留1/16的空間來用于將來可能出現(xiàn)的insert或update因块。如果索引記錄是順序?qū)懭耄ㄉ蚧蚪敌颍饕摽梢员惶畛渲链蠹s15/16籍铁。若記錄是以隨機(jī)的順序?qū)懭胛猩希饕摰娘枬M程度約為1/2至15/16區(qū)間趾断。
當(dāng)創(chuàng)建或重建B-tree索引時,InnoDB使用的是批量加載的方式吩愧。這種索引創(chuàng)建方式叫做排序索引創(chuàng)建(sorted index build)芋酌。InnoDB_fill_factor變量規(guī)定了每個B-tree索引頁在被批量加載時填充的飽滿程度百分比(在15/16的基礎(chǔ)上)。innodb_fill_factor默認(rèn)值為100耻警,表示預(yù)留1/16用于索引頁后續(xù)增長隔嫡。另外,R-tree空間索引不支持排序索引創(chuàng)建甘穿。
排序序索引創(chuàng)建
創(chuàng)建索引分三個階段腮恩,第一階段會掃描聚集索引,然后生成索引條目并加入排序緩存温兼。當(dāng)排序緩存占滿時秸滴,會使用外部臨時文件。第二階段將第一階段生成的多個排序結(jié)果進(jìn)行合并排序募判。第三階段將最終排序結(jié)果寫入B-tree荡含。
如果一個InnoDB索引頁的填充比降低至低于MERGE_THRESHOLD(默認(rèn)為最大值50,最小為1)届垫,InnoDB會嘗試將索引頁(相鄰的)合并以釋放空間释液。
也可以設(shè)定表級別MERGE_THRESHOLD(對該表上所有索引生效):
ALTER TABLE t1 COMMENT='MERGE_THRESHOLD=40';
甚至是索引級別MERGE_THRESHOLD:
ALTER TABLE t1 ADD KEY id_index (id) COMMENT 'MERGE_THRESHOLD=40';
但對于自動生成的聚集索引GEN_CLUST_INDEX,只能使用表級別的或?qū)嵗墑e的MERGE_THRESHOLD
innodb_page_size配置選項用于為Mysql實例中的所有InnoDB表空間定義頁面大凶按Α(page size)误债。這個選項只能在初始化實例時配置。頁面大小支持64KB妄迁,32KB寝蹈,16KB,8KB和4KB登淘,其中32KB和64KB是5.7中新加入的支持箫老,16KB為默認(rèn)大小。