1.前言:
索引對查詢的速度有著至關(guān)重要的影響蛉腌,理解索引也是進(jìn)行數(shù)據(jù)庫性能調(diào)優(yōu)的起點(diǎn)亡呵。
索引是存儲引擎用于快速查找記錄的一種數(shù)據(jù)結(jié)構(gòu)晾浴,通過合理的使用數(shù)據(jù)庫索引可以大大提高系統(tǒng)的訪問性能星岗,接下來主要介紹在MySql數(shù)據(jù)庫中索引類型,以及如何創(chuàng)建出更加合理且高效的索引技巧首有。
注:這里主要針對的是InnoDB存儲引擎的B+Tree索引數(shù)據(jù)結(jié)構(gòu)
2燕垃、索引的優(yōu)點(diǎn)
1、大大減輕了服務(wù)器需要掃描的數(shù)據(jù)量井联,從而提高了數(shù)據(jù)的檢索速度
2卜壕、幫助服務(wù)器避免排序和臨時表
3、可以將隨機(jī)I/O變?yōu)轫樞騃/O
3烙常、索引的創(chuàng)建
3.1轴捎、主鍵索引
ALTER TABLE 'table_name' ADD PRIMARY KEY 'index_name' ('column');
3.2、唯一索引
ALTER TABLE 'table_name' ADD UNIQUE 'index_name' ('column');
3.3蚕脏、普通索引
ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column');
3.4侦副、全文索引
ALTER TABLE 'table_name' ADD FULLTEXT 'index_name' ('column');
3.5、組合索引
ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column1', 'column2', ...);
4驼鞭、B+Tree的索引規(guī)則
創(chuàng)建一個測試的用戶表
DROP TABLE IF EXISTS user_test;
CREATE TABLE user_test(
id int AUTO_INCREMENT PRIMARY KEY,
user_name varchar(30) NOT NULL,
sex bit(1) NOT NULL DEFAULT b'1',
city varchar(50) NOT NULL,
age int NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
創(chuàng)建一個組合索引: ALTER TABLE user_test ADD INDEX idx_user(user_name , city , age);
4.1秦驯、索引有效的查詢
4.1.1、全值匹配
全值匹配指的是和索引中的所有列進(jìn)行匹配挣棕,如:以上面創(chuàng)建的索引為例译隘,在where條件后可同時查詢(user_name,city洛心,age)為條件的數(shù)據(jù)固耘。
注:與where后查詢條件的順序無關(guān),這里是很多同學(xué)容易誤解的一個地方
SELECT * FROM user_test WHERE user_name = 'feinik' AND age = 26 AND city = '廣州';
4.1.2词身、匹配最左前綴
匹配最左前綴是指優(yōu)先匹配最左索引列厅目,如:上面創(chuàng)建的索引可用于查詢條件為:(user_name )、(user_name, city)、(user_name , city , age)
注:滿足最左前綴查詢條件的順序與索引列的順序無關(guān)损敷,如:(city, user_name)户辫、(age, city, user_name)
4.1.3、匹配列前綴
指匹配列值的開頭部分嗤锉,如:查詢用戶名以feinik開頭的所有用戶
SELECT * FROM user_test WHERE user_name LIKE 'feinik%';
4.1.4、匹配范圍值
如:查詢用戶名以feinik開頭的所有用戶墓塌,這里使用了索引的第一列
SELECT * FROM user_test WHERE user_name LIKE 'feinik%';
4.2瘟忱、索引的限制
1、where查詢條件中不包含索引列中的最左索引列苫幢,則無法使用到索引查詢访诱,如:
SELECT * FROM user_test WHERE city = '廣州';
或
SELECT * FROM user_test WHERE age= 26;
或
SELECT * FROM user_test WHERE city = '廣州' AND age = '26';
2、即使where的查詢條件是最左索引列韩肝,也無法使用索引查詢用戶名以feinik結(jié)尾的用戶
SELECT * FROM user_test WHERE user_name like '%feinik';
3触菜、如果where查詢條件中有某個列的范圍查詢,則其右邊的所有列都無法使用索引優(yōu)化查詢哀峻,如:
SELECT * FROM user_test WHERE user_name = 'feinik' AND city LIKE '廣州%' AND age = 26;
5涡相、高效的索引策略
5.1、索引列不能是表達(dá)式的一部分剩蟀,也不能作為函數(shù)的參數(shù)催蝗,否則無法使用索引查詢。
SELECT * FROM user_test WHERE user_name = concat(user_name, 'fei');
5.2育特、前綴索引
有時候需要索引很長的字符列丙号,這會增加索引的存儲空間以及降低索引的效率,一種策略是可以使用哈希索引缰冤,還有一種就是可以使用前綴索引犬缨,前綴索引是選擇字符列的前n個字符作為索引,這樣可以大大節(jié)約索引空間棉浸,從而提高索引效率怀薛。
5.2.1、前綴索引的選擇性
前綴索引要選擇足夠長的前綴以保證高的選擇性涮拗,同時又不能太長乾戏,我們可以通過以下方式來計算出合適的前綴索引的選擇長度值:
(1)
SELECT COUNT(DISTINCT index_column)/COUNT(*) FROM table_name; -- index_column代表要添加前綴索引的列
注:通過以上方式來計算出前綴索引的選擇性比值,比值越高說明索引的效率也就越高效三热。
(2)
SELECT
COUNT(DISTINCT LEFT(index_column,1))/COUNT(*),
COUNT(DISTINCT LEFT(index_column,2))/COUNT(*),
COUNT(DISTINCT LEFT(index_column,3))/COUNT(*)
...
FROM table_name;
注:通過以上語句逐步找到最接近于(1)中的前綴索引的選擇性比值鼓择,那么就可以使用對應(yīng)的字符截取長度來做前綴索引了
5.2.2、前綴索引的創(chuàng)建
ALTER TABLE table_name ADD INDEX index_name (index_column(length));
5.2.3就漾、使用前綴索引的注意點(diǎn)
前綴索引是一種能使索引更小呐能,更快的有效辦法,但是MySql無法使用前綴索引做ORDER BY 和 GROUP BY以及使用前綴索引做覆蓋掃描。
5.3摆出、選擇合適的索引列順序
在組合索引的創(chuàng)建中索引列的順序非常重要朗徊,正確的索引順序依賴于使用該索引的查詢方式,對于組合索引的索引順序可以通過經(jīng)驗法則來幫助我們完成:將選擇性最高的列放到索引最前列偎漫,該法則與前綴索引的選擇性方法一致爷恳,但并不是說所有的組合索引的順序都使用該法則就能確定,還需要根據(jù)具體的查詢場景來確定具體的索引順序象踊。
5.4 聚集索引與非聚集索引
1温亲、聚集索引
聚集索引決定數(shù)據(jù)在物理磁盤上的物理排序,一個表只能有一個聚集索引杯矩,如果定義了主鍵栈虚,那么InnoDB會通過主鍵來聚集數(shù)據(jù),如果沒有定義主鍵史隆,InnoDB會選擇一個唯一的非空索引代替魂务,如果沒有唯一的非空索引,InnoDB會隱式定義一個主鍵來作為聚集索引泌射。
聚集索引可以很大程度的提高訪問速度粘姜,因為聚集索引將索引和行數(shù)據(jù)保存在了同一個B-Tree中,所以找到了索引也就相應(yīng)的找到了對應(yīng)的行數(shù)據(jù)熔酷,但在使用聚集索引的時候需注意避免隨機(jī)的聚集索引(一般指主鍵值不連續(xù)相艇,且分布范圍不均勻),如使用UUID來作為聚集索引性能會很差纯陨,因為UUID值的不連續(xù)會導(dǎo)致增加很多的索引碎片和隨機(jī)I/O坛芽,最終導(dǎo)致查詢的性能急劇下降。
2翼抠、非聚集索引
與聚集索引不同的是非聚集索引并不決定數(shù)據(jù)在磁盤上的物理排序咙轩,且在B-Tree中包含索引但不包含行數(shù)據(jù),行數(shù)據(jù)只是通過保存在B-Tree中的索引對應(yīng)的指針來指向行數(shù)據(jù)阴颖,如:上面在(user_name活喊,city, age)上建立的索引就是非聚集索引。
5.5量愧、覆蓋索引
如果一個索引(如:組合索引)中包含所有要查詢的字段的值钾菊,那么就稱之為覆蓋索引,如:
SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' AND age > 25;
因為要查詢的字段(user_name, city, age)都包含在組合索引的索引列中偎肃,所以就使用了覆蓋索引查詢煞烫,查看是否使用了覆蓋索引可以通過執(zhí)行計劃中的Extra中的值為Using index則證明使用了覆蓋索引,覆蓋索引可以極大的提高訪問性能累颂。
5.6滞详、如何使用索引來排序
在排序操作中如果能使用到索引來排序凛俱,那么可以極大的提高排序的速度,要使用索引來排序需要滿足以下兩點(diǎn)即可料饥。
1蒲犬、ORDER BY子句后的列順序要與組合索引的列順序一致,且所有排序列的排序方向(正序/倒序)需一致
2岸啡、所查詢的字段值需要包含在索引列中原叮,及滿足覆蓋索引
通過例子來具體分析
在user_test表上創(chuàng)建一個組合索引
ALTER TABLE user_test ADD INDEX index_user(user_name , city , age);
可以使用到索引排序的案例
1、SELECT user_name, city, age FROM user_test ORDER BY user_name;
2巡蘸、SELECT user_name, city, age FROM user_test ORDER BY user_name, city;
3篇裁、SELECT user_name, city, age FROM user_test ORDER BY user_name DESC, city DESC;
4、SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' ORDER BY city;
注:第4點(diǎn)比較特殊一點(diǎn)赡若,如果where查詢條件為索引列的第一列,且為常量條件团甲,那么也可以使用到索引
無法使用索引排序的案例
1逾冬、sex不在索引列中
SELECT user_name, city, age FROM user_test ORDER BY user_name, sex;
2、排序列的方向不一致
SELECT user_name, city, age FROM user_test ORDER BY user_name ASC, city DESC;
3躺苦、所要查詢的字段列sex沒有包含在索引列中
SELECT user_name, city, age, sex FROM user_test ORDER BY user_name;
4身腻、where查詢條件后的user_name為范圍查詢,所以無法使用到索引的其他列
SELECT user_name, city, age FROM user_test WHERE user_name LIKE 'feinik%' ORDER BY city;
5匹厘、多表連接查詢時嘀趟,只有當(dāng)ORDER BY后的排序字段都是第一個表中的索引列(需要滿足以上索引排序的兩個規(guī)則)時,方可使用索引排序愈诚。如:再創(chuàng)建一個用戶的擴(kuò)展表user_test_ext她按,并建立uid的索引。
DROP TABLE IF EXISTS user_test_ext;
CREATE TABLE user_test_ext(
? id int AUTO_INCREMENT PRIMARY KEY,
? uid int NOT NULL,
? u_password VARCHAR(64) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
ALTER TABLE user_test_ext ADD INDEX index_user_ext(uid);
走索引排序
SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY u.user_name;
不走索引排序
SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDE