什么時候不用索引
在數(shù)據(jù)表中的數(shù)據(jù)行數(shù)比較少的情況下斋竞,比如不到 1000 行,是不需要創(chuàng)建索引的秃殉。另外坝初,當(dāng)數(shù)據(jù)重復(fù)度大,比如高于 10% 的時候钾军,也不需要對這個字段使用索引鳄袍。我之前講到過,如果是性別這個字段吏恭,就不需要對它創(chuàng)建索引拗小。這是為什么呢?如果你想要在 100 萬行數(shù)據(jù)中查找其中的 50 萬行(比如性別為男的數(shù)據(jù))樱哼,一旦創(chuàng)建了索引哀九,你需要先訪問 50 萬次索引,然后再訪問 50 萬次數(shù)據(jù)表搅幅,這樣加起來的開銷比不使用索引可能還要大阅束。
索引的種類
從功能邏輯上說,索引主要有 4 種茄唐,分別是普通索引息裸、唯一索引、主鍵索引和全文索引沪编。
1.普通索引是基礎(chǔ)的索引呼盆,沒有任何約束,主要用于提高查詢效率蚁廓。
2.唯一索引就是在普通索引的基礎(chǔ)上增加了數(shù)據(jù)唯一性的約束访圃,在一張數(shù)據(jù)表里可以有多個唯一索引。
3.主鍵索引在唯一索引的基礎(chǔ)上增加了不為空的約束纳令,也就是 NOT NULL+UNIQUE挽荠,一張表里最多只有一個主鍵索引。
4.全文索引用的不多平绩,MySQL 自帶的全文索引只支持英文。我們通衬恚可以采用專門的全文搜索引擎捏雌,比如 ES(ElasticSearch) 和 Solr。
其實前三種索引(普通索引笆搓、唯一索引和主鍵索引)都是一類索引性湿,只不過對數(shù)據(jù)的約束性逐漸提升纬傲。在一張數(shù)據(jù)表中只能有一個主鍵索引,這是由主鍵索引的物理實現(xiàn)方式?jīng)Q定的肤频,因為數(shù)據(jù)存儲在文件中只能按照一種順序進行存儲叹括。但可以有多個普通索引或者多個唯一索引。
按照物理實現(xiàn)方式宵荒,索引可以分為 2 種:聚集索引和非聚集索引汁雷。
我們也把非聚集索引稱為二級索引或者輔助索引。聚集索引可以按照主鍵來排序存儲數(shù)據(jù)报咳,這樣在查找行的時候非常有效侠讯。舉個例子,如果是一本漢語字典暑刃,我們想要查找“數(shù)”這個字厢漩,直接在書中找漢語拼音的位置即可,也就是拼音“shu”岩臣。這樣找到了索引的位置溜嗜,在它后面就是我們想要找的數(shù)據(jù)行。
非聚集索引又是什么呢架谎?在數(shù)據(jù)庫系統(tǒng)會有單獨的存儲空間存放非聚集索引粱胜,這些索引項是按照順序存儲的,但索引項指向的內(nèi)容是隨機存儲的狐树。也就是說系統(tǒng)會進行兩次查找焙压,第一次先找到索引,第二次找到索引對應(yīng)的位置取出數(shù)據(jù)行抑钟。非聚集索引不會把索引指向的內(nèi)容像聚集索引一樣直接放到索引的后面涯曲,而是維護單獨的索引表(只維護索引,不維護索引指向的數(shù)據(jù))在塔,為數(shù)據(jù)檢索提供方便幻件。我們還以漢語字典為例,如果想要查找“數(shù)”字蛔溃,那么按照部首查找的方式绰沥,先找到“數(shù)”字的偏旁部首,然后這個目錄會告訴我們“數(shù)”字存放到第多少頁贺待,我們再去指定的頁碼找這個字徽曲。
聚集索引指表中數(shù)據(jù)行按索引的排序方式進行存儲,對查找行很有效麸塞。只有當(dāng)表包含聚集索引時秃臣,表內(nèi)的數(shù)據(jù)行才會按找索引列的值在磁盤上進行物理排序和存儲。每一個表只能有一個聚集索引,因為數(shù)據(jù)行本身只能按一個順序存儲奥此。
聚集索引與非聚集索引的原理不同弧哎,在使用上也有一些區(qū)別:
1.聚集索引的葉子節(jié)點存儲的就是我們的數(shù)據(jù)記錄,非聚集索引的葉子節(jié)點存儲的是數(shù)據(jù)位置稚虎。非聚集索引不會影響數(shù)據(jù)表的物理存儲順序撤嫩。
2.一個表只能有一個聚集索引,因為只能有一種排序存儲的方式蠢终,但可以有多個非聚集索引序攘,也就是多個索引目錄提供數(shù)據(jù)檢索。
3.使用聚集索引的時候蜕径,數(shù)據(jù)的查詢效率高两踏,但如果對數(shù)據(jù)進行插入,刪除兜喻,更新等操作梦染,效率會比非聚集索引低。
1.對 WHERE 子句的字段建立索引朴皆,可以大幅提升查詢效率帕识。
2.采用聚集索引進行數(shù)據(jù)查詢,比使用非聚集索引的查詢效率略高遂铡。如果查詢次數(shù)比較多肮疗,還是盡量使用主鍵索引進行數(shù)據(jù)查詢。
除了業(yè)務(wù)邏輯和物理實現(xiàn)方式扒接,索引還可以按照字段個數(shù)進行劃分伪货,分成單一索引和聯(lián)合索引。
索引列為一列時為單一索引钾怔;多個列組合在一起創(chuàng)建的索引叫做聯(lián)合索引碱呼。
最左匹配原則
這里需要說明的是聯(lián)合索引存在最左匹配原則,也就是按照最左優(yōu)先的方式進行索引的匹配宗侦。比如剛才舉例的 (x, y, z)愚臀,如果查詢條件是 WHERE x=1 AND y=2 AND z=3,就可以匹配上聯(lián)合索引矾利;如果查詢條件是 WHERE y=2姑裂,就無法匹配上聯(lián)合索引。
你能看到當(dāng)我們使用了聯(lián)合索引 (user_id, user_name) 的時候男旗,在 WHERE 子句中對聯(lián)合索引中的字段 user_id 和 user_name 進行條件查詢舶斧,或者只對 user_id 進行查詢,效率基本上是一樣的剑肯。當(dāng)我們對 user_name 進行條件查詢時捧毛,效率就會降低很多,這是因為根據(jù)聯(lián)合索引的最左原則让网,user_id 在 user_name 的左側(cè)呀忧,如果沒有使用 user_id,而是直接使用 user_name 進行條件查詢溃睹,聯(lián)合索引就會失效而账。