高性能MySQL索引（Innodb）

前置問題

where條件的順序會影響索引的使用？
聯(lián)合索引(idx_a_b ) 條件：“where a > 1 and b < 2”和“where a in (1,3) and b < 2” 有什么區(qū)別？
使用uid作為主鍵有什么問題？
一個表有兩個索引灶芝，idx_a, idx_b，查詢語句"where a > 1 and b < 2"，會使用到幾個索引
查詢條件肯定是越多谓松，查詢效率越快涡匀？
select * 和select field 差別其實沒有多大盯腌，主要體現(xiàn)在網(wǎng)絡Io上？
一行SQL除了where條件陨瘩，order by操作也是可以利用索引的腕够？
關于limit offset，SQL效率跟limit大小有關系舌劳，跟offset也有很大關系?
如何優(yōu)化uid字段索引帚湘？
select 1 > null 結(jié)果是什么？
Django ORM的弊端甚淡？

Innodb索引結(jié)構(gòu)

索引我們都很熟悉大诸，可以通過把要索引的key建立一個平衡二叉樹，進行二分查找贯卦，使時間復雜度來到O(log2n)资柔，定位到key再通過內(nèi)存指針找到自己的data，整個過程在內(nèi)存中很快撵割，但是對于數(shù)據(jù)庫來說贿堰，這樣的數(shù)據(jù)結(jié)構(gòu)卻不行，因為數(shù)據(jù)庫是建立在硬盤上的啡彬。

圖片來源網(wǎng)絡侵刪.png

我們先看一下硬盤讀取數(shù)據(jù)的工作方式羹与，磁盤可以轉(zhuǎn)動，磁頭是固定的不能轉(zhuǎn)庶灿，但是可以伸縮注簿，磁盤的同心圓稱為磁道，而這個磁頭伸縮跳仿，就是在尋找磁道诡渴，圓心和兩個半徑組成了一個扇區(qū)，操作系統(tǒng)發(fā)出電信號到磁盤菲语，可能是一個邏輯地址妄辩，磁盤的電路會解析這個信息，變成磁道和扇區(qū)的物理地址山上，然后就開始磁盤轉(zhuǎn)動和磁頭伸縮眼耀。從內(nèi)存電路到物理磁盤，性能下降是可想而知的佩憾，所以就有磁盤的預讀特性哮伟，這也是依據(jù)計算機科學中著名的局部性原理：當一個數(shù)據(jù)被用到時干花，其附近的數(shù)據(jù)也通常會馬上被使用塘幅。和共享內(nèi)存的數(shù)據(jù)讀取做法相似姥卢，它會往后再讀一頁或者幾頁(一頁一般4k)院塞。

圖片來源網(wǎng)絡侵刪.png

那我們重新看二叉樹的數(shù)據(jù)結(jié)構(gòu)就會明白绰垂，每一個節(jié)點往下尋址一次娱局，就等于一次物理轉(zhuǎn)動趁怔，那這時候就需要不影響索引效率的情況下序目，盡可能小的減少磁盤轉(zhuǎn)動腥泥。這樣的數(shù)據(jù)結(jié)構(gòu)就是B+Tree如下圖碎税，你會發(fā)現(xiàn)數(shù)據(jù)都盡可能的平鋪在葉子節(jié)點尤慰，以減少磁盤io，前面有提到磁盤預讀的設計雷蹂，使用B+Tree結(jié)構(gòu)就可以一次物理消耗讀取一個葉子頁的數(shù)據(jù)伟端。一般情況下索引遠遠小于實際的數(shù)據(jù)，查詢速度很慢匪煌，但是如果這個表超級大大到連索引也很大荔泳，這時候查詢依然會很慢，這時候需要做的就是分庫分表虐杯、數(shù)據(jù)歸檔等操作了玛歌。

圖片來自高性能MySQL.png

這里不得不提到聚簇索引和非聚簇索引的區(qū)別，因為他們在物理結(jié)果上有一些不同擎椰，首先支子，我們先看一下聚簇索引。

聚簇索引

聚簇索引就是咱們經(jīng)常說的主鍵索引达舒、pk值朋。如果沒有主鍵呢，Innodb會選擇第一個沒空的唯一索引作為聚簇索引巩搏，如果這個唯一索引也沒有昨登，這個也是Innodb有而MyIsam所沒有的設計。聚簇索引也是索引贯底，也是前面的B+Tree的結(jié)構(gòu)丰辣，但是聚簇索引和非聚簇索引不同的地方在于，非聚簇索引葉子節(jié)點保存的數(shù)據(jù)是聚簇索引id的地址禽捆，而聚簇索引葉子節(jié)點保存的是實際行的值笙什，也就是說，實際行的值是按照聚簇索引排列的方式進行存儲的胚想。而myisam的結(jié)構(gòu)則是數(shù)據(jù)和索引分開的琐凭，結(jié)構(gòu)可以參照下圖。

圖片來自高性能MySQL.png

一條查詢語句是怎么工作的浊服？

一條查詢語句會經(jīng)過分析器進行詞法分析统屈、語法分析胚吁，經(jīng)過優(yōu)化器生成執(zhí)行計劃、索引選擇愁憔，最后會操作引擎腕扶，返回結(jié)果，所以前面的問題惩淳，where條件的順序會影響索引的使用嗎？答案是不會乓搬，因為優(yōu)化器已經(jīng)幫你優(yōu)化了思犁。

image.png

如果查詢條件有聚簇索引，優(yōu)先選擇聚簇索引进肯，如果查詢條件是非聚簇索引激蹲，會先查非聚簇索引，找到主鍵id江掩，再去查找聚簇索引学辱，找到自己想要的值，這個動作成為“回表”环形。

索引覆蓋

上一節(jié)提到了“回表”策泣，如果有回表動作，那么一行sql就要走兩遍索引抬吟，只查詢索引就可以把數(shù)據(jù)取出來的做法就叫做“索引覆蓋”萨咕。這也是為什么大廠都禁止select *的寫法，因為select *一定會回表火本。

前綴索引和索引選擇性

有時候需要索引很長的字符串危队，這會讓索引變得又大又慢，一種策略是使用哈希索引钙畔，把很長的字符串弄成一個hash值茫陆，但是這樣做還不夠，通城嫖觯可以只索引開始的部分字符簿盅，這樣可以大大節(jié)約索引空間，從而提高索引效率揍魂，但是這樣會降低索引的選擇性挪鹏，選擇性越高，代表使用索引后篩選到的值越少愉烙，所以怎么在選擇性和索引長度之間做權衡讨盒。

可以比較:
count(distinct filed) / count(field) 與count(distinct left(field, n)) / count(field) 的比率
以uuid為例子，uuid有32位步责，在單表700w的場景下：
count(distinct uid) / count(uid)  = 1 VS count(distinct left(uid, 10)） / count(uid)  = 1
這時候就可以alter table xx add index idx_uid (uid(10))

前綴索引使索引更小返顺、更快禀苦，但是另一方面前綴索引也有其缺點：MySQL無法使用前綴索引做order by和group by，也無法使用前綴索引做索引覆蓋遂鹊。

判斷一個索引是否適合某一條查詢振乏？

索引將相關記錄放在一起
索引中數(shù)據(jù)順序和查詢中的排列順序一致
索引中的列包含需要查詢的全部列

索引可以既滿足查找又滿足排序

前提是：索引的順序與order by的順序一致，并且所有列的排序方向一致（不能是一個升序一個倒序）秉扑，這樣就可以使用索引進行排序了慧邮，而不是按索引順序去數(shù)據(jù)庫里把數(shù)據(jù)拉到服務器里（隨機io了），再在一個臨時文件里進行排序舟陆，這時候explain大多會出現(xiàn)filesort误澳，這時候的效率是非常慢的。例子如下：

idx_a_b_c select a,b,c from table order by a,b,c  全部利用到索引 Using index
idx_a_b_c select * from table order by a,b,c 無法利用到索引 Using filesort
idx_a_b_c select a,b,c,d from table order by a,b,c 無法利用到索引 Using filesort
idx_a_b_c select a,b,c from table order by a,b desc,c  利用到一部分索引 Using index; Using filesort
idx_a_b_c select a, b, c from table where a=100 order by b,c  可以利用到索引排序 Using where; Using index
idx_a_b_c select a, b, c from table where a>100 order by b,c  利用到一部分索引 Using where; Using index; Using filesort

這里要說下 a in (1,2,3) 和 a >= 1 and a <= 3的區(qū)別秦躯；在聯(lián)合索引的場景下如idx_a_b忆谓，如果是a in (1,2,3)，不影響后面的b使用索引踱承，如果是a >= 1 and a <= 3那么后面的b無法使用到索引倡缠。

索引合并

當在一張表建立多個字段的索引時候，一行SQL一般是只能使用到一個索引茎活，直到MySQL5.0以后昙沦，有了索引合并這么的機制，一定程度上可以利用多條索引载荔。

Using union 索引取并集
Using sort_union 索引排序取并集
Using intersect 索引取交集
索引合并策略是一種優(yōu)化結(jié)果桅滋，但實際上更多時候說明了表上的索引建的很糟糕，才會不得不使用索引合并進行優(yōu)化身辨。
當在explain的執(zhí)行計劃里面出現(xiàn)上述索引合并時候丐谋，我們要知道以下問題：
可以通過建立聯(lián)合索引的方式解決Using intersect
服務器對多個索引索引做聯(lián)合操作時候，通常會耗費大量的CPU和內(nèi)存資源在緩存煌珊、排序合并操作上号俐，尤其是在索引的利用率不高，返回大量數(shù)據(jù)的情況下
優(yōu)化器不會把這些服務器的排序合并計算到“查詢成本”中定庵，優(yōu)化器只關心隨即頁面讀取吏饿。所以這些成本是被“低估”的成本
一行SQL上利用多個索引做索引合并update時候，會提高死鎖的概率蔬浙。

關于NULL

NULL在MySQL中的意思是“未知”而不是False或者""
SELECT NULL, 1+NULL, CONCAT('Invisible',NULL);; 結(jié)果都是NULL
當使用DISTINCT, GROUP BY, or ORDER BY, 所有的 NULL字段會被當成是相等的
針對UNIQUE index猪落，兩個NULL值會被看到是相等的
帶有NULL值的唯一索引，無法被當做
order by的時候NULL會放在第一個(asc)或者最后一個(desc)
當使用Aggregate (summary) 如COUNT() MIN() SUM()會忽略NULL
NULL會有些特殊的處理畴博，如timestamp笨忌、AUTO-INCREMENT字段
針對NULL字段建立索引，需要使用額外的空間

未來期望MySQL可以做到的

where條件可以傳到存儲引擎層index condition pushdown
松散索引掃描

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末俱病，一起剝皮案震驚了整個濱河市官疲，隨后出現(xiàn)的幾起案子袱结，更是在濱河造成了極大的恐慌，老刑警劉巖途凫，帶你破解...
沈念sama閱讀 219,039評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件垢夹，死亡現(xiàn)場離奇詭異，居然都是意外死亡维费，警方通過查閱死者的電腦和手機果元，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,426評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來犀盟，“玉大人而晒，你說我怎么就攤上這事∏遗睿” “怎么了欣硼？”我有些...
開封第一講書人閱讀 165,417評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵题翰，是天一觀的道長恶阴。經(jīng)常有香客問我，道長豹障，這世上最難降的妖魔是什么冯事？我笑而不...
開封第一講書人閱讀 58,868評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮血公，結(jié)果婚禮上昵仅，老公的妹妹穿的比我還像新娘。我一直安慰自己累魔，他們只是感情好摔笤，可當我...
茶點故事閱讀 67,892評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著垦写，像睡著了一般吕世。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上梯投，一...
開封第一講書人閱讀 51,692評論 1贊 305
城市分裂傳說
那天命辖，我揣著相機與錄音，去河邊找鬼分蓖。笑死尔艇，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的么鹤。我是一名探鬼主播终娃，決...
沈念sama閱讀 40,416評論 3贊 419
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼蒸甜！你這毒婦竟也來了尝抖？” 一聲冷哼從身側(cè)響起毡们，我...
開封第一講書人閱讀 39,326評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎昧辽，沒想到半個月后衙熔，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,782評論 1贊 316
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡搅荞，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,957評論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年红氯，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片咕痛。...
茶點故事閱讀 40,102評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡痢甘，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出茉贡，到底是詐尸還是另有隱情塞栅，我是刑警寧澤，帶...
沈念sama閱讀 35,790評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布腔丧，位于F島的核電站放椰，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏愉粤。R本人自食惡果不足惜砾医，卻給世界環(huán)境...
茶點故事閱讀 41,442評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望衣厘。院中可真熱鬧如蚜，春花似錦、人聲如沸影暴。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,996評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽型宙。三九已至撬呢，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間早歇，已是汗流浹背倾芝。一陣腳步聲響...
開封第一講書人閱讀 33,113評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留箭跳，地道東北人晨另。一個月前我還...
沈念sama閱讀 48,332評論 3贊 373
代替公主和親
正文我出身青樓，卻偏偏與公主長得像谱姓，于是被迫代替她去往敵國和親借尿。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,044評論 2贊 355