mysql索引初識(shí)

文章是學(xué)習(xí)了林曉斌老師在極客時(shí)間的《mysql實(shí)戰(zhàn)45講》后糊渊，根據(jù)自己的理解整理而成的爷耀。

什么是索引申屹？

當(dāng)我們使用漢語(yǔ)字典查找某個(gè)字時(shí)，我們會(huì)先通過(guò)拼音目錄查到那個(gè)字所在的頁(yè)碼缩抡，然后直接翻到字典的那一頁(yè)奠宜，找到我們要查的字，通過(guò)拼音目錄查找比我們拿起字典從頭一頁(yè)一頁(yè)翻找要快的多瞻想，數(shù)據(jù)庫(kù)索引也一樣压真，索引就像書(shū)的目錄，通過(guò)索引能極大提高數(shù)據(jù)查詢(xún)的效率蘑险。

索引的實(shí)現(xiàn)方式

在數(shù)據(jù)庫(kù)中榴都，常見(jiàn)的索引實(shí)現(xiàn)方式有哈希表、有序數(shù)組漠其、搜索樹(shù)

哈希表
哈希表是通過(guò)鍵值對(duì)（key-value）存儲(chǔ)數(shù)據(jù)的索引實(shí)現(xiàn)方式，可以將哈希表想象成是一個(gè)數(shù)組竿音，將索引通過(guò)哈希函數(shù)計(jì)算得到該行數(shù)據(jù)在數(shù)組中的位置和屎，然后將數(shù)據(jù)存到數(shù)組中，容易發(fā)現(xiàn)一個(gè)問(wèn)題春瞬，如果兩個(gè)索引通過(guò)哈希函數(shù)計(jì)算后得到的數(shù)組位置相同要怎么辦柴信？在這里，數(shù)組的每個(gè)value都是一個(gè)鏈表宽气，鏈表上的每個(gè)元素都是一個(gè)數(shù)據(jù)随常，新數(shù)據(jù)直接添加到鏈表尾部。

哈希表.png

所以數(shù)據(jù)庫(kù)查詢(xún)過(guò)程為：索引通過(guò)哈希函數(shù)計(jì)算數(shù)據(jù)所在位置--> 遍歷指定位置的鏈表萄涯，找到滿(mǎn)足條件的數(shù)據(jù)绪氛。
要注意的是，鏈表上的數(shù)據(jù)元素不是有序的涝影，每次有新數(shù)據(jù)加入時(shí)枣察，新數(shù)據(jù)時(shí)直接添加到鏈表尾部，這樣做的好處是添加數(shù)據(jù)時(shí)很方便。
???????哈希表不擅長(zhǎng)進(jìn)行區(qū)間查詢(xún)序目，一般都用于等值查詢(xún)
??????????1臂痕、兩個(gè)相鄰索引通過(guò)hash函數(shù)后計(jì)算得到的數(shù)組位置不一定還保持相鄰
??????????2、鏈表上的數(shù)據(jù)是無(wú)序的
有序數(shù)組
顧名思義猿涨，有序數(shù)組是按索引大小將數(shù)據(jù)保存在一個(gè)數(shù)組上握童，因?yàn)樵摂?shù)組是有序的，可以通過(guò)二分法很容易查到位置叛赚，找到第一個(gè)位置后澡绩，通過(guò)向左/向右遍歷很容易得到所求區(qū)間的數(shù)據(jù)。因此红伦，無(wú)論是等值查詢(xún)還是區(qū)間查詢(xún)英古，效率都極高。
但缺陷也是顯而易見(jiàn)的昙读，當(dāng)向數(shù)組中間n位置插入一條數(shù)據(jù)時(shí)召调，需將n后面的數(shù)據(jù)全部往后移動(dòng)，所以蛮浑，這種索引一般用于靜態(tài)存儲(chǔ)引擎唠叛。
搜索樹(shù)

二叉搜索樹(shù)：一棵空樹(shù)，或者是具有下列性質(zhì)的二叉樹(shù)：若它的左子樹(shù)不空沮稚，則左子樹(shù)上所有結(jié)點(diǎn)的值均小于它的根結(jié)點(diǎn)的值艺沼；若它的右子樹(shù)不空，則右子樹(shù)上所有結(jié)點(diǎn)的值均大于它的根結(jié)點(diǎn)的值蕴掏；二叉搜索樹(shù)的左障般、右子樹(shù)也分別為二叉搜索樹(shù)。
平衡二叉樹(shù)：平衡二叉樹(shù)是在二叉搜索樹(shù)的基礎(chǔ)上引入的盛杰，指的是結(jié)點(diǎn)的左子樹(shù)和右子樹(shù)的深度差不超過(guò)1.
多叉樹(shù)：每個(gè)結(jié)點(diǎn)可以有多個(gè)子結(jié)點(diǎn)挽荡，子節(jié)點(diǎn)的大小從左到右依次遞增。

當(dāng)使用平衡二叉實(shí)現(xiàn)索引時(shí)即供，結(jié)構(gòu)如下圖

圖片來(lái)自課程文章

從圖中可發(fā)現(xiàn)定拟，每次查詢(xún)最多需要訪(fǎng)問(wèn)4個(gè)節(jié)點(diǎn)必能得到所要數(shù)據(jù)。例如查詢(xún)user2時(shí)逗嫡，查詢(xún)過(guò)程為：userA-->userC-->userF-->user2青自。
所以查詢(xún)速度很高，同時(shí)驱证，因?yàn)樗阉鳂?shù)的特性（左子樹(shù)小于右子樹(shù)）延窜，區(qū)間查詢(xún)也很方便。

如果搜索樹(shù)存于內(nèi)存中抹锄，與多叉樹(shù)相比需曾，二叉樹(shù)的搜索速率是最高的，但實(shí)際上數(shù)據(jù)庫(kù)使用的是n叉樹(shù)而不是二叉樹(shù)。

1呆万、索引不僅存于內(nèi)存商源，還是寫(xiě)到磁盤(pán)上
2、搜索樹(shù)上的每個(gè)結(jié)點(diǎn)在磁盤(pán)上表現(xiàn)為一個(gè)數(shù)據(jù)塊
3谋减、多叉樹(shù)每個(gè)結(jié)點(diǎn)下可以有多個(gè)子節(jié)點(diǎn)牡彻，所以存儲(chǔ)相同數(shù)據(jù)量時(shí)多叉樹(shù)的樹(shù)高比二叉樹(shù)小，查詢(xún)一個(gè)數(shù)據(jù)需要訪(fǎng)問(wèn)的結(jié)點(diǎn)數(shù)更少出爹，即查詢(xún)過(guò)程訪(fǎng)問(wèn)更少的數(shù)據(jù)塊庄吼。查詢(xún)速度較高。

innodb的索引模型

innodb使用B+樹(shù)作為索引結(jié)構(gòu)严就。
在B+樹(shù)中总寻，我們將節(jié)點(diǎn)分為葉子結(jié)點(diǎn)和非葉子結(jié)點(diǎn)，非葉子結(jié)點(diǎn)上保存的是索引梢为，而且一個(gè)節(jié)點(diǎn)可以保存多個(gè)索引渐行；數(shù)據(jù)全部存于葉子結(jié)點(diǎn)上,根據(jù)葉子結(jié)點(diǎn)的內(nèi)容不同，innodb索引分為主鍵索引和非主鍵索引铸董。非主鍵索引也稱(chēng)為二級(jí)索引祟印。
主鍵索引的葉子結(jié)點(diǎn)中保存的數(shù)據(jù)為整行數(shù)據(jù)，而非主鍵索引葉子節(jié)點(diǎn)保存的是主鍵的值粟害。

主鍵索引圖

非主鍵索引圖

通過(guò)主鍵索引查詢(xún)數(shù)據(jù)時(shí)蕴忆，我們只需查找主鍵索引樹(shù)便可以獲取數(shù)據(jù)；通過(guò)非主鍵索引查詢(xún)數(shù)據(jù)時(shí)悲幅，我們先通過(guò)非主鍵索引樹(shù)查找到主鍵值套鹅，然后再在主鍵索引樹(shù)搜索一次，這個(gè)過(guò)程稱(chēng)為回表汰具，也就是說(shuō)非主鍵索引查詢(xún)會(huì)比主鍵查詢(xún)多搜索一棵樹(shù)芋哭。所以我們應(yīng)盡可能使用主鍵查詢(xún)。

索引維護(hù)

添加新行時(shí)郁副，將會(huì)在索引表上添加一條記錄，如果是索引遞增插入時(shí)豌习，數(shù)據(jù)都是追加在當(dāng)前最大索引之后存谎，不會(huì)對(duì)樹(shù)中其他數(shù)據(jù)造成影響；如果新加入的數(shù)據(jù)的索引值位于節(jié)點(diǎn)的中間肥隆，需要挪動(dòng)部分節(jié)點(diǎn)的位置既荚，從而保持索引樹(shù)的有序性。
而且栋艳，相鄰多個(gè)節(jié)點(diǎn)是存儲(chǔ)在同一個(gè)數(shù)據(jù)頁(yè)上的恰聘，此時(shí)，如果是在已經(jīng)存儲(chǔ)滿(mǎn)狀態(tài)的數(shù)據(jù)頁(yè)中插入節(jié)點(diǎn)，會(huì)申請(qǐng)新的數(shù)據(jù)頁(yè)晴叨，將部分?jǐn)?shù)據(jù)挪動(dòng)到新的數(shù)據(jù)頁(yè)凿宾，這個(gè)過(guò)程稱(chēng)為頁(yè)分裂，頁(yè)分裂除了會(huì)影響性能兼蕊，還會(huì)降低磁盤(pán)空間利用率初厚。不規(guī)則數(shù)據(jù)插入時(shí),會(huì)造成頻繁的頁(yè)分裂。

當(dāng)相鄰兩個(gè)頁(yè)由于刪除了數(shù)據(jù)孙技，利用率很低之后产禾，會(huì)將數(shù)據(jù)頁(yè)做合并

所以，一般情況下會(huì)采用遞增主鍵牵啦，使新數(shù)據(jù)遞增插入亚情。

使用業(yè)務(wù)邏輯字段做主鍵有什么優(yōu)缺點(diǎn)？

1哈雏、業(yè)務(wù)邏輯字段不容易保證索引樹(shù)結(jié)點(diǎn)有序插入楞件，這樣寫(xiě)入成本較高。
2僧著、innodb默認(rèn)使用整數(shù)類(lèi)型作為主鍵履因，主鍵長(zhǎng)度較小，二級(jí)索引的葉子結(jié)點(diǎn)中保存的是主鍵值盹愚，主鍵長(zhǎng)度越小栅迄，二級(jí)索引的葉子結(jié)點(diǎn)占用空間也就越小。
3皆怕、當(dāng)然毅舆，使用業(yè)務(wù)邏輯字段做主鍵也有好處，可以避免回表愈腾，每次只需掃描一次主鍵索引樹(shù)即可
綜上憋活，從性能和存儲(chǔ)空間方面考量，自增主鍵往往是更合理的選擇,當(dāng)業(yè)務(wù)場(chǎng)景有且只有一個(gè)索引虱黄，而且該索引為唯一索引時(shí)悦即，此時(shí)更適合使用業(yè)務(wù)邏輯字段作為主鍵。

因?yàn)閿?shù)據(jù)修改/刪除橱乱、頁(yè)分裂等原因辜梳，會(huì)導(dǎo)致數(shù)據(jù)頁(yè)空間利用率降低，此時(shí)泳叠，可以考慮重建索引作瞄，將數(shù)據(jù)按順序插入，提高磁盤(pán)空間利用率危纫。但重建主鍵索引和普通索引會(huì)有不同影響宗挥，重建普通索引乌庶，可以達(dá)到提高空間利用率的目的，且不會(huì)對(duì)其他索引造成影響契耿，但如果重建主鍵索引就不合理了瞒大，會(huì)影響所有普通索引，性能影響較大宵喂，而且無(wú)論是新建/刪除主鍵糠赦，都會(huì)重建整張表。這時(shí)我們可以使用alter table T engine=InnoDB這個(gè)語(yǔ)句代替锅棕。

查看索引利用率

查看performance_schema.table_io_waits_summary_by_index_usage表

最后編輯于：2018.12.02 23:12:43

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末拙泽，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子裸燎，更是在濱河造成了極大的恐慌顾瞻，老刑警劉巖，帶你破解...
沈念sama閱讀 211,123評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件德绿，死亡現(xiàn)場(chǎng)離奇詭異荷荤，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)移稳，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,031評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)蕴纳，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人个粱，你說(shuō)我怎么就攤上這事古毛。” “怎么了都许？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,723評(píng)論 0贊 345
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵稻薇，是天一觀(guān)的道長(zhǎng)。經(jīng)常有香客問(wèn)我胶征，道長(zhǎng)塞椎，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,357評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任睛低，我火速辦了婚禮案狠，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘钱雷。我一直安慰自己骂铁，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 65,412評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布急波。她就那樣靜靜地躺著，像睡著了一般瘪校。火紅的嫁衣襯著肌膚如雪澄暮。梳的紋絲不亂的頭發(fā)上名段，一...
開(kāi)封第一講書(shū)人閱讀 49,760評(píng)論 1贊 289
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音泣懊，去河邊找鬼伸辟。笑死，一個(gè)胖子當(dāng)著我的面吹牛馍刮，可吹牛的內(nèi)容都是我干的信夫。我是一名探鬼主播，決...
沈念sama閱讀 38,904評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼卡啰，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼静稻！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起匈辱，我...
開(kāi)封第一講書(shū)人閱讀 37,672評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤振湾，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后亡脸，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體押搪，經(jīng)...
沈念sama閱讀 44,118評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,456評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年浅碾，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了大州。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 38,599評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡垂谢，死狀恐怖厦画，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情埂陆，我是刑警寧澤苛白，帶...
沈念sama閱讀 34,264評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站焚虱，受9級(jí)特大地震影響购裙，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鹃栽，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,857評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一躏率、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧民鼓，春花似錦薇芝、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,731評(píng)論 0贊 21
一樁弒父案夯到，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至饮亏，卻和暖如春耍贾，著一層夾襖步出監(jiān)牢的瞬間阅爽，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,956評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工荐开，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留付翁，地道東北人。一個(gè)月前我還...
沈念sama閱讀 46,286評(píng)論 2贊 360
代替公主和親
正文我出身青樓晃听，卻偏偏與公主長(zhǎng)得像百侧，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子能扒，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,465評(píng)論 2贊 348

mysql索引初識(shí)

什么是索引申屹？

索引的實(shí)現(xiàn)方式

innodb的索引模型

索引維護(hù)

推薦閱讀更多精彩內(nèi)容