MySQL 之 InnoDB Index 淺談

??MySQL 一直是 RDBMS 型數(shù)據(jù)庫(kù)中用戶最多炼邀，使用最廣的數(shù)據(jù)庫(kù)。主要是因?yàn)樗_(kāi)源剪侮、免費(fèi)拭宁、文檔豐富等。在 MySQL 查詢優(yōu)化中瓣俯，提得最多杰标、用得最廣的就是 Index, 那我們就來(lái)慢慢的揭開(kāi)它神秘的面紗吧。

Structure

InnoDB-physical-structure-overview.png

??MySQL 是基于磁盤(pán)的數(shù)據(jù)庫(kù)彩匕，所以 MySQL 的所有信息皆是以文件的形式存儲(chǔ)于磁盤(pán)腔剂，我想這是借鑒了 Linux 的設(shè)計(jì)哲學(xué) "Everything is a file" 吧。進(jìn)入 MySQL 使用如下命令查看數(shù)據(jù)目錄驼仪。

mysql> show variables where Variable_Name LIKE "%dir";
+---------------------------+----------------------------+
| Variable_name             | Value                      |
+---------------------------+----------------------------+
| basedir                   | /usr/                      |
| character_sets_dir        | /usr/share/mysql/charsets/ |
| datadir                   | /var/lib/mysql/            |
| innodb_data_home_dir      |                            |
| innodb_log_group_home_dir | ./                         |
| innodb_tmpdir             |                            |
| lc_messages_dir           | /usr/share/mysql/          |
| plugin_dir                | /usr/lib/mysql/plugin/     |
| slave_load_tmpdir         | /tmp                       |
| tmpdir                    | /tmp                       |
+---------------------------+----------------------------+
10 rows in set (0.00 sec)

Spaces

??進(jìn)入 datadir/database 目錄, 文件分為 .frm 與 .ibd 兩類(lèi)文件掸犬，分別是表的結(jié)構(gòu)文件與數(shù)據(jù)文件。以 var/lib/mysql 為數(shù)據(jù)目錄谅畅，repldb 為 db_name, repl_tab1 作為表名登渣，展示如下:

root@mysql-master:/var/lib/mysql/repldb# ls -l
-rw-r----- 1 mysql mysql    61 Apr 28  2019 db.opt
-rw-r----- 1 mysql mysql  8676 Apr 28  2019 repl_tb1.frm
-rw-r----- 1 mysql mysql 98304 Apr 28  2019 repl_tb1.ibd

??以上是我們可以簡(jiǎn)單看到的物理文件，那在 MySQL 的邏輯當(dāng)中毡泻，它又是如何的呢? InnoDB 的數(shù)據(jù)存儲(chǔ)使用 "spaces" 進(jìn)行存儲(chǔ)胜茧，通常我們叫它 "tablespaces", 有時(shí)候 InnoDB 內(nèi)部也叫它 "filespaces"。一個(gè) space 可由 1 個(gè)或 n 個(gè)實(shí)際的文件組成(如: ibdata1,ibdata2 等, 多個(gè)文件時(shí)仇味，它們帶有特定的順序和序號(hào))呻顽，但不管它由多少個(gè)實(shí)際的文件進(jìn)行存儲(chǔ)，它只組成一個(gè)邏輯文件, 每個(gè) space 文件在 InnoDB 中被賦于一個(gè) 32-bit Int 的 space_id 作為標(biāo)識(shí)符丹墨。.idb 可以包含多個(gè)表文件廊遍，但是在 MySQL 的實(shí)現(xiàn)中，一個(gè) .ibd 文件只包含一個(gè)表贩挣，所以把一個(gè) .ibd 文件等價(jià)于一個(gè)表文件喉前。

Pages

??前面已經(jīng)知道 MySQL 把每個(gè)表的數(shù)據(jù)存儲(chǔ)在一個(gè) data file 也就是 .ibd 文件中没酣，又因?yàn)?MySQL 是基于磁盤(pán)的數(shù)據(jù)庫(kù)系統(tǒng)，那是不是查詢的時(shí)候把物理文件一次性加載到內(nèi)存當(dāng)中卵迂，然后再進(jìn)行過(guò)濾查詢呢裕便？或者進(jìn)一步的也文件流的形式載入內(nèi)存，然后再過(guò)濾呢? 是的见咒，MySQL 的查詢確實(shí)需要把物理文件加載到內(nèi)存才能進(jìn)行處理偿衰，但是 MySQL 的操作都不是前面提到的兩種方式。MySQL 采用 "分而治之" 的辦法改览，把 .ibd 邏輯分割成小塊下翎，然后每次加載一個(gè)或幾個(gè)塊到內(nèi)存再進(jìn)行處理，這就是 MySQL 的查詢處理方式宝当，這些小塊就是 MySQL 的數(shù)據(jù)處理最小單元视事。這些塊在 MySQL 中稱為一個(gè)Page, 有時(shí)也叫一個(gè)block, 每個(gè)Page同Space一樣有一個(gè)32-bitInt 的標(biāo)識(shí)符page_no, 每個(gè)page默認(rèn)固定大小為16KB, 可通過(guò)參數(shù) innodb_page_size 進(jìn)行調(diào)整，如: 4K庆揩、8K郑口、32K、64K 等盾鳞。Page 由以下幾部分組成詳細(xì):

Fil Header
Page Header
Infimun + Supermum Records
User Records
Free Space
Page Directory
Fil Trailer

??Page 與 Page 之間是否是互不相關(guān)呢? 各 Page 之間的關(guān)系在 Page 的 Fil Header 中進(jìn)行定義， Page 之間以 Doubly-Linked的方式進(jìn)行關(guān)聯(lián)瞻离，Page 的結(jié)構(gòu)詳細(xì)如下:

FIL_PAGE_SPACE //就是所謂的 `page_no`
FIL_PAGE_OFFSET
FIL_PAGE_PREV //指向前一個(gè) Page
FIL_PAGE_NEXT //指向后一個(gè) Page
FIL_PAGE_LSN  //LSN: log serial number
FIL_PAGE_TYPE
FIL_PAGE_FILE_FLUSH_LSN
FIL_PAGE_ARCH_LOG_NO

Records

??經(jīng)過(guò)前面的了解腾仅，我們已經(jīng)知道真實(shí)的數(shù)據(jù)是分布在 space 空間的每個(gè) page 內(nèi)，那如何才能得得到每行數(shù)據(jù)記錄呢套利？Page 的組成部分中有一項(xiàng) User Records, 那就是真實(shí)數(shù)據(jù)存儲(chǔ)位置推励。當(dāng)然了，Record 有自己的結(jié)構(gòu)肉迫，主要分為 Compact 和 Redundant 兩種格式验辞，但不管何種格式，它里一個(gè)指向下一條記錄的數(shù)據(jù) next_record, 通過(guò)這樣的方式喊衫，各 Record 就以 Singly-Linked 的形式進(jìn)行連接跌造。

Index

??通過(guò)前面的介紹，我們已經(jīng)知道了 MySQL InnoDB 引擎對(duì)于數(shù)據(jù)的處理方式和存儲(chǔ)結(jié)構(gòu)族购，當(dāng)我們查詢數(shù)據(jù)時(shí)壳贪，先定位 Table Space、再定位 Page寝杖、最后定位 Record违施，這是一個(gè)完整的數(shù)據(jù)查詢過(guò)程。那 Index 能夠幫助我們做什么呢瑟幕？ Index 其實(shí)就是幫助我們快速定位記錄磕蒲，縮短 space --> page --> record 這個(gè)過(guò)程留潦。

??MySQL 是基于磁盤(pán)的數(shù)據(jù)庫(kù)系統(tǒng)，有說(shuō)過(guò)它的設(shè)計(jì)哲學(xué)和 Linux 的 "Everything is a file" 的設(shè)計(jì)哲學(xué)相符辣往，那么 MySQL 的 Index 的設(shè)計(jì)哲學(xué)又是什么呢?

"Everything is an index in InnoDB".

??Index 分為 Clustered Index 和 Secondary Indexes 兩類(lèi), MySQL 中的索引的存儲(chǔ)根據(jù)不同的數(shù)據(jù)表和引擎又采用不同的形式兔院，一般情況通常采用 B-Tree 索引, 空間數(shù)據(jù)采用 R-Tree索引, 內(nèi)存數(shù)據(jù)采用 Hash 索引，文檔數(shù)據(jù)采用 Full Text 索引等排吴。

Clustered Index

??MySQL 中以 InnoDB 作為引擎時(shí)秆乳，每張表有且僅有一個(gè) Clustered Index，而且每張表必須有一個(gè) Clustered Index钻哩，下面詳細(xì)了解一下 Clustered Index 的生成規(guī)則屹堰。

有主鍵時(shí)，InnoDB 使用它作為 Clustered Index;
無(wú)主鍵
- 有 unique 列且 not null 列, MySQL 用第一個(gè)符合該條件的列作為 Clustered Index;
- 且無(wú)合適的 unique 列, InnoDB 會(huì)內(nèi)部生成一個(gè)名稱為 GEN_CLUST_INDEX 的隱藏索引街氢，該索引以隱藏的 6-byte 的 row_id 列作為索引列扯键，該列以數(shù)據(jù)行插入的順序進(jìn)行排序;

Q: 那為什么一定要有一個(gè)Clustered Index呢?

A: 因?yàn)?MySQL 需要快速定位 Record, 所以必須要有一個(gè)索引，就像書(shū)的目錄一樣珊肃，通過(guò)索引就可以快速定位到記錄對(duì)應(yīng)的 Page荣刑。

Q: 那索引里面存儲(chǔ)的是什么呢?

A: Clustered Index 里面包含了 索引列 和 page 的映射關(guān)系，而且直接指向了 page 中的行記錄, 而這也是Clustered Index 之所以快的原因伦乔。

Secondary Indexes

??MySQL 中有僅僅有一個(gè) Clustered Index厉亏，但是對(duì)于 Secondary Indexes 則可以存在多個(gè)(這也是兩個(gè) Index 的寫(xiě)法分單數(shù)復(fù)數(shù)的原因)。在 InnoDB 中所有的 Secondary Indexes 都是基于 Clustered Index 的烈和，每一個(gè) Secondary Index 都包含 Primary Keys, 也就是 Clustered Index 中的索引列爱只。

Q: Secondary Index 也是直接指向 page 中的記錄嗎？

A: Secondary Index 并不直接指向 page, 它先指向 Clustered Index 然后再指向 page 內(nèi)數(shù)據(jù) (這種情況也稱為回表)招刹。

Index-selective

Leftmost Prefix

當(dāng)有多列索引(multiple-column恬试，也叫聯(lián)合索引) 時(shí)，索引形式如(c1, c2, c3), 查詢條件如 (c1), (c1, c2) 以及 (c1, c2, c3) 均可利用到該索引疯暑。
Index-Extensions

InnoDB 自動(dòng)把 Primary Key 附加到 Secondary Index 后面训柴，如 PK(c1, c2), 同時(shí)也定義了 Secondary Index 其包含 (c3), InnoDB 內(nèi)部?jī)?yōu)化器 (optimizer) 會(huì)把其擴(kuò)展為 (c3, c1, c2) 的形式, 從而提高查詢效率。該功能需要通過(guò)指令 SET optimizer_switch = 'use_index_extensions=off' 進(jìn)行啟動(dòng)和停用妇拯，InnoDB 默認(rèn)屬于開(kāi)啟狀態(tài)幻馁。
Index-Merge

所謂索引融合，就是對(duì)多個(gè)索引進(jìn)行條件掃描乖阵，然后再把它們的結(jié)果合并宣赔。
Index-Cover

所謂索引覆蓋，就是查詢的列通過(guò)索引就能夠取得瞪浸，這種情況下不需要再定位到page去取數(shù)據(jù)儒将。避免了磁盤(pán)讀寫(xiě)、回表查詢等操作对蒲，所以這種情況比一般的索引查詢效率更高钩蚊。

pros and cons

??當(dāng)了解了索引的功效之后贡翘，我們是不是為表建立越多的索引越好呢? 并不如此，索引也有它的適用范圍砰逻，和代價(jià)鸣驱，所以并不是索引越多越好。

Pros

減少數(shù)據(jù)量的掃描蝠咆；
當(dāng)索引列有排序操作時(shí)踊东，可以避免服務(wù)端的排序與臨時(shí)表的產(chǎn)生；
可以把隨機(jī)的磁盤(pán) I/O 變?yōu)轫樞虻?I/O;

Cons

??當(dāng)數(shù)據(jù)量少的時(shí)候建立索引其實(shí)并沒(méi)有什么用刚操，如果數(shù)據(jù)量還不足一個(gè) page, 而 page 又是數(shù)據(jù)處理的最小單位闸翅，所以這個(gè)時(shí)候有沒(méi)有索引都一樣；那當(dāng)數(shù)據(jù)量很大的時(shí)候呢菊霜，這個(gè)時(shí)候如果數(shù)據(jù)量非常大坚冀，那么索引文件相應(yīng)的也變得很大，如果 MySQL 需要多次才能掃描完索引的內(nèi)容鉴逞，那么這時(shí)候索引也沒(méi)有用了记某，因?yàn)樗饕淖x取也得造成磁盤(pán)的 I/O, 且也不能短時(shí)間定位到對(duì)應(yīng)的數(shù)據(jù)。而且索引的建立也是有一定的代價(jià)的构捡，如每次插入數(shù)據(jù)時(shí)液南，相比于無(wú)索引情況需要另外的磁盤(pán)寫(xiě)操作，對(duì)應(yīng)的也占用更多的磁盤(pán)空間勾徽，讀取的時(shí)候相應(yīng)的也占用更多的內(nèi)存容量贺拣，數(shù)據(jù)更新隨之而來(lái)的也是索引更新成本。

Summary

??索引并不適用于所有的情況捂蕴，只有當(dāng)索引的成本小于它的代價(jià)時(shí)，才是有效的索引闪幽。所以建立索引時(shí)需要綜合考慮實(shí)際的業(yè)務(wù)場(chǎng)景啥辨，再結(jié)合 MySQL 查詢優(yōu)化器以及索引選擇原理才能夠建立適合自己業(yè)務(wù)的索引。

Appendix

B+tree 為什么快 ?
查詢到底什么了什么索引 ?
Page 詳細(xì)結(jié)構(gòu) ?
Record 詳細(xì)結(jié)構(gòu) ?

微信公眾號(hào)

最后編輯于：2019.11.07 23:22:14

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末盯腌，一起剝皮案震驚了整個(gè)濱河市溉知，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌腕够，老刑警劉巖级乍，帶你破解...
沈念sama閱讀 211,042評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異帚湘，居然都是意外死亡玫荣，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,996評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)大诸，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)捅厂，“玉大人贯卦，你說(shuō)我怎么就攤上這事”捍” “怎么了撵割？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,674評(píng)論 0贊 345
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)辙芍。經(jīng)常有香客問(wèn)我啡彬，道長(zhǎng)，這世上最難降的妖魔是什么故硅？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,340評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任庶灿，我火速辦了婚禮，結(jié)果婚禮上契吉，老公的妹妹穿的比我還像新娘跳仿。我一直安慰自己，他們只是感情好捐晶，可當(dāng)我...
茶點(diǎn)故事閱讀 65,404評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布菲语。她就那樣靜靜地躺著，像睡著了一般惑灵。火紅的嫁衣襯著肌膚如雪山上。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 49,749評(píng)論 1贊 289
城市分裂傳說(shuō)
那天英支，我揣著相機(jī)與錄音佩憾，去河邊找鬼。笑死干花，一個(gè)胖子當(dāng)著我的面吹牛妄帘，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播池凄，決...
沈念sama閱讀 38,902評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼抡驼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了肿仑？” 一聲冷哼從身側(cè)響起致盟，我...
開(kāi)封第一講書(shū)人閱讀 37,662評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎尤慰，沒(méi)想到半個(gè)月后馏锡，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,110評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡伟端，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,451評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年杯道，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片责蝠。...
茶點(diǎn)故事閱讀 38,577評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡蕉饼，死狀恐怖虐杯，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情昧港，我是刑警寧澤擎椰，帶...
沈念sama閱讀 34,258評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站创肥，受9級(jí)特大地震影響达舒，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜叹侄，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,848評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一巩搏、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧趾代，春花似錦贯底、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,726評(píng)論 0贊 21
一樁弒父案禽捆，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至飘哨，卻和暖如春胚想，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背芽隆。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,952評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工浊服，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人胚吁。一個(gè)月前我還...
沈念sama閱讀 46,271評(píng)論 2贊 360
代替公主和親
正文我出身青樓牙躺，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親腕扶。傳聞我的和親對(duì)象是個(gè)殘疾皇子述呐，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,452評(píng)論 2贊 348