MySQL索引原理

數(shù)據(jù)結(jié)構(gòu)

二叉排序樹（Binary Sort Tree）

規(guī)則

若左子樹不空，則左子樹上所有節(jié)點的值均小于它的根節(jié)點的值
若右子樹不空再菊，則右子樹上所有節(jié)點的值均大于它的根節(jié)點的值
它的左、右子樹也分別為二叉排序樹（遞歸定義）

說明

????二叉查找樹查找比較方便，因為每次經(jīng)過一次節(jié)點時语卤，最多減少一半的可能追逮。極端情況下酪刀，會出現(xiàn)所有節(jié)點位于同一側(cè)的情況，直觀上看就是一條直線钮孵，這種情況的查詢效率比較低骂倘。因此需要對二叉樹左右子樹的高度作平衡化處理，這就是平衡二叉樹巴席。

平衡二叉樹（Balance Binary Tree）

規(guī)則

左右子樹的高度差的絕對值不超過1
左右子樹都是平衡二叉樹（遞歸定義）

說明

????常見的實現(xiàn)方式為：紅黑樹历涝，平衡二叉查找樹（AVL）,替罪羊樹，樹堆（Treap）漾唉，伸展樹荧库。在這樣的平衡樹中進行查找，總共比較節(jié)點的次數(shù)不超過樹的高度赵刑，查詢效率得到提高分衫，時間復(fù)雜度為O(logn)。

平衡多路查找樹（B樹或B-樹）

規(guī)則

每個節(jié)點至多可以擁有m棵子樹
根節(jié)點般此，只有至少2個節(jié)點
非根非葉的節(jié)點至少有Ceil(m/2)個子樹（Ceil表示向上取整）蚪战，例如5階B樹牵现，每個節(jié)點至少3個子樹
所有葉子節(jié)點位于同一層，意思是從根到葉子節(jié)點的每一條路徑都有同樣的長度

說明

????B樹查詢與二叉排序樹類似邀桑，從根節(jié)點依次比較每個節(jié)點瞎疼，因為每個節(jié)點中關(guān)鍵字和左右子樹都是有序的。

B+樹

規(guī)則

有n棵子樹的節(jié)點含有n個關(guān)鍵字壁畸，每個關(guān)鍵字不保存數(shù)據(jù)贼急，只用來索引，所有數(shù)據(jù)保存在葉子節(jié)點
所有的葉子結(jié)點中包含了全部關(guān)鍵字的信息捏萍，及指向含這些關(guān)鍵字記錄的指針竿裂，且葉子結(jié)點本身依關(guān)鍵字的大小自小而大順序鏈接
非葉子節(jié)點看成是索引部分，結(jié)點中僅含其子樹（根節(jié)點）中的最大（或最姓彰帧）關(guān)鍵字

說明

????B+樹查找過程與B樹類似腻异，只不過查找時，如果在非葉子節(jié)點上的關(guān)鍵字等于給定值这揣，并不終止悔常，而是繼續(xù)沿著指針直到葉子節(jié)點。因此對于B+樹给赞，不管查找成功或失敗机打，每次查找都是走了一條從根到葉子節(jié)點的路徑。

????通常在B+Tree上有兩個頭指針片迅，一個指向根節(jié)點残邀，另一個指向關(guān)鍵字最小的葉子節(jié)點，而且所有葉子節(jié)點（即數(shù)據(jù)節(jié)點）之間是一種鏈?zhǔn)江h(huán)結(jié)構(gòu)（雙向循環(huán)鏈表）柑蛇。因此可以對B+Tree進行兩種查找運算：一種是對于主鍵的范圍查找和分頁查找芥挣，另一種是從根節(jié)點開始，進行隨機查找耻台。

實現(xiàn)

MyISAM索引實現(xiàn)

????MyISAM引擎使用B+Tree作為索引結(jié)構(gòu)空免，葉結(jié)點的data域存放的是數(shù)據(jù)記錄的地址。

主索引(主鍵)

輔助索引

????在 MyISAM 中,主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別盆耽，只是主索引要求 key 是唯一的,而輔助索引的 key 可以重復(fù)蹋砚。

說明

????同樣也是一顆B+Tree，data域保存數(shù)據(jù)記錄的地址摄杂。因此坝咐，MyISAM中索引檢索的算法為首先按照B+Tree搜索算法搜索索引，如果指定的Key存在析恢，則取出其data域的值墨坚，然后以data域的值為地址，讀取相應(yīng)數(shù)據(jù)記錄氮昧。

????MyISAM的索引方式也叫做“非聚集”的框杜，之所以這么稱呼是為了與InnoDB的聚集索引區(qū)分浦楣。

InnoDB索引實現(xiàn)

????雖然InnoDB也使用B+Tree作為索引結(jié)構(gòu)，但具體實現(xiàn)方式卻與MyISAM截然不同咪辱。

????第一個重大區(qū)別是InnoDB的數(shù)據(jù)文件本身就是索引文件振劳。從上文知道，MyISAM索引文件和數(shù)據(jù)文件是分離的油狂，索引文件僅保存數(shù)據(jù)記錄的地址历恐。而在InnoDB中，表數(shù)據(jù)文件本身就是按B+Tree組織的一個索引結(jié)構(gòu)专筷，這棵樹的葉結(jié)點data域保存了完整的數(shù)據(jù)記錄弱贼。這個索引的key是數(shù)據(jù)表的主鍵，因此InnoDB表數(shù)據(jù)文件本身就是主索引磷蛹。

主索引(主鍵)

輔助索引

說明

????InnoDB存儲引擎中頁的大小為16KB吮旅，一般表的主鍵類型為INT（占用4個字節(jié)）或BIGINT（占用8個字節(jié)），指針類型也一般為4或8個字節(jié)味咳，也就是說一個頁（B+Tree中的一個節(jié)點）中大概存儲16KB/(8B+8B)=1K個鍵值（因為是估值庇勃，為方便計算，這里的K取值為10^{3）槽驶。也就是說一個深度為3的B+Tree索引可以維護10}3 * 10^3 * 10^3 = 10億條記錄责嚷。實際情況中每個節(jié)點可能不能填充滿，因此在數(shù)據(jù)庫中掂铐，B+Tree的高度一般都在2~4層罕拂。mysql的InnoDB存儲引擎在設(shè)計時是將根節(jié)點常駐內(nèi)存的，也就是說查找某一鍵值的行記錄時最多只需要1~3次磁盤I/O操作全陨。

????InnoDB 要求表必須有主鍵(MyISAM 可以沒有)爆班，如果沒有顯式指定，則 MySQL系統(tǒng)會自動選擇一個可以唯一標(biāo)識數(shù)據(jù)記錄的列作為主鍵,如果不存在這種列烤镐，則MySQL 自動為 InnoDB 表生成一個隱含字段作為主鍵,類型為長整形蛋济。

????同時,請盡量在 InnoDB 上采用自增字段做表的主鍵棍鳖。因為 InnoDB 數(shù)據(jù)文件本身是一棵B+Tree炮叶，非單調(diào)的主鍵會造成在插入新記錄時數(shù)據(jù)文件為了維持 B+Tree 的特性而頻繁的分裂調(diào)整，十分低效,而使用自增字段作為主鍵則是一個很好的選擇渡处。如果表使用自增主鍵,那么每次插入新的記錄镜悉，記錄就會順序添加到當(dāng)前索引節(jié)點的后續(xù)位置，當(dāng)一頁寫滿,就會自動開辟一個新的頁医瘫。

聚簇索引

????InnoDB 使用的是聚簇索引侣肄，將主鍵組織到一棵B+樹中，而行數(shù)據(jù)就儲存在葉子節(jié)點上醇份，若使用"where id = 14"這樣的條件查找主鍵稼锅，則按照 B+樹的檢索算法即可查找到對應(yīng)的葉節(jié)點吼具，之后獲得行數(shù)據(jù)。若對 Name 列進行條件搜索矩距，則需要兩個步驟:

第一步拗盒、在輔助索引 B+樹中檢索 Name，到達其葉子節(jié)點獲取對應(yīng)的主鍵锥债。
第二步陡蝇、使用主鍵在主索引B+樹種再執(zhí)行一次 B+樹檢索操作，最終到達葉子節(jié)點即可獲取整行數(shù)據(jù)哮肚。

非聚簇索引

????MyISM 使用的是非聚簇索引, 非聚簇索引的兩棵 B+樹看上去沒什么不同, 節(jié)點的結(jié)構(gòu)完全一致只是存儲的內(nèi)容不同而已, 主鍵索引 B+樹的節(jié)點存儲了主鍵, 輔助鍵索引B+樹存儲了輔助鍵登夫。表數(shù)據(jù)存儲在獨立的地方, 這兩顆 B+樹的葉子節(jié)點都使用一個地址指向真正的表數(shù)據(jù), 對于表數(shù)據(jù)來說, 這兩個鍵沒有任何差別。由于索引樹是獨立的, 通過輔助鍵檢索無需訪問主鍵的索引樹允趟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末恼策，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子潮剪，更是在濱河造成了極大的恐慌戏蔑，老刑警劉巖，帶你破解...
沈念sama閱讀 218,546評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件鲁纠，死亡現(xiàn)場離奇詭異总棵，居然都是意外死亡，警方通過查閱死者的電腦和手機改含，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門情龄，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人捍壤，你說我怎么就攤上這事骤视。” “怎么了鹃觉？”我有些...
開封第一講書人閱讀 164,911評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵专酗，是天一觀的道長。經(jīng)常有香客問我盗扇，道長祷肯，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,737評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任疗隶，我火速辦了婚禮佑笋，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘斑鼻。我一直安慰自己蒋纬，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,753評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著蜀备，像睡著了一般关摇。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上碾阁，一...
開封第一講書人閱讀 51,598評論 1贊 305
城市分裂傳說
那天拒垃，我揣著相機與錄音，去河邊找鬼瓷蛙。笑死悼瓮，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的艰猬。我是一名探鬼主播横堡，決...
沈念sama閱讀 40,338評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼冠桃！你這毒婦竟也來了命贴？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,249評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤食听，失蹤者是張志新（化名）和其女友劉穎胸蛛，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體樱报，經(jīng)...
沈念sama閱讀 45,696評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡葬项，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,888評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了迹蛤。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片民珍。...
茶點故事閱讀 40,013評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖盗飒，靈堂內(nèi)的尸體忽然破棺而出嚷量，到底是詐尸還是另有隱情，我是刑警寧澤逆趣，帶...
沈念sama閱讀 35,731評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布蝶溶，位于F島的核電站，受9級特大地震影響宣渗，放射性物質(zhì)發(fā)生泄漏抖所。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,348評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一落包、第九天我趴在偏房一處隱蔽的房頂上張望部蛇。院中可真熱鬧，春花似錦咐蝇、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評論 0贊 22
一樁弒父案有序，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽抹腿。三九已至，卻和暖如春旭寿，著一層夾襖步出監(jiān)牢的瞬間警绩，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,048評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工盅称，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留肩祥，地道東北人。一個月前我還...
沈念sama閱讀 48,203評論 3贊 370
代替公主和親
正文我出身青樓缩膝，卻偏偏與公主長得像混狠，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子疾层，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,960評論 2贊 355

MySQL索引原理

數(shù)據(jù)結(jié)構(gòu)

二叉排序樹（Binary Sort Tree）

規(guī)則

說明

平衡二叉樹（Balance Binary Tree）

規(guī)則

說明

平衡多路查找樹（B樹或B-樹）

規(guī)則

說明

B+樹

規(guī)則

說明

實現(xiàn)

MyISAM索引實現(xiàn)

主索引(主鍵)

輔助索引

說明

InnoDB索引實現(xiàn)

主索引(主鍵)

輔助索引

說明

聚簇索引

非聚簇索引

推薦閱讀更多精彩內(nèi)容