MySQL索引之B+樹

1.mysql中睡互，myisam和innodb的引擎的表在磁盤上是怎么存儲的

2.什么是聚集（聚簇）索引喂急，什么是非聚集索引

簡單理解菩咨，數(shù)據(jù)和索引聚集在一個文件的是聚集索引丢烘，所以innodb使用的是聚集索引，
索引和表數(shù)據(jù)分開存儲的是非聚集索引国瓮，所以myisam使用的是非聚集索引
聚集規(guī)則：有主見索引則定義主鍵索引為聚簇索引灭必，沒有主鍵則選第一個不允許為null的唯一索引，否則使用innodb內置的rowid為聚簇索引
索引的高度決定了根據(jù)主鍵取數(shù)據(jù)的理論IO次數(shù)乃摹，理論上的總IO次數(shù)=非聚簇索引拿數(shù)據(jù)的IO次數(shù)+主鍵取數(shù)據(jù)的理論IO次數(shù)禁漓，實際上因為索引的分支節(jié)點所在的page因為多次讀取會在內存cache,所以實際IO>=理論IO
mysql默認的一個block是16KB去除掉元數(shù)據(jù)大概占128B(包括文件管理頭信息，頁面頭信息等)峡懈，大多數(shù)空間都用來存儲數(shù)據(jù)璃饱。

3.聚簇索引的好處

聚簇索引的數(shù)據(jù)的物理存放順序與索引順序是一致的，即：只要索引時相鄰的肪康，那么對應的數(shù)據(jù)一定也是相鄰地存放在磁盤上的荚恶。聚簇索引要比非聚簇索引查詢效率高很多撩穿。聚簇索引這種主+輔索引的好處是，當發(fā)生數(shù)據(jù)行移動或者頁分裂時谒撼，輔助索引樹不需要更新食寡，因為輔助索引樹存儲的是主索引的主鍵關鍵字，而不是具體的物理地址廓潜。

4.mysql為什么要使用B+樹做索引結構

1）二叉樹：對于遞增的數(shù)據(jù)抵皱，容易形成偏離，而成為一個鏈表結構
2）平衡二叉樹辩蛋，如紅黑樹之類：插入數(shù)據(jù)時候需要旋轉保持樹的平衡需要開銷呻畸，以及樹的高度會比較高，會提高查詢數(shù)據(jù)時候的磁盤IO次數(shù)
3）hash: 將數(shù)據(jù)索引哈希后存入哈希表悼院，查詢數(shù)據(jù)時伤为，哈希后去哈希表拿，復雜度為O(1),但是只能對于查詢條件為 id=1之類的語句据途，對于類似id>1就無能為力了
4）b樹：b樹的特點绞愚，1.葉節(jié)點具有相同的深度，葉節(jié)點的指針為空颖医，2.所有索引元素不重復位衩，
? ? ? 3.節(jié)點中的數(shù)據(jù)從左到右遞增排列

5）b+樹： b+樹是b樹的一個變種，特點：1.非葉子節(jié)點不存儲data,只存索引（冗余）熔萧，可以放更多的索引糖驴，2.葉子節(jié)點包含所有的索引字段，3葉子節(jié)點用指針鏈接哪痰，提高區(qū)間訪問性能

5.為什么一般數(shù)據(jù)表都要建立int型的主鍵遂赠，并且推薦使用自增的久妆？

1晌杰，使用int型，查找比較的時候更快筷弦，肋演，使用字符串的話，需要將字符串轉換成ASCII碼烂琴，然后再進行比較爹殊，，自增是因為mysql的索引都是按照順序存儲的奸绷，如果一頁剛好滿了16kb然后存入一個在他們之間的數(shù)梗夸，則會發(fā)生頁分裂，會消耗性能

最后編輯于：2020.07.19 12:53:32

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者