1.mysql中睡互,myisam和innodb的引擎的表在磁盤上是怎么存儲的
2.什么是聚集(聚簇)索引喂急,什么是非聚集索引
簡單理解菩咨,數(shù)據(jù)和索引聚集在一個文件的是聚集索引丢烘,所以innodb使用的是聚集索引,
索引和表數(shù)據(jù)分開存儲的是非聚集索引国瓮,所以myisam使用的是非聚集索引
聚集規(guī)則:有主見索引則定義主鍵索引為聚簇索引灭必,沒有主鍵則選第一個不允許為null的唯一索引,否則使用innodb內置的rowid為聚簇索引
索引的高度決定了根據(jù)主鍵取數(shù)據(jù)的理論IO次數(shù)乃摹,理論上的總IO次數(shù)=非聚簇索引拿數(shù)據(jù)的IO次數(shù)+主鍵取數(shù)據(jù)的理論IO次數(shù)禁漓,實際上因為索引的分支節(jié)點所在的page因為多次讀取會在內存cache,所以實際IO>=理論IO
mysql默認的一個block是16KB去除掉元數(shù)據(jù)大概占128B(包括文件管理頭信息,頁面頭信息等)峡懈,大多數(shù)空間都用來存儲數(shù)據(jù)璃饱。
3.聚簇索引的好處
聚簇索引的數(shù)據(jù)的物理存放順序與索引順序是一致的,即:只要索引時相鄰的肪康,那么對應的數(shù)據(jù)一定也是相鄰地存放在磁盤上的荚恶。聚簇索引要比非聚簇索引查詢效率高很多撩穿。聚簇索引這種主+輔索引的好處是,當發(fā)生數(shù)據(jù)行移動或者頁分裂時谒撼,輔助索引樹不需要更新食寡,因為輔助索引樹存儲的是主索引的主鍵關鍵字,而不是具體的物理地址廓潜。
4.mysql為什么要使用B+樹做索引結構
1)二叉樹:對于遞增的數(shù)據(jù)抵皱,容易形成偏離,而成為一個鏈表結構
2)平衡二叉樹辩蛋,如紅黑樹之類:插入數(shù)據(jù)時候需要旋轉保持樹的平衡需要開銷呻畸,以及樹的高度會比較高,會提高查詢數(shù)據(jù)時候的磁盤IO次數(shù)
3)hash: 將數(shù)據(jù)索引哈希后存入哈希表悼院,查詢數(shù)據(jù)時伤为,哈希后去哈希表拿,復雜度為O(1),但是只能對于查詢條件為 id=1之類的語句据途,對于類似id>1就無能為力了
4)b樹:b樹的特點绞愚,1.葉節(jié)點具有相同的深度,葉節(jié)點的指針為空颖医,2.所有索引元素不重復位衩,
? ? ? 3.節(jié)點中的數(shù)據(jù)從左到右遞增排列
5)b+樹: b+樹是b樹的一個變種,特點:1.非葉子節(jié)點不存儲data,只存索引(冗余)熔萧,可以放更多的索引糖驴,2.葉子節(jié)點包含所有的索引字段,3葉子節(jié)點用指針鏈接哪痰,提高區(qū)間訪問性能
5.為什么一般數(shù)據(jù)表都要建立int型的主鍵遂赠,并且推薦使用自增的久妆?
1晌杰,使用int型,查找比較的時候更快筷弦,肋演,使用字符串的話,需要將字符串轉換成ASCII碼烂琴,然后再進行比較爹殊,,自增是因為mysql的索引都是按照順序存儲的奸绷,如果一頁剛好滿了16kb然后存入一個在他們之間的數(shù)梗夸,則會發(fā)生頁分裂,會消耗性能