表
索引組織表
在InnoDB中,表都是根據(jù)主鍵順序組織存放的, 如果創(chuàng)建表時(shí)沒(méi)有顯示的指定主鍵,那么會(huì)按照下面
- 首先判斷表中是否有非空的唯一索引,如果有則取第一個(gè)定義的非空唯一索引為主鍵
- 如果沒(méi)有,則自動(dòng)創(chuàng)建6字節(jié)大小的指針
InnoDB邏輯存儲(chǔ)結(jié)構(gòu)
InnoDB將表空間分為段,區(qū),頁(yè)
表空間
表空間是InnoDB邏輯結(jié)構(gòu)的最高層,所有數(shù)據(jù)都放在表空間
如果開(kāi)啟innodb_file_per_table的參數(shù),表空間只保存數(shù)據(jù),索引和插入緩沖bitmap頁(yè),而undolog,插入緩沖索引頁(yè),系統(tǒng)事務(wù)信息,二次寫(xiě)緩沖等還在原來(lái)的共享表空間內(nèi)
段
表空間由各個(gè)端組成,常見(jiàn)的段有數(shù)據(jù)段,索引段,回滾段等,索引段為B+樹(shù)的非葉子節(jié)點(diǎn),數(shù)據(jù)段為B+樹(shù)的葉子節(jié)點(diǎn)
區(qū)
區(qū)是連續(xù)的頁(yè)組成的空間,在任何情況下區(qū)的大小都為1mb,為了保證區(qū)中頁(yè)的連續(xù)性,innodb每次從磁盤(pán)中申請(qǐng)4-5個(gè)區(qū),默認(rèn)情況下innodb的頁(yè)大小為16kb,因此一個(gè)區(qū)中有64個(gè)連續(xù)的頁(yè)
用戶啟用innodb_file_per_table,innodb會(huì)先用32個(gè)頁(yè)的碎片頁(yè)進(jìn)行存放數(shù)據(jù),使完后才會(huì)申請(qǐng)64個(gè)連續(xù)的頁(yè),這樣可以節(jié)省磁盤(pán)容量的開(kāi)銷(xiāo),解決小表或undo段
頁(yè)
頁(yè)是InnoDB磁盤(pán)管理的最小單位,每個(gè)頁(yè)大小設(shè)置完成后,只能通過(guò)mysqldump導(dǎo)入和導(dǎo)出產(chǎn)生新庫(kù)修改
- 數(shù)據(jù)頁(yè)
- undo頁(yè)
- 系統(tǒng)頁(yè)
- 事務(wù)數(shù)據(jù)頁(yè)
- 插入緩沖位圖頁(yè)
- 插入緩沖空閑列表頁(yè)
- 未壓縮的二進(jìn)制大對(duì)象頁(yè)
- 壓縮的二進(jìn)制大對(duì)象頁(yè)
行
innodb是面向行的,也就是數(shù)據(jù)是按照行進(jìn)行存放的,每個(gè)頁(yè)最多允許存放16kb的記錄
行記錄格式
innodb提供了compact和redundant兩種格式來(lái)存放行
compact行記錄格式
- 首部: 一個(gè)非空變長(zhǎng)字段長(zhǎng)度列表,并且是按照列的順序逆序放置的,若長(zhǎng)度小于255字節(jié),則用1個(gè)字節(jié)表示;若大于255個(gè)字節(jié),用2字節(jié)表示
- Null標(biāo)志位: 表示該行是有有Null值,有則是1,該部分占一個(gè)字節(jié)
- 記錄頭信息: 固定用5個(gè)字節(jié)表示
- 每個(gè)列實(shí)際存儲(chǔ)的數(shù)據(jù): Null不占該部分的任何空間,另外還有兩個(gè)隱藏列,事務(wù)ID列和回滾指針列,如果沒(méi)有定義主鍵,則還會(huì)增加一個(gè)rowid列
行溢出數(shù)據(jù)
mysql最大支持65532字節(jié)的varchar類(lèi)型,
Char類(lèi)型
InnoDB對(duì)Char類(lèi)型在多字節(jié)字符集類(lèi)型的存儲(chǔ)和變長(zhǎng)字符類(lèi)型相同,對(duì)于未滿長(zhǎng)度的還會(huì)填充0x20
InnoDB數(shù)據(jù)頁(yè)結(jié)構(gòu)
頁(yè)是InnoDB管理數(shù)據(jù)庫(kù)的最小磁盤(pán)單位,頁(yè)類(lèi)型為B-tree Node的頁(yè)存放的即是表中行的實(shí)際數(shù)據(jù)
頁(yè)的組成
-
File Header
記錄頁(yè)的一些頭信息
Page Header
記錄數(shù)據(jù)頁(yè)的狀態(tài)信息-
Infimum和Supremum Record
innodb中,每個(gè)頁(yè)都有兩個(gè)虛擬的行記錄,來(lái)限定記錄的邊界,Infimum是比該頁(yè)中任何主鍵值都小的值,Supremum是比任何可能大還要大的值
UserRecord 和FreeSpace
UseeRecord就是實(shí)際存儲(chǔ)行記錄的內(nèi)容,
FreeSpace就是空閑空間,是個(gè)鏈表的數(shù)據(jù)結(jié)構(gòu),一條記錄刪除后會(huì)放到空閑鏈表中Page Directory
存放了記錄的相對(duì)位置,不是偏移量,在InnoDB中是一個(gè)槽中可能會(huì)保存多個(gè)記錄
B+數(shù)索引本身不能查到具體的一條記錄,而是查到記錄所在的頁(yè),然后數(shù)據(jù)庫(kù)把頁(yè)載入到內(nèi)存中,通過(guò)pagedirectory進(jìn)行二叉查找File Trailer
檢測(cè)頁(yè)是否已經(jīng)完整地寫(xiě)入磁盤(pán)