在講解InnoDB的MVCC機(jī)制之前,我們應(yīng)該了解MySQL所支持的事務(wù),以及各個(gè)事務(wù)級(jí)別的區(qū)別和每一個(gè)事務(wù)級(jí)別所存在的問(wèn)題。
1. 事務(wù)
事務(wù)必須保證ACID溶其,而ACID表示原子性凝垛、一致性、隔離性和持久性
1.1 事務(wù)的隔離級(jí)別
事務(wù)可以通過(guò)start transaction
語(yǔ)句開(kāi)始一個(gè)事務(wù)窗悯,然后要么使用commit
提交事務(wù)將所修改的數(shù)據(jù)持久保存区匣,要么使用rollback
撤銷所有修改
1.1.2 READ UNCOMMITTED (未提交讀 RU)
在READ UNCOMMITTED級(jí)別,事務(wù)中的修改蟀瞧,即使沒(méi)有提交沉颂,對(duì)其他事務(wù)也都是可見(jiàn)的条摸。事務(wù)可以讀取未提交的數(shù)據(jù),這也被稱為臟讀铸屉。
1.1.3 READ COMMITTED (提交讀 RC)
大多數(shù)的數(shù)據(jù)庫(kù)系統(tǒng)的默認(rèn)隔離級(jí)別都是READ COMMITTED(MySQL 不是)钉蒲。READ COMMITTED滿足前面提到的隔離級(jí)別的簡(jiǎn)單定義:一個(gè)事務(wù)開(kāi)始時(shí),只能“看見(jiàn)” 已提交的事務(wù)所做的修改彻坛。換句話說(shuō)顷啼,一個(gè)事務(wù)從開(kāi)始知道提交之前,所做的任何修改對(duì)其他事務(wù)都是不可見(jiàn)的昌屉。這個(gè)級(jí)別也叫不可重復(fù)讀钙蒙,因?yàn)樵谕皇聞?wù)內(nèi)執(zhí)行兩次相同的查詢,可能會(huì)得到不一樣的結(jié)果间驮。
例子: 當(dāng)事務(wù)的隔離級(jí)別在RC級(jí)別的時(shí)候躬厌,事務(wù)A和事務(wù)B同時(shí)對(duì)數(shù)據(jù)D操作,當(dāng)事務(wù)A開(kāi)始的時(shí)候竞帽,讀取的數(shù)據(jù)D保存下來(lái)了扛施,這是事務(wù)B也在修改數(shù)據(jù)D,并且先于事務(wù)A提交屹篓。這是事務(wù)A再讀數(shù)據(jù)D的時(shí)候疙渣,就會(huì)出現(xiàn)前后不一致情況,這就是所謂的不可重復(fù)讀堆巧。
1.1.4 REPEATABLE READ (可重復(fù)讀 RR)
這是MySQL的默認(rèn)事務(wù)隔離級(jí)別妄荔,它確保同一事務(wù)的多個(gè)實(shí)例在并發(fā)讀取數(shù)據(jù)時(shí),會(huì)看到同樣的數(shù)據(jù)行谍肤。不過(guò)理論上啦租,這會(huì)導(dǎo)致另一個(gè)棘手的問(wèn)題:幻讀 (Phantom Read)。簡(jiǎn)單的說(shuō)谣沸,幻讀指當(dāng)用戶讀取某一范圍的數(shù)據(jù)行時(shí)刷钢,另一個(gè)事務(wù)又在該范圍內(nèi)插入了新行,當(dāng)用戶再讀取該范圍的數(shù)據(jù)行時(shí)乳附,會(huì)發(fā)現(xiàn)有新的“幻影” 行内地。InnoDB和Falcon存儲(chǔ)引擎通過(guò)多版本并發(fā)控制(MVCC,Multiversion Concurrency Control)機(jī)制解決了該問(wèn)題赋除。
例子:mysql的默認(rèn)事務(wù)隔離級(jí)別是RR級(jí)別的阱缓,同樣是上述例子,當(dāng)時(shí)不同的是當(dāng)事務(wù)A和事務(wù)B開(kāi)始的時(shí)候举农,都保存一份自己的快照荆针,每一份快照中都有數(shù)據(jù)D的值,所以這樣在同一事務(wù)中,無(wú)論重讀讀多少次都是正確的航背。
例子:在RR級(jí)別中喉悴,可能出現(xiàn)幻讀。同樣是上述例子玖媚,事務(wù)A和事務(wù)B同時(shí)查詢數(shù)據(jù)D箕肃,事務(wù)A發(fā)現(xiàn)數(shù)據(jù)D為空,就想插入數(shù)據(jù)今魔,但是這是事務(wù)B已經(jīng)插入了數(shù)據(jù)D并且已經(jīng)提交勺像。這時(shí)事務(wù)A的提交就會(huì)出錯(cuò)。這是因?yàn)槭聞?wù)A的寫操作是當(dāng)前讀操作错森。
1.1.5 SERIALIZABLE (可串行化 S)
這是最高的隔離級(jí)別吟宦,它通過(guò)強(qiáng)制事務(wù)排序,使之不可能相互沖突涩维,從而解決幻讀問(wèn)題殃姓。簡(jiǎn)言之,它是在每個(gè)讀的數(shù)據(jù)行上加上共享鎖瓦阐。在這個(gè)級(jí)別辰狡,可能導(dǎo)致大量的超時(shí)現(xiàn)象和鎖競(jìng)爭(zhēng)。
隔離級(jí)別 | 臟讀可能性 | 不可重復(fù)可能性 | 幻讀可能性 | 加鎖讀 |
---|---|---|---|---|
READ UNCOMMITTED | Yes | Yes | Yes | No |
READ COMMITTED | No | Yes | Yes | No |
REPEATABLE READ | No | No | Yes | No |
SERIALIZABLE | No | No | No | Yes |
2. MVCC機(jī)制
InnoDB的一致性的非鎖定讀就是通過(guò)在MVCC實(shí)現(xiàn)的垄分,Mysql的大多數(shù)事務(wù)型存儲(chǔ)引擎實(shí)現(xiàn)的都不是簡(jiǎn)單的行級(jí)鎖⊥藁牵基于提升并發(fā)性能的考慮薄湿,它們一般都同時(shí)實(shí)現(xiàn)了多版本并發(fā)控制(MVCC)。MVCC的實(shí)現(xiàn)偷卧,是通過(guò)保存數(shù)據(jù)在某一個(gè)時(shí)間點(diǎn)的快照來(lái)實(shí)現(xiàn)的豺瘤。因此每一個(gè)事務(wù)無(wú)論執(zhí)行多長(zhǎng)時(shí)間看到的數(shù)據(jù),都是一樣的听诸。所以MVCC實(shí)現(xiàn)可重復(fù)讀坐求。
- 快照讀:select語(yǔ)句默認(rèn),不加鎖晌梨,MVCC實(shí)現(xiàn)可重復(fù)讀桥嗤,使用的是MVCC機(jī)制讀取undo中的已經(jīng)提交的數(shù)據(jù)。所以它的讀取是非阻塞的
- 當(dāng)前讀:select語(yǔ)句加S鎖或X鎖仔蝌;所有的修改操作加X(jué)鎖泛领,在select for update 的時(shí)候,才是當(dāng)?shù)厍白x敛惊。
RR隔離級(jí)別下的快照讀渊鞋,不是以begin開(kāi)始的時(shí)間點(diǎn)作為snapshot建立時(shí)間點(diǎn),而是以第一條select語(yǔ)句的時(shí)間點(diǎn)作為snapshot建立的時(shí)間點(diǎn)。
2.1. MVCC依賴數(shù)據(jù)
行記錄隱藏字段
- db_row_id锡宋,行ID儡湾,用來(lái)生成默認(rèn)聚簇索引(聚簇索引,保存的數(shù)據(jù)在物理磁盤中按順序保存执俩,這樣相關(guān)數(shù)據(jù)保存在一起徐钠,提高查詢速度)
- db_trx_id,事務(wù)ID奠滑,新開(kāi)始一個(gè)事務(wù)時(shí)生成丹皱,實(shí)例內(nèi)全局唯一
- db_roll_ptr,undo log指針宋税,指向?qū)?yīng)記錄當(dāng)前的undo log
- deleted_bit摊崭,刪除標(biāo)記位,刪除時(shí)設(shè)置
undo log
-
用于行記錄回滾杰赛,同時(shí)用于實(shí)現(xiàn)MVCC
圖片1.png
2.2 操作方式
- update
- 行記錄數(shù)據(jù)寫入undo log,事務(wù)的回滾操作就需要undo log
- 更新行記錄數(shù)據(jù)呢簸,當(dāng)前事務(wù)ID寫入db_trx_id,undo log指針寫入db_roll_ptr
- delete
- 和update一樣乏屯,只增加deleted_bit設(shè)置
- insert
- 生成undo log
- 插入行記錄數(shù)據(jù)根时,當(dāng)前事務(wù)ID寫入db_trx_id, db_roll_ptr為空
這樣設(shè)計(jì)使得讀操作很簡(jiǎn)單辰晕,性能很好蛤迎,并且也能保證只會(huì)讀到符合標(biāo)準(zhǔn)的行,不足之處是每行記錄都需要額外的儲(chǔ)存空間含友,需要做更多的行檢查工作替裆,以及額外的維護(hù)工作
2.3 MVCC如何實(shí)現(xiàn)RR
- RR定義:在一個(gè)事務(wù)內(nèi)同一快照讀執(zhí)行任意次數(shù),得到的數(shù)據(jù)一致窘问;且只能讀到第一次執(zhí)行前已經(jīng)提交的數(shù)據(jù)或本事務(wù)內(nèi)更改的數(shù)據(jù)
- 原理:對(duì)符合查詢條件的記錄進(jìn)行可見(jiàn)性判斷(就是那些數(shù)據(jù)本事務(wù)可以看見(jiàn)辆童,那些數(shù)據(jù)看不見(jiàn))
- read view:記錄當(dāng)前處于活動(dòng)狀態(tài)的所有事務(wù)ID,RR級(jí)別下惠赫,第一次快照讀時(shí)創(chuàng)建把鉴,RC級(jí)別下,每次快照讀均會(huì)創(chuàng)建新的
- 缺點(diǎn): 可能出現(xiàn)幻讀
3 總結(jié)
在事務(wù)隔離級(jí)別為RC和RR級(jí)別下儿咱, InnnoDB存儲(chǔ)引擎使用的才是多版本并發(fā)控制庭砍。然而,對(duì)于快照數(shù)據(jù)的定義卻不相同混埠。在RC事務(wù)隔離級(jí)別下逗威,對(duì)于快照數(shù)據(jù)(undo端數(shù)據(jù)),總是讀取被鎖定行的最新的一份快照數(shù)據(jù)岔冀。而在RR事務(wù)隔離級(jí)別下凯旭,對(duì)于快照數(shù)據(jù)概耻,多版本并發(fā)控制總是讀取事務(wù)開(kāi)始時(shí)的行數(shù)據(jù)。