前言
說(shuō)道數(shù)據(jù)庫(kù)就避免不了兩個(gè)內(nèi)容,索引與隔離級(jí)別屠升。以下內(nèi)容為兩篇介紹這個(gè)內(nèi)容比較好的文章:
美團(tuán)點(diǎn)評(píng)團(tuán)隊(duì):Innodb中的事務(wù)隔離級(jí)別和鎖的關(guān)系
張洋先生的:MySQL索引背后的數(shù)據(jù)結(jié)構(gòu)及算法原理
關(guān)于MySQL的隔離級(jí)別,介紹的文章有許多,但是多數(shù)都是止于介紹,所以每次看完都只是有個(gè)概念上的認(rèn)識(shí)官辽,但是具體的理解還需要個(gè)人去體會(huì)。所以寫下這篇博文來(lái)記錄下點(diǎn)滴與理解粟瞬。
說(shuō)明:為了能夠更加形象的去理解以下的內(nèi)容同仆,特別推薦去親自進(jìn)行嘗試。比如開兩個(gè)MySQL的客戶端應(yīng)該是最簡(jiǎn)單的方式裙品,然后利用BEGIN俗批,COMMINT等方式進(jìn)行模擬
四種隔離級(jí)別
隔離級(jí)別 | 臟讀(Dirty Read) | 不可重復(fù)讀(NonRepeatable Read) | 幻讀(Phantom Read) | 說(shuō)明 |
---|---|---|---|---|
未提交讀(Read uncommitted/RU) | 可能 | 可能 | 可能 | 允許臟讀,也就是可能讀取到其他會(huì)話中未提交事務(wù)修改的數(shù)據(jù) |
已提交讀(Read committed/RC) | 不可能 | 可能 | 可能 | 只能讀取到已經(jīng)提交的數(shù)據(jù)市怎。Oracle等多數(shù)數(shù)據(jù)庫(kù)默認(rèn)都是該級(jí)別 (不重復(fù)讀) |
可重復(fù)讀(Repeatable read/RR) | 不可能 | 不可能 | 可能 | 可重復(fù)讀扶镀。在同一個(gè)事務(wù)內(nèi)的查詢都是事務(wù)開始時(shí)刻一致的,InnoDB默認(rèn)級(jí)別焰轻。在SQL標(biāo)準(zhǔn)中臭觉,該隔離級(jí)別消除了不可重復(fù)讀,但是還存在幻象讀 |
可串行化(Serializable) | 不可能 | 不可能 | 不可能 | 完全串行化的讀辱志,每次讀都需要獲得表級(jí)共享鎖蝠筑,讀寫相互都會(huì)阻 |
為了理解上面的內(nèi)容,我們首先需要理解下臟讀揩懒,不可重復(fù)讀什乙,幻讀的概念。
-
臟讀:
臟讀概念的關(guān)鍵為臟已球,臟我們可以理解為假的臣镣,臟數(shù)據(jù)。也就是兩個(gè)事務(wù)A和事務(wù)B智亮。事務(wù)B在事務(wù)中修改了數(shù)據(jù)忆某,此時(shí)事務(wù)A是能夠讀到事務(wù)B中修改的數(shù)據(jù),而此時(shí)如果事務(wù)B中發(fā)生了異常進(jìn)行了回滾阔蛉,則事務(wù)A中讀到的數(shù)據(jù)實(shí)際是臟數(shù)據(jù)弃舒,這就是所謂的臟讀。根據(jù)以上的描述我們也不難理解為什么RU(未提交讀)無(wú)法避免臟讀的問(wèn)題。 -
不可重復(fù)讀:
不可重讀讀指的是事務(wù)A和事務(wù)B聋呢,比如在事務(wù)A中進(jìn)行id = 1的數(shù)據(jù)的讀取苗踪,而事務(wù)B之后對(duì)id = 2的數(shù)據(jù)進(jìn)行了update并提交。此時(shí)在事務(wù)A中如果此時(shí)在進(jìn)行id = 1的讀取的話削锰,會(huì)發(fā)現(xiàn)讀取的內(nèi)容與上次的內(nèi)容不同通铲。這就是所謂的不可重復(fù)讀,對(duì)應(yīng)的是隔離級(jí)別的RC器贩。 -
幻讀
幻讀的概念需要好好理解下颅夺。實(shí)際想要理解幻讀首先需要理解MySQL中的兩種讀的區(qū)別:
快照讀(snapshot read)和當(dāng)前讀(current read)。產(chǎn)生這兩種讀的區(qū)別主要是由于MySQL所采用的MVCC的版本控制來(lái)進(jìn)行樂(lè)觀鎖機(jī)制磨澡。
我們下面摘取Innodb中的事務(wù)隔離級(jí)別和鎖的關(guān)系來(lái)進(jìn)行下解釋:
可能有讀者會(huì)疑惑碗啄,事務(wù)的隔離級(jí)別其實(shí)都是對(duì)于讀數(shù)據(jù)的定義质和,但到了這里稳摄,就被拆成了讀和寫兩個(gè)模塊來(lái)講解。這主要是因?yàn)镸ySQL中的讀饲宿,和事務(wù)隔離級(jí)別中的讀厦酬,是不一樣的。
我們且看瘫想,在RR級(jí)別中仗阅,通過(guò)MVCC機(jī)制,雖然讓數(shù)據(jù)變得可重復(fù)讀国夜,但我們讀到的數(shù)據(jù)可能是歷史數(shù)據(jù)减噪,是不及時(shí)的數(shù)據(jù),不是數(shù)據(jù)庫(kù)當(dāng)前的數(shù)據(jù)车吹!這在一些對(duì)于數(shù)據(jù)的時(shí)效特別敏感的業(yè)務(wù)中筹裕,就很可能出問(wèn)題。
對(duì)于這種讀取歷史數(shù)據(jù)的方式窄驹,我們叫它快照讀 (snapshot read)朝卒,而讀取數(shù)據(jù)庫(kù)當(dāng)前版本數(shù)據(jù)的方式,叫當(dāng)前讀 (current read)乐埠。很顯然抗斤,在MVCC中:
快照讀:就是select
select * from table ....;
當(dāng)前讀:特殊的讀操作,插入/更新/刪除操作丈咐,屬于當(dāng)前讀瑞眼,處理的都是當(dāng)前的數(shù)據(jù),需要加鎖棵逊。
select * from table where ? lock in share mode;
select * from table where ? for update;
insert;
update ;
delete;
事務(wù)A | 事務(wù)B |
---|---|
BEGIN | BEGIN |
SELECT * FROM tb_task; | |
INSERT INTO tb_task(id, name) VALUES(100, '111'); | |
COMMIT; | |
UPDATE tb_task SET name = '123'; | |
COMMIT |
而理解以上的概念對(duì)于理解幻讀較為重要负拟。實(shí)際幻讀產(chǎn)生的原因就是由于當(dāng)前讀造成的,所以往往產(chǎn)生幻讀發(fā)生在Insert, Update, Delete等操作歹河。
比如有兩個(gè)事務(wù)A和B:
事務(wù)A | 事務(wù)B |
---|---|
BEGIN | BEGIN |
SELECT * FROM tb_task; | |
INSERT INTO tb_task(id, name) VALUES(100, '111'); | |
COMMIT; | |
UPDATE tb_task SET name = '123'; | |
COMMIT |
也就是在事務(wù)A中我們來(lái)SELECT時(shí)發(fā)現(xiàn)只有一條數(shù)據(jù)掩浙,但是我們?cè)谶M(jìn)行更新的時(shí)候卻會(huì)更新兩條數(shù)據(jù)(由于事務(wù)B插入了一條新的數(shù)據(jù)并進(jìn)行了提交)花吟。
在許多時(shí)候我們可能會(huì)遇到幻讀的問(wèn)題,比如我們?cè)谑聞?wù)A中對(duì)于id=1的數(shù)據(jù)進(jìn)行更新操作厨姚,但是在之前事務(wù)B對(duì)于id=1的數(shù)據(jù)進(jìn)行了刪除衅澈。則此時(shí)事務(wù)A將會(huì)更新0條數(shù)據(jù)而不是我們預(yù)期的1條數(shù)據(jù)。
鎖
Innodb的默認(rèn)隔離級(jí)別是RR谬墙,是通過(guò)MVCC和行鎖來(lái)進(jìn)行鎖定的今布。
MVCC主要是針對(duì)的讀,而鎖主要是為了寫產(chǎn)生沖突拭抬。
一段鎖或兩段鎖
事務(wù)A | 事務(wù)B |
---|---|
begin; | begin; |
update class_teacher set class_name='初三二班' where teacher_id=1; | update class_teacher set class_name='初三三班' where teacher_id=1; |
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction | |
commit; |
因?yàn)橛写罅康牟l(fā)訪問(wèn)部默,為了預(yù)防死鎖,一般應(yīng)用中推薦使用一次封鎖法造虎,就是在方法的開始階段傅蹂,已經(jīng)預(yù)先知道會(huì)用到哪些數(shù)據(jù),然后全部鎖住算凿,在方法運(yùn)行之后份蝴,再全部解鎖。這種方式可以有效的避免循環(huán)死鎖氓轰,但在數(shù)據(jù)庫(kù)中卻不適用婚夫,因?yàn)樵谑聞?wù)開始階段,數(shù)據(jù)庫(kù)并不知道會(huì)用到哪些數(shù)據(jù)署鸡。
數(shù)據(jù)庫(kù)遵循的是兩段鎖協(xié)議案糙,將事務(wù)分成兩個(gè)階段,加鎖階段和解鎖階段(所以叫兩段鎖)靴庆。
我們拿以下的例子進(jìn)行介紹(出自博客Innodb中的事務(wù)隔離級(jí)別和鎖的關(guān)系):
事務(wù)A | 事務(wù)B |
---|---|
begin; | begin; |
update class_teacher set class_name='初三二班' where teacher_id=1; | update class_teacher set class_name='初三三班' where teacher_id=1; |
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction | |
commit; |
為了防止并發(fā)過(guò)程中的修改沖突时捌,事務(wù)A中MySQL給teacher_id=1的數(shù)據(jù)行加鎖,并一直不commit(釋放鎖)撒穷,那么事務(wù)B也就一直拿不到該行鎖匣椰,wait直到超時(shí)。
這時(shí)我們要注意到端礼,teacher_id是有索引的禽笑,如果是沒(méi)有索引的class_name呢?update class_teacher set teacher_id=3 where class_name = '初三一班';
那么MySQL會(huì)給整張表的所有數(shù)據(jù)行的加行鎖蛤奥。這里聽起來(lái)有點(diǎn)不可思議佳镜,但是當(dāng)sql運(yùn)行的過(guò)程中,MySQL并不知道哪些數(shù)據(jù)行是 class_name = '初三一班'的(沒(méi)有索引嘛)凡桥,如果一個(gè)條件無(wú)法通過(guò)索引快速過(guò)濾蟀伸,存儲(chǔ)引擎層面就會(huì)將所有記錄加鎖后返回,再由MySQL Server層進(jìn)行過(guò)濾。
但在實(shí)際使用過(guò)程當(dāng)中啊掏,MySQL做了一些改進(jìn)蠢络,在MySQL Server過(guò)濾條件,發(fā)現(xiàn)不滿足后迟蜜,會(huì)調(diào)用unlock_row方法刹孔,把不滿足條件的記錄釋放鎖 (違背了二段鎖協(xié)議的約束)。這樣做娜睛,保證了最后只會(huì)持有滿足條件記錄上的鎖髓霞,但是每條記錄的加鎖操作還是不能省略的∑杞洌可見(jiàn)即使是MySQL方库,為了效率也是會(huì)違反規(guī)范的。(參見(jiàn)《高性能MySQL》中文第三版p181障斋。
實(shí)際除了行鎖外纵潦,為了防止這種事務(wù)之間寫入造成的沖突產(chǎn)生,還引入了GAP間隙鎖配喳。更多的內(nèi)容可以參見(jiàn)《高性能MySQL》酪穿。