事務(wù)就是要保證一組數(shù)據(jù)庫(kù)操作引谜,要么全部成功榔组,要么全部失敗。在MySQL中,事務(wù)支持是在引擎層實(shí)現(xiàn)的哭懈。MySQL是一個(gè)支持多引擎的系統(tǒng)叹侄,但并不是所有的引擎都支持事務(wù)全肮。比如MySQL原生的MyISAM引擎就不支持事務(wù)奶栖,這也是MyISAM被InnoDB取代的重要原因之一。
一 隔離性與隔離級(jí)別
提及數(shù)據(jù)庫(kù)事務(wù)孽江,肯定會(huì)想到ACID(Atomicity讶坯、Consistency、Isolation岗屏、Durability辆琅,即原子性、一致性这刷、隔離性婉烟、持久性),今天我們就來(lái)說(shuō)說(shuō)其中之一暇屋,也就是“隔離性”似袁。
當(dāng)數(shù)據(jù)庫(kù)上有多個(gè)事務(wù)同時(shí)執(zhí)行的時(shí)候,就可能出現(xiàn)臟讀(dirty read)、不可重復(fù)讀(non-repeatable read)叔营、幻讀(phantom read)的問題屋彪,為了解決這些問題所宰,就有了“隔離級(jí)別”的概念绒尊。
隔離級(jí)別越高,效率就會(huì)越低仔粥。因此很多時(shí)候婴谱,我們都要在二者之間尋找一個(gè)平衡點(diǎn)。
-
SQL標(biāo)準(zhǔn)的事務(wù)隔離級(jí)別包括:讀未提交(read uncommitted)躯泰、讀提交(read committed)谭羔、可重復(fù)讀(repeatable read)和串行化(serializable )。
讀未提交:一個(gè)事務(wù)還沒提交時(shí)麦向,它做的變更就能被別的事務(wù)看到瘟裸。
讀提交:一個(gè)事務(wù)提交之后,它做的變更才會(huì)被其他事務(wù)看到诵竭。
可重復(fù)讀:一個(gè)事務(wù)執(zhí)行過(guò)程中看到的數(shù)據(jù)话告,總是跟這個(gè)事務(wù)在啟動(dòng)時(shí)看到的數(shù)據(jù)是一致的。當(dāng)然在可重復(fù)讀隔離級(jí)別下卵慰,未提交變更對(duì)其他事務(wù)也是不可見的沙郭。
串行化:顧名思義是對(duì)于同一行記錄,“寫”會(huì)加“寫鎖”裳朋,“讀”會(huì)加“讀鎖”病线。當(dāng)出現(xiàn)讀寫鎖沖突的時(shí)候,后訪問的事務(wù)必須等前一個(gè)事務(wù)執(zhí)行完成鲤嫡,才能繼續(xù)執(zhí)行送挑。
其中“讀提交”和“可重復(fù)讀”比較難理解,舉個(gè)例子說(shuō)明下:
假設(shè)數(shù)據(jù)表T中只有一列暖眼,其中一行的值為1惕耕,下面是按照時(shí)間順序執(zhí)行兩個(gè)事務(wù)的行為。
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
不同的隔離級(jí)別下罢荡,事務(wù)A會(huì)有哪些不同的返回結(jié)果赡突,也就是圖里面V1、V2区赵、V3的返回值分別是什么惭缰。
- 若隔離級(jí)別是“讀未提交”, 則V1的值就是2笼才。這時(shí)候事務(wù)B雖然還沒有提交漱受,但是結(jié)果已經(jīng)被A看到了。因此,V2昂羡、V3也都是2絮记。
- 若隔離級(jí)別是“讀提交”,則V1是1虐先,V2的值是2怨愤。事務(wù)B的更新在提交后才能被A看到。所以蛹批, V3的值也是2撰洗。
- 若隔離級(jí)別是“可重復(fù)讀”,則V1腐芍、V2是1差导,V3是2。之所以V2還是1猪勇,遵循的就是這個(gè)要求:事務(wù)在執(zhí)行期間看到的數(shù)據(jù)前后必須是一致的设褐。
- 若隔離級(jí)別是“串行化”,則在事務(wù)B執(zhí)行“將1改成2”的時(shí)候泣刹,會(huì)被鎖住助析。直到事務(wù)A提交后,事務(wù)B才可以繼續(xù)執(zhí)行项玛。所以從A的角度看貌笨, V1、V2值是1襟沮,V3的值是2锥惋。
在實(shí)現(xiàn)上,數(shù)據(jù)庫(kù)里面會(huì)創(chuàng)建一個(gè)視圖开伏,訪問的時(shí)候以視圖的邏輯結(jié)果為準(zhǔn)膀跌。
在“可重復(fù)讀”隔離級(jí)別下,這個(gè)視圖是在事務(wù)啟動(dòng)時(shí)創(chuàng)建的固灵,整個(gè)事務(wù)存在期間都用這個(gè)視圖捅伤。
在“讀提交”隔離級(jí)別下,這個(gè)視圖是在每個(gè)SQL語(yǔ)句開始執(zhí)行的時(shí)候創(chuàng)建的巫玻。
“讀未提交”隔離級(jí)別下直接返回記錄上的最新值丛忆,
沒有視圖概念;
“串行化”隔離級(jí)別下直接用加鎖的方式來(lái)避免并行訪問仍秤。
Oracle數(shù)據(jù)庫(kù)的默認(rèn)隔離級(jí)別其實(shí)就是“讀提交”熄诡,因此對(duì)于一些從Oracle遷移到MySQL的應(yīng)用,為保證數(shù)據(jù)庫(kù)隔離級(jí)別的一致诗力,你一定要記得將MySQL的隔離級(jí)別設(shè)置為“讀提交”凰浮。
配置的方式是,將啟動(dòng)參數(shù)transaction-isolation的值設(shè)置成READ-COMMITTED。你可以用show variables來(lái)查看當(dāng)前的值袜茧。
mysql> show variables like 'transaction_isolation';
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+
總結(jié)來(lái)說(shuō)菜拓,存在即合理,哪個(gè)隔離級(jí)別都有它自己的使用場(chǎng)景笛厦,你要根據(jù)自己的業(yè)務(wù)情況來(lái)定纳鼎。
二 事務(wù)隔離的實(shí)現(xiàn)
理解了事務(wù)的隔離級(jí)別,事務(wù)隔離具體是怎么實(shí)現(xiàn)的递递。以“可重復(fù)讀”進(jìn)行說(shuō)明喷橙。
在MySQL中,實(shí)際上每條記錄在更新的時(shí)候都會(huì)同時(shí)記錄一條回滾操作登舞。記錄上的最新值,通過(guò)回滾操作悬荣,都可以得到前一個(gè)狀態(tài)的值菠秒。舉例:一個(gè)值從1被按順序改成了2、3氯迂、4践叠,在回滾日志里面就會(huì)有類似下面的記錄。
當(dāng)前值是4嚼蚀,但是在查詢這條記錄的時(shí)候禁灼,不同時(shí)刻啟動(dòng)的事務(wù)會(huì)有不同的read-view。如圖中看到的轿曙,在視圖A弄捕、B、C里面导帝,這一個(gè)記錄的值分別是1守谓、2、4您单,同一條記錄在系統(tǒng)中可以存在多個(gè)版本斋荞,就是數(shù)據(jù)庫(kù)的多版本并發(fā)控制(MVCC :MVCC是通過(guò)保存數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)的快照來(lái)實(shí)現(xiàn)的)。對(duì)于read-view A虐秦,要得到1平酿,就必須將當(dāng)前值依次執(zhí)行圖中所有的回滾操作得到。
同時(shí)你會(huì)發(fā)現(xiàn)悦陋,即使現(xiàn)在有另外一個(gè)事務(wù)正在將4改成5蜈彼,這個(gè)事務(wù)跟read-view A、B叨恨、C對(duì)應(yīng)的事務(wù)是不會(huì)沖突的柳刮。
你一定會(huì)問,回滾日志總不能一直保留吧,什么時(shí)候刪除呢秉颗?答案是痢毒,在不需要的時(shí)候才刪除。也就是說(shuō)蚕甥,系統(tǒng)會(huì)判斷哪替,當(dāng)沒有事務(wù)再需要用到這些回滾日志時(shí),回滾日志會(huì)被刪除菇怀。
什么時(shí)候才不需要了呢凭舶?就是當(dāng)系統(tǒng)里沒有比這個(gè)回滾日志更早的read-view的時(shí)候。
基于上面的說(shuō)明爱沟,我們來(lái)討論一下為什么建議你盡量不要使用長(zhǎng)事務(wù)帅霜。
長(zhǎng)事務(wù)意味著系統(tǒng)里面會(huì)存在很老的事務(wù)視圖。由于這些事務(wù)隨時(shí)可能訪問數(shù)據(jù)庫(kù)里面的任何數(shù)據(jù)呼伸,所以這個(gè)事務(wù)提交之前身冀,數(shù)據(jù)庫(kù)里面它可能用到的回滾記錄都必須保留,這就會(huì)導(dǎo)致大量占用存儲(chǔ)空間括享。
在MySQL 5.5及以前的版本搂根,回滾日志是跟數(shù)據(jù)字典一起放在ibdata文件里的,即使長(zhǎng)事務(wù)最終提交铃辖,回滾段被清理剩愧,文件也不會(huì)變小。我見過(guò)數(shù)據(jù)只有20GB娇斩,而回滾段有200GB的庫(kù)仁卷。最終只好為了清理回滾段,重建整個(gè)庫(kù)成洗。
除了對(duì)回滾段的影響五督,長(zhǎng)事務(wù)還占用鎖資源,也可能拖垮整個(gè)庫(kù)瓶殃,這個(gè)我們會(huì)在后面講鎖的時(shí)候展開充包。
三 事務(wù)的啟動(dòng)方式
如前面所述,長(zhǎng)事務(wù)有這些潛在風(fēng)險(xiǎn)遥椿,建議盡量避免基矮。其實(shí)很多時(shí)候并不是有意使用長(zhǎng)事務(wù),通常是由于誤用所致冠场。MySQL的事務(wù)啟動(dòng)方式有以下幾種:
顯式啟動(dòng)事務(wù)語(yǔ)句家浇, begin 或 start transaction。配套的提交語(yǔ)句是commit碴裙,回滾語(yǔ)句是rollback钢悲。
set autocommit=0点额,這個(gè)命令會(huì)將這個(gè)線程的自動(dòng)提交關(guān)掉。意味著如果你只執(zhí)行一個(gè)select語(yǔ)句莺琳,這個(gè)事務(wù)就啟動(dòng)了还棱,而且并不會(huì)自動(dòng)提交。這個(gè)事務(wù)持續(xù)存在直到你主動(dòng)執(zhí)行commit 或 rollback 語(yǔ)句惭等,或者斷開連接珍手。
有些客戶端連接框架會(huì)默認(rèn)連接成功后先執(zhí)行一個(gè)set autocommit=0的命令。這就導(dǎo)致接下來(lái)的查詢都在事務(wù)中辞做,如果是長(zhǎng)連接琳要,就導(dǎo)致了意外的長(zhǎng)事務(wù)。因此秤茅,建議總是使用set autocommit=1, 通過(guò)顯式語(yǔ)句的方式來(lái)啟動(dòng)事務(wù)稚补。
如果糾結(jié)“多一次交互”的問題。對(duì)于一個(gè)需要頻繁使用事務(wù)的業(yè)務(wù)嫂伞,第二種方式每個(gè)事務(wù)在開始時(shí)都不需要主動(dòng)執(zhí)行一次 “begin”孔厉,減少了語(yǔ)句的交互次數(shù)。如果存在這個(gè)顧慮帖努,建議使用commit work and chain語(yǔ)法。
在autocommit為1的情況下粪般,用begin顯式啟動(dòng)的事務(wù)拼余,如果執(zhí)行commit則提交事務(wù)。如果執(zhí)行 commit work and chain亩歹,則是提交事務(wù)并自動(dòng)啟動(dòng)下一個(gè)事務(wù)匙监,這樣也省去了再次執(zhí)行begin語(yǔ)句的開銷。同時(shí)帶來(lái)的好處是從程序開發(fā)的角度明確地知道每個(gè)語(yǔ)句是否處于事務(wù)中小作。
你可以在information_schema庫(kù)的innodb_trx這個(gè)表中查詢長(zhǎng)事務(wù)亭姥,比如下面這個(gè)語(yǔ)句,用于查找持續(xù)時(shí)間超過(guò)60s的事務(wù)顾稀。
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60