簡單來說搭盾,事務(wù)就是要保證一組數(shù)據(jù)庫操作咳秉,要么全部成功,要么全部失敗鸯隅。在 MySQL 中澜建,事務(wù)支持是在引擎層實現(xiàn)的。你現(xiàn)在知道蝌以,MySQL 是一個支持多引擎的系統(tǒng)炕舵,但并不是所有的引擎都支持事務(wù)。比如 MySQL 原生的 MyISAM 引擎就不支持事務(wù)跟畅,這也是 MyISAM 被 InnoDB 取代的重要原因之一咽筋。
今天的文章里,我將會以 InnoDB 為例徊件,剖析 MySQL 在事務(wù)支持方面的特定實現(xiàn)奸攻,并基于原理給出相應(yīng)的實踐建議蒜危,希望這些案例能加深你對 MySQL 事務(wù)原理的理解。
隔離性與隔離級別
提到事務(wù)睹耐,你肯定會想到 ACID(Atomicity辐赞、Consistency、Isolation硝训、Durability响委,即原子性、一致性窖梁、隔離性赘风、持久性),今天我們就來說說其中 I纵刘,也就是“隔離性”邀窃。
當(dāng)數(shù)據(jù)庫上有多個事務(wù)同時執(zhí)行的時候,就可能出現(xiàn)臟讀(dirty read)彰导、不可重復(fù)讀(non-repeatable read)蛔翅、幻讀(phantom read)的問題,為了解決這些問題位谋,就有了“隔離級別”的概念山析。
在談隔離級別之前,你首先要知道掏父,你隔離得越嚴(yán)實笋轨,效率就會越低。因此很多時候赊淑,我們都要在二者之間尋找一個平衡點爵政。SQL 標(biāo)準(zhǔn)的事務(wù)隔離級別包括:讀未提交(read uncommitted)、讀提交(read committed)陶缺、可重復(fù)讀(repeatable read)和串行化(serializable )钾挟。下面我逐一為你解釋:
- 讀未提交是指,一個事務(wù)還沒提交時饱岸,它做的變更就能被別的事務(wù)看到掺出。
- 讀提交是指,一個事務(wù)提交之后苫费,它做的變更才會被其他事務(wù)看到汤锨。
- 可重復(fù)讀是指,一個事務(wù)執(zhí)行過程中看到的數(shù)據(jù)百框,總是跟這個事務(wù)在啟動時看到的數(shù)據(jù)是一致的闲礼。當(dāng)然在可重復(fù)讀隔離級別下,未提交變更對其他事務(wù)也是不可見的。
- 串行化柬泽,顧名思義是對于同一行記錄慎菲,“寫”會加“寫鎖”,“讀”會加“讀鎖”聂抢。當(dāng)出現(xiàn)讀寫鎖沖突的時候钧嘶,后訪問的事務(wù)必須等前一個事務(wù)執(zhí)行完成棠众,才能繼續(xù)執(zhí)行琳疏。
其中“讀提交”和“可重復(fù)讀”比較難理解,所以我用一個例子說明這幾種隔離級別闸拿。假設(shè)數(shù)據(jù)表 T 中只有一列空盼,其中一行的值為 1,下面是按照時間順序執(zhí)行兩個事務(wù)的行為新荤。
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
我們來看看在不同的隔離級別下揽趾,事務(wù) A 會有哪些不同的返回結(jié)果,也就是圖里面 V1苛骨、V2篱瞎、V3 的返回值分別是什么。
- 若隔離級別是“讀未提交”痒芝, 則 V1 的值就是 2俐筋。這時候事務(wù) B 雖然還沒有提交,但是結(jié)果已經(jīng)被 A 看到了严衬。因此澄者,V2、V3 也都是 2请琳。
- 若隔離級別是“讀提交”粱挡,則 V1 是 1,V2 的值是 2俄精。事務(wù) B 的更新在提交后才能被 A 看到询筏。所以, V3 的值也是 2竖慧。
- 若隔離級別是“可重復(fù)讀”嫌套,則 V1、V2 是 1测蘑,V3 是 2灌危。之所以 V2 還是 1,遵循的就是這個要求:事務(wù)在執(zhí)行期間看到的數(shù)據(jù)前后必須是一致的碳胳。
- 若隔離級別是“串行化”勇蝙,則在事務(wù) B 執(zhí)行“將 1 改成 2”的時候,會被鎖住挨约。直到事務(wù) A 提交后味混,事務(wù) B 才可以繼續(xù)執(zhí)行产雹。所以從 A 的角度看, V1翁锡、V2 值是 1蔓挖,V3 的值是 2。
在實現(xiàn)上馆衔,數(shù)據(jù)庫里面會創(chuàng)建一個視圖士复,訪問的時候以視圖的邏輯結(jié)果為準(zhǔn)钉跷。在“可重復(fù)讀”隔離級別下,這個視圖是在事務(wù)啟動時創(chuàng)建的,整個事務(wù)存在期間都用這個視圖盔粹。在“讀提交”隔離級別下纹安,這個視圖是在每個 SQL 語句開始執(zhí)行的時候創(chuàng)建的流济。這里需要注意的是奔则,“讀未提交”隔離級別下直接返回記錄上的最新值,沒有視圖概念未蝌;而“串行化”隔離級別下直接用加鎖的方式來避免并行訪問驮吱。
我們可以看到在不同的隔離級別下,數(shù)據(jù)庫行為是有所不同的萧吠。Oracle 數(shù)據(jù)庫的默認隔離級別其實就是“讀提交”左冬,因此對于一些從 Oracle 遷移到 MySQL 的應(yīng)用,為保證數(shù)據(jù)庫隔離級別的一致怎憋,你一定要記得將 MySQL 的隔離級別設(shè)置為“讀提交”又碌。
配置的方式是,將啟動參數(shù) transaction-isolation 的值設(shè)置成 READ-COMMITTED绊袋。你可以用 show variables 來查看當(dāng)前的值毕匀。
mysql> show variables like 'transaction_isolation';
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+
總結(jié)來說,存在即合理癌别,每種隔離級別都有自己的使用場景皂岔,你要根據(jù)自己的業(yè)務(wù)情況來定。我想你可能會問那什么時候需要“可重復(fù)讀”的場景呢展姐?我們來看一個數(shù)據(jù)校對邏輯的案例躁垛。
假設(shè)你在管理一個個人銀行賬戶表。一個表存了賬戶余額圾笨,一個表存了賬單明細教馆。到了月底你要做數(shù)據(jù)校對,也就是判斷上個月的余額和當(dāng)前余額的差額擂达,是否與本月的賬單明細一致土铺。你一定希望在校對過程中,即使有用戶發(fā)生了一筆新的交易,也不影響你的校對結(jié)果悲敷。
這時候使用“可重復(fù)讀”隔離級別就很方便究恤。事務(wù)啟動時的視圖可以認為是靜態(tài)的,不受其他事務(wù)更新的影響后德。
事務(wù)隔離的實現(xiàn)
理解了事務(wù)的隔離級別部宿,我們再來看看事務(wù)隔離具體是怎么實現(xiàn)的。這里我們展開說明“可重復(fù)讀”瓢湃。
在 MySQL 中理张,實際上每條記錄在更新的時候都會同時記錄一條回滾操作。記錄上的最新值箱季,通過回滾操作涯穷,都可以得到前一個狀態(tài)的值棍掐。
假設(shè)一個值從 1 被按順序改成了 2藏雏、3、4作煌,在回滾日志里面就會有類似下面的記錄掘殴。
當(dāng)前值是 4,但是在查詢這條記錄的時候粟誓,不同時刻啟動的事務(wù)會有不同的 read-view奏寨。如圖中看到的,在視圖 A鹰服、B病瞳、C 里面,這一個記錄的值分別是 1悲酷、2套菜、4,同一條記錄在系統(tǒng)中可以存在多個版本设易,就是數(shù)據(jù)庫的多版本并發(fā)控制(MVCC)逗柴。對于 read-view A,要得到 1顿肺,就必須將當(dāng)前值依次執(zhí)行圖中所有的回滾操作得到戏溺。
同時你會發(fā)現(xiàn),即使現(xiàn)在有另外一個事務(wù)正在將 4 改成 5屠尊,這個事務(wù)跟 read-view A旷祸、B、C 對應(yīng)
你一定會問讼昆,回滾日志總不能一直保留吧托享,什么時候刪除呢?答案是,在不需要的時候才刪除嫌吠。也就是說止潘,系統(tǒng)會判斷,當(dāng)沒有事務(wù)再需要用到這些回滾日志時辫诅,回滾日志會被刪除.
什么時候才不需要了呢凭戴?就是當(dāng)系統(tǒng)里沒有比這個回滾日志更早的 read-view 的時候。
基于上面的說明炕矮,我們來討論一下為什么建議你盡量不要使用長事務(wù)么夫。
長事務(wù)意味著系統(tǒng)里面會存在很老的事務(wù)視圖。由于這些事務(wù)隨時可能訪問數(shù)據(jù)庫里面的任何數(shù)據(jù)肤视,所以這個事務(wù)提交之前档痪,數(shù)據(jù)庫里面它可能用到的回滾記錄都必須保留,這就會導(dǎo)致大量占用存儲空間邢滑。
除了對回滾段的影響腐螟,長事務(wù)還占用鎖資源,也可能拖垮整個庫困后,這個我們會在后面講鎖的時候展開乐纸。
事務(wù)的啟動方式
如前面所述,長事務(wù)有這些潛在風(fēng)險摇予,我當(dāng)然是建議你盡量避免汽绢。其實很多時候業(yè)務(wù)開發(fā)同學(xué)并不是有意使用長事務(wù),通常是由于誤用所致侧戴。MySQL 的事務(wù)啟動方式有以下幾種:
顯式啟動事務(wù)語句宁昭, begin 或 start transaction。配套的提交語句是 commit酗宋,回滾語句是 rollback积仗。
set autocommit=0,這個命令會將這個線程的自動提交關(guān)掉本缠。意味著如果你只執(zhí)行一個 select 語句斥扛,這個事務(wù)就啟動了,而且并不會自動提交丹锹。這個事務(wù)持續(xù)存在直到你主動執(zhí)行 commit 或 rollback 語句稀颁,或者斷開連接。
有些客戶端連接框架會默認連接成功后先執(zhí)行一個 set autocommit=0 的命令楣黍。這就導(dǎo)致接下來的查詢都在事務(wù)中匾灶,如果是長連接,就導(dǎo)致了意外的長事務(wù)租漂。
因此阶女,我會建議你總是使用 set autocommit=1, 通過顯式語句的方式來啟動事務(wù)颊糜。
但是有的開發(fā)同學(xué)會糾結(jié)“多一次交互”的問題。對于一個需要頻繁使用事務(wù)的業(yè)務(wù)秃踩,第二種方式每個事務(wù)在開始時都不需要主動執(zhí)行一次 “begin”衬鱼,減少了語句的交互次數(shù)。如果你也有這個顧慮憔杨,我建議你使用 commit work and chain 語法鸟赫。
在 autocommit 為 1 的情況下,用 begin 顯式啟動的事務(wù)消别,如果執(zhí)行 commit 則提交事務(wù)抛蚤。如果執(zhí)行 commit work and chain,則是提交事務(wù)并自動啟動下一個事務(wù)寻狂,這樣也省去了再次執(zhí)行 begin 語句的開銷岁经。同時帶來的好處是從程序開發(fā)的角度明確地知道每個語句是否處于事務(wù)中。
你可以在 information_schema 庫的 innodb_trx 這個表中查詢長事務(wù)蛇券,比如下面這個語句缀壤,用于查找持續(xù)時間超過 60s 的事務(wù)。
FAQ
介紹了 MySQL 的事務(wù)隔離級別的現(xiàn)象和實現(xiàn)怀读,根據(jù)實現(xiàn)原理分析了長事務(wù)存在的風(fēng)險诉位,以及如何用正確的方式避免長事務(wù)
如果你是業(yè)務(wù)開發(fā)負責(zé)人同時也是數(shù)據(jù)庫負責(zé)人,你會有什么方案來避免出現(xiàn)或者處理這種情況呢菜枷?
1、務(wù)的特性:原子性叁丧、一致性啤誊、隔離性、持久性
2拥娄、多事務(wù)同時執(zhí)行的時候蚊锹,可能會出現(xiàn)的問題:臟讀、不可重復(fù)讀稚瘾、幻讀
3牡昆、事務(wù)隔離級別:讀未提交、讀提交摊欠、可重復(fù)讀丢烘、串行化
4、不同事務(wù)隔離級別的區(qū)別:
讀未提交:一個事務(wù)還未提交些椒,它所做的變更就可以被別的事務(wù)看到
讀提交:一個事務(wù)提交之后播瞳,它所做的變更才可以被別的事務(wù)看到
可重復(fù)讀:一個事務(wù)執(zhí)行過程中看到的數(shù)據(jù)是一致的。未提交的更改對其他事務(wù)是不可見的
串行化:對應(yīng)一個記錄會加讀寫鎖免糕,出現(xiàn)沖突的時候赢乓,后訪問的事務(wù)必須等前一個事務(wù)執(zhí)行完成才能繼續(xù)執(zhí)行
5忧侧、配置方法:啟動參數(shù)transaction-isolation
6、事務(wù)隔離的實現(xiàn):每條記錄在更新的時候都會同時記錄一條回滾操作牌芋。同一條記錄在系統(tǒng)中可以存在多個版本蚓炬,這就是數(shù)據(jù)庫的多版本并發(fā)控制(MVCC)。
7躺屁、回滾日志什么時候刪除试吁?系統(tǒng)會判斷當(dāng)沒有事務(wù)需要用到這些回滾日志的時候,回滾日志會被刪除楼咳。
8熄捍、什么時候不需要了?當(dāng)系統(tǒng)里么有比這個回滾日志更早的read-view的時候母怜。
9余耽、為什么盡量不要使用長事務(wù)。長事務(wù)意味著系統(tǒng)里面會存在很老的事務(wù)視圖苹熏,在這個事務(wù)提交之前碟贾,回滾記錄都要保留,這會導(dǎo)致大量占用存儲空間轨域。除此之外袱耽,長事務(wù)還占用鎖資源,可能會拖垮庫干发。
10朱巨、事務(wù)啟動方式:一、顯式啟動事務(wù)語句枉长,begin或者start transaction,提交commit冀续,回滾rollback;二必峰、set autocommit=0洪唐,該命令會把這個線程的自動提交關(guān)掉。這樣只要執(zhí)行一個select語句吼蚁,事務(wù)就啟動凭需,并不會自動提交,直到主動執(zhí)行commit或rollback或斷開連接肝匆。
11粒蜈、建議使用方法一,如果考慮多一次交互問題术唬,可以使用commit work and chain語法薪伏。在autocommit=1的情況下用begin顯式啟動事務(wù)嫁怀,如果執(zhí)行commit則提交事務(wù)。如果執(zhí)行commit work and chain則提交事務(wù)并自動啟動下一個事務(wù)萝招。
讀未提交:別人改數(shù)據(jù)的事務(wù)尚未提交存捺,我在我的事務(wù)中也能讀到捌治。
讀已提交:別人改數(shù)據(jù)的事務(wù)已經(jīng)提交,我在我的事務(wù)中才能讀到兼吓。
可重復(fù)讀:別人改數(shù)據(jù)的事務(wù)已經(jīng)提交森枪,我在我的事務(wù)中也不去讀县袱。
串行:我的事務(wù)尚未提交,別人就別想改數(shù)據(jù)筋遭。
這4種隔離級別宛畦,并行性能依次降低,安全性依次提高。
為該講總結(jié)了幾個問題, 大家復(fù)習(xí)的時候可以先嘗試回答這些問題檢查自己的掌握程度:
1.
事務(wù)的概念是什么?
2.
mysql的事務(wù)隔離級別讀未提交, 讀已提交, 可重復(fù)讀, 串行各是什么意思?
3.
讀已提交, 可重復(fù)讀是怎么通過視圖構(gòu)建實現(xiàn)的?
4.
可重復(fù)讀的使用場景舉例? 對賬的時候應(yīng)該很有用?
5.
事務(wù)隔離是怎么通過read-view(讀視圖)實現(xiàn)的?
6.
并發(fā)版本控制(MCVV)的概念是什么, 是怎么實現(xiàn)的?
7.
使用長事務(wù)的弊病? 為什么使用常事務(wù)可能拖垮整個庫?
8.
事務(wù)的啟動方式有哪幾種?
9.
commit work and chain的語法是做什么用的?
10.
怎么查詢各個表中的長事務(wù)?
11.
如何避免長事務(wù)的出現(xiàn)?
對于RR那伐,你可以這么想石蔗,每個事務(wù)啟動的時候打一個快照,別人改的“我不聽我不聽”