提到事務(wù)纺蛆,你肯定不陌生,簡單來說规揪,事務(wù)就是要保證一組數(shù)據(jù)庫操作桥氏,要么全部成功,要么全部失敗猛铅。在 MySQL 中字支,事務(wù)支持是在引擎層實現(xiàn)的。MySQL 原生的 MyISAM 引擎就不支持事務(wù)奸忽,InnoDB引擎則支持事務(wù)堕伪,這也是 MyISAM 被 InnoDB 取代的重要原因之一。
隔離性與隔離級別
提到事務(wù)栗菜,你肯定會想到 ACID(Atomicity欠雌、Consistency、Isolation疙筹、Durability富俄,即原子性检号、一致性、隔離性蛙酪、持久性),今天我們就來說說其中 I翘盖,也就是“隔離性”桂塞。
在談隔離級別之前,你首先要知道馍驯,你隔離得越嚴(yán)實阁危,效率就會越低。因此很多時候汰瘫,我們都要在二者之間尋找一個平衡點狂打。SQL 標(biāo)準(zhǔn)的事務(wù)隔離級別包括:讀未提交(read uncommitted)、讀提交(read committed)混弥、可重復(fù)讀(repeatable read)和串行化(serializable )趴乡。下面我逐一為你解釋:
- 讀未提交是指,一個事務(wù)還沒提交時蝗拿,它做的變更就能被別的事務(wù)看到晾捏。
- 讀提交是指,一個事務(wù)提交之后哀托,它做的變更才會被其他事務(wù)看到惦辛。
- 可重復(fù)讀是指,一個事務(wù)執(zhí)行過程中看到的數(shù)據(jù)仓手,總是跟這個事務(wù)在啟動時看到的數(shù)據(jù)是一致的胖齐。當(dāng)然在可重復(fù)讀隔離級別下,未提交變更對其他事務(wù)也是不可見的嗽冒。
- 串行化呀伙,顧名思義是對于同一行記錄,“寫”會加“寫鎖”添坊,“讀”會加“讀鎖”区匠。當(dāng)出現(xiàn)讀寫鎖沖突的時候,后訪問的事務(wù)必須等前一個事務(wù)執(zhí)行完成帅腌,才能繼續(xù)執(zhí)行驰弄。
我用一個例子說明這幾種隔離級別。假設(shè)數(shù)據(jù)表 T 中只有一列速客,其中一行的值為 1戚篙,下面是按照時間順序執(zhí)行兩個事務(wù)的行為。
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
事務(wù)A | 事務(wù)B |
---|---|
啟動事務(wù) | |
查詢得到值1 | |
啟動事務(wù) | |
查詢得到值1 | |
將1改成2 | |
查詢得到值V1 | |
提交事務(wù)B | |
查詢得到值V2 | |
提交事務(wù)A | |
查詢得到值V3 |
我們來看看在不同的隔離級別下溺职,事務(wù) A 會有哪些不同的返回結(jié)果岔擂,也就是圖里面 V1位喂、V2、V3 的返回值分別是什么乱灵。
- 若隔離級別是“讀未提交”塑崖, 則 V1 的值就是 2。這時候事務(wù) B 雖然還沒有提交痛倚,但是結(jié)果已經(jīng)被 A 看到了规婆。因此,V2蝉稳、V3 也都是 2抒蚜。
- 若隔離級別是“讀提交”,則 V1 是 1耘戚,V2 的值是 2嗡髓。事務(wù) B 的更新在提交后才能被 A 看到。所以收津, V3 的值也是 2饿这。
- 若隔離級別是“可重復(fù)讀”,則 V1撞秋、V2 是 1蛹稍,V3 是 2。之所以 V2 還是 1部服,遵循的就是這個要求:事務(wù)在執(zhí)行期間看到的數(shù)據(jù)前后必須是一致的唆姐。
- 若隔離級別是“串行化”,則在事務(wù) B 執(zhí)行“將 1 改成 2”的時候廓八,會被鎖住奉芦。直到事務(wù) A 提交后,事務(wù) B 才可以繼續(xù)執(zhí)行剧蹂。所以從 A 的角度看声功, V1、V2 值是 1宠叼,V3 的值是 2先巴。
在實現(xiàn)上枝缔,數(shù)據(jù)庫里面會創(chuàng)建一個視圖(不是create view那個視圖)风瘦,訪問的時候以視圖的邏輯結(jié)果為準(zhǔn)蜜氨。在“可重復(fù)讀”隔離級別下葱绒,這個視圖是在事務(wù)啟動時創(chuàng)建的,整個事務(wù)存在期間都用這個視圖熟吏。在“讀提交”隔離級別下呜笑,這個視圖是在每個 SQL 語句開始執(zhí)行的時候創(chuàng)建的颓芭。這里需要注意的是横侦,“讀未提交”隔離級別下直接返回記錄上的最新值挥萌,沒有視圖概念绰姻;而“串行化”隔離級別下直接用加鎖的方式來避免并行訪問。
你可以用 show variables 來查看當(dāng)前的事務(wù)隔離級別引瀑。
mysql> show variables like 'transaction_isolation';
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+
事務(wù)隔離的實現(xiàn)
理解了事務(wù)的隔離級別狂芋,我們再來看看事務(wù)隔離具體是怎么實現(xiàn)的。這里我們展開說明“可重復(fù)讀”憨栽。
在 MySQL 中帜矾,實際上每條記錄在更新的時候都會同時記錄一條回滾操作。記錄上的最新值徒像,通過回滾操作,都可以得到前一個狀態(tài)的值蛙讥。
假設(shè)一個值從 1 被按順序改成了 2锯蛀、3、4次慢,在回滾日志里面就會有類似下面的記錄旁涤。
當(dāng)前值是 4,但是在查詢這條記錄的時候迫像,不同時刻啟動的事務(wù)會有不同的 read-view劈愚。如圖中看到的,在視圖 A闻妓、B菌羽、C 里面,這一個記錄的值分別是 1由缆、2注祖、4,同一條記錄在系統(tǒng)中可以存在多個版本均唉,就是數(shù)據(jù)庫的多版本并發(fā)控制(MVCC)是晨。對于 read-view A,要得到 1舔箭,就必須將當(dāng)前值依次執(zhí)行圖中所有的回滾操作得到罩缴。
同時你會發(fā)現(xiàn),即使現(xiàn)在有另外一個事務(wù)正在將 4 改成 5层扶,這個事務(wù)跟 read-view A箫章、B、C 對應(yīng)的事務(wù)是不會沖突的镜会。
你一定會問炉抒,回滾日志總不能一直保留吧,什么時候刪除呢稚叹?答案是焰薄,在不需要的時候才刪除拿诸。也就是說,系統(tǒng)會判斷塞茅,當(dāng)沒有事務(wù)再需要用到這些回滾日志時亩码,回滾日志會被刪除。
什么時候才不需要了呢野瘦?就是當(dāng)系統(tǒng)里沒有比這個回滾日志更早的 read-view 的時候描沟。
基于上面的說明,我們來討論一下為什么建議你盡量不要使用長事務(wù)鞭光。
長事務(wù)意味著系統(tǒng)里面會存在很老的事務(wù)視圖吏廉。由于這些事務(wù)隨時可能訪問數(shù)據(jù)庫里面的任何數(shù)據(jù),所以這個事務(wù)提交之前惰许,數(shù)據(jù)庫里面它可能用到的回滾記錄都必須保留席覆,這就會導(dǎo)致大量占用存儲空間。
事務(wù)啟動方式
如前面所述汹买,長事務(wù)有這些潛在風(fēng)險佩伤,我當(dāng)然是建議你盡量避免。其實很多時候業(yè)務(wù)開發(fā)同學(xué)并不是有意使用長事務(wù)晦毙,通常是由于誤用所致生巡。MySQL 的事務(wù)啟動方式有以下幾種:
- 顯式啟動事務(wù)語句, begin 或 start transaction见妒。配套的提交語句是 commit孤荣,回滾語句是 rollback。
- set autocommit=0须揣,這個命令會將這個線程的自動提交關(guān)掉垃环。意味著如果你只執(zhí)行一個 select 語句,這個事務(wù)就啟動了返敬,而且并不會自動提交遂庄。這個事務(wù)持續(xù)存在直到你主動執(zhí)行 commit 或 rollback 語句,或者斷開連接劲赠。
有些客戶端連接框架會默認連接成功后先執(zhí)行一個 set autocommit=0 的命令涛目。這就導(dǎo)致接下來的查詢都在事務(wù)中,如果是長連接凛澎,就導(dǎo)致了意外的長事務(wù)霹肝。
因此,我會建議你總是使用 set autocommit=1, 通過顯式語句的方式來啟動事務(wù)塑煎。
你可以在 information_schema 庫的 innodb_trx 這個表中查詢長事務(wù)沫换,比如下面這個語句,用于查找持續(xù)時間超過 60s 的事務(wù)最铁。
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60
小結(jié)
這篇文章介紹了 MySQL 的事務(wù)隔離級別的現(xiàn)象和實現(xiàn)讯赏,根據(jù)實現(xiàn)原理分析了長事務(wù)存在的風(fēng)險垮兑,以及如何用正確的方式避免長事務(wù)。希望本文能夠幫助你理解事務(wù)漱挎,并更好地使用 MySQL 的事務(wù)特性系枪。