提到事務(wù)蹦漠,你肯定不陌生部凑,和數(shù)據(jù)庫打交道的時候,我們總是會用到事務(wù)术辐。最經(jīng)典的例子就是轉(zhuǎn)賬砚尽,你要給朋友小王轉(zhuǎn)100塊錢施无,而此時你的銀行卡只有100塊錢辉词。
轉(zhuǎn)賬過程具體到程序里會有一系列的操作,比如查詢余額猾骡、做加減法瑞躺、更新余額等,這些操作必須保證是一體的兴想,不然等程序查完之后幢哨,還沒做減法之前,你這100塊錢嫂便,完全可以借著這個時間差再查一次捞镰,然后再給另外一個朋友轉(zhuǎn)賬,如果銀行這么整毙替,不就亂了么岸售?這時就要用到“事務(wù)”這個概念了。
事務(wù)就是要保證一組數(shù)據(jù)庫操作厂画,要么全部成功凸丸,要么全部失敗。在MySQL中袱院,事務(wù)支持是在引擎層實現(xiàn)的屎慢。MySQL是一個支持多引擎的系統(tǒng),但并不是所有的引擎都支持事務(wù)忽洛。比如MySQL原生的MyISAM引擎不支持事務(wù)腻惠,這也是MyISAM被InnoDB取代的重要原因之一。
以InnoDB為例欲虚,剖析 MySQL 在事務(wù)支持方面的特定實現(xiàn)集灌,并基于原理給出相應(yīng)的實踐建議。
隔離性和隔離級別
事務(wù)涉及到 ACID(Atomicity苍在、Consistency绝页、Isolation、Durability寂恬,即原子性续誉、一致性、隔離性初肉、持久性)酷鸦,這里來說說其中 I ,也就是“隔離性”。
當(dāng)數(shù)據(jù)庫上有多個事務(wù)同時執(zhí)行的時候臼隔,就可能出現(xiàn)臟讀(dirty read)嘹裂、不可重復(fù)讀(non-repeatable read)、幻讀(phantom read)的問題摔握,為了解決這些問題寄狼,就有了“隔離級別”的概念。
首先明確一點氨淌,隔離級越高泊愧,效率越低。因此盛正,需要在二者之間尋找一個平衡删咱。SQL標準的事務(wù)隔離級別包括:讀未提交(read uncommitted)、讀提交(read committed)豪筝、可重復(fù)讀(repeatable read)和串行化(serializable )痰滋。
逐一解釋:
- 讀未提交是指,一個事務(wù)還沒提交時续崖,它做的變更就能被別的事務(wù)看到敲街。
新數(shù)據(jù)存在內(nèi)存里,InnoDB buffer poo
讀提交是指袜刷,一個事務(wù)提交之后聪富,它做的變更才會被其他事務(wù)看到。
可重復(fù)讀是指著蟹,一個事務(wù)執(zhí)行過程中看到的數(shù)據(jù)墩蔓,總是跟這個事務(wù)在啟動時看到的數(shù)據(jù)是一致的。當(dāng)然在可重復(fù)讀隔離級別下萧豆,未提交變更對其他事務(wù)也是不可見的奸披。
串行化,顧名思義是對于同一行記錄涮雷,“寫”會加“寫鎖”阵面,“讀”會加“讀鎖”。當(dāng)出現(xiàn)讀寫鎖沖突的時候洪鸭,后訪問的事務(wù)必須等前一個事務(wù)執(zhí)行完成样刷,才能繼續(xù)執(zhí)行。
各級別效果
假設(shè)數(shù)據(jù)表T中只有一列览爵,其中一行的值為1置鼻,下面是按照時間順序執(zhí)行兩個事務(wù)的行為。
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
事務(wù)A | 事務(wù)B |
---|---|
啟動事務(wù)查詢得到值 1 | 啟動事務(wù) |
- | 查詢得到值 1 |
- | 將 1 改成 2 |
查詢得到值 V1 | - |
- | 提交事務(wù)B |
查詢得到值 V2 | - |
提交事務(wù) A | - |
查詢得到值 V3 | - |
在不同的隔離級別下蜓竹,事務(wù)A會有哪些不同的返回結(jié)果箕母,V1储藐、V2、V3的返回值分別是什么嘶是。
若隔離級別是“讀未提交”钙勃, 則V1的值就是2。這時候事務(wù)B雖然還沒有提交聂喇,但是結(jié)果已經(jīng)被A看到了辖源。因此,V2授帕、V3也都是2同木。
若隔離級別是“讀提交”,則V1是1跛十,V2的值是2。事務(wù)B的更新在提交后才能被A看到秕硝。所以芥映, V3的值也是2。
若隔離級別是“可重復(fù)讀”远豺,則V1奈偏、V2是1,V3是2躯护。之所以V2還是1惊来,遵循的就是這個要求:事務(wù)在執(zhí)行期間看到的數(shù)據(jù)前后必須是一致的。
若隔離級別是“串行化”棺滞,則在事務(wù)B執(zhí)行“將1改成2”的時候裁蚁,會被鎖住。直到事務(wù)A提交后继准,事務(wù)B才可以繼續(xù)執(zhí)行枉证。所以從A的角度看, V1移必、V2值是1室谚,V3的值是2。
讀未提交:別人改數(shù)據(jù)的事務(wù)尚未提交崔泵,我在我的事務(wù)中也能讀到秒赤。
讀已提交:別人改數(shù)據(jù)的事務(wù)已經(jīng)提交,我在我的事務(wù)中才能讀到憎瘸。
可重復(fù)讀:別人改數(shù)據(jù)的事務(wù)已經(jīng)提交入篮,我在我的事務(wù)中也不去讀。
串行:我的事務(wù)尚未提交含思,別人就別想改數(shù)據(jù)崎弃。
這4種隔離級別甘晤,并行性能依次降低,安全性依次提高饲做。
重復(fù)讀和讀提交的性能差異
建立視圖沒什么成本的线婚,就是拷貝一個事務(wù)數(shù)組;
所以性能的差異不是體現(xiàn)在這里盆均;
一般我們說可重復(fù)的效率相對的低(其實也還好塞弊,不會低多少),
主要還是因為可重復(fù)讀的鎖范圍可能更大(有g(shù)ap lock)泪姨,鎖時間更長(事務(wù)結(jié)束才釋放)游沿,影響并發(fā)度
在實現(xiàn)上,數(shù)據(jù)庫里面會創(chuàng)建一個視圖肮砾,訪問的時候以視圖的邏輯結(jié)果為準诀黍。
在“可重復(fù)讀”隔離級別下,這個視圖是在事務(wù)啟動時創(chuàng)建的仗处,整個事務(wù)存在期間都用這個視圖眯勾。在“讀提交”隔離級別下,這個視圖是在每個SQL語句開始執(zhí)行的時候創(chuàng)建的婆誓。
在“讀未提交”隔離級別下直接返回記錄上的最新值吃环,沒有視圖概念;
在“串行化”隔離級別下直接用加鎖的方式來避免并行訪問洋幻。
我們可以看到在不同的隔離級別下郁轻,數(shù)據(jù)庫行為是有所不同的。Oracle數(shù)據(jù)庫的默認隔離級別其實就是“讀提交”文留,因此對于一些從Oracle遷移到MySQL的應(yīng)用好唯,為保證數(shù)據(jù)庫隔離級別的一致,你一定要記得將MySQL的隔離級別設(shè)置為“讀提交”厂庇。
配置的方式是渠啊,將啟動參數(shù) transaction-isolation 的值設(shè)置成 READ-COMMITTED ∪酰可以用 show variables 來查看當(dāng)前的值替蛉。
mysql> show variables like 'transaction_isolation';
+-----------------------+----------------+
| Variable_name | Value |
+-----------------------+----------------+
| transaction_isolation | READ-COMMITTED |
+-----------------------+----------------+
可重復(fù)讀級別的應(yīng)用
總結(jié)來說,存在即合理拄氯,哪個隔離級別都有它自己的使用場景躲查,根據(jù)自己的業(yè)務(wù)情況來定。
如需要“可重復(fù)讀”的場景译柏。
一個數(shù)據(jù)校對邏輯的案例镣煮。
假設(shè)你在管理一個個人銀行賬戶表。一個表存了每個月月底的余額鄙麦,一個表存了賬單明細典唇。這時候你要做數(shù)據(jù)校對镊折,也就是判斷上個月的余額和當(dāng)前余額的差額,是否與本月的賬單明細一致介衔。你一定希望在校對過程中恨胚,即使有用戶發(fā)生了一筆新的交易,也不影響你的校對結(jié)果炎咖。
這時候使用“可重復(fù)讀”隔離級別就很方便赃泡。事務(wù)啟動時的視圖可以認為是靜態(tài)的,不受其他事務(wù)更新的影響乘盼。
事務(wù)隔離的實現(xiàn)
再來看看事務(wù)隔離具體是怎么實現(xiàn)的升熊。這里展開說明“可重復(fù)讀”。
在 MySQL 中绸栅,實際上每條記錄在更新的時候都會同時記錄一條回滾操作级野。記錄上的最新值,通過回滾操作阴幌,都可以得到前一個狀態(tài)的值勺阐。
假設(shè)一個值從 1 被按順序改成了2、3矛双、4,在回滾日志里面就會有類似下面的記錄蟆豫。
當(dāng)前值是4议忽,但是在查詢這條記錄的時候,不同時刻啟動的事務(wù)會有不同的read-view十减。如圖中看到的栈幸,在視圖A、B帮辟、C里面速址,這一個記錄的值分別是1、2由驹、4芍锚,同一條記錄在系統(tǒng)中可以存在多個版本,就是數(shù)據(jù)庫的多版本并發(fā)控制(MVCC)蔓榄。對于read-view A并炮,要得到1,就必須將當(dāng)前值依次執(zhí)行圖中所有的回滾操作得到甥郑。
同時你會發(fā)現(xiàn)逃魄,即使現(xiàn)在有另外一個事務(wù)正在將4改成5,這個事務(wù)跟read-view A澜搅、B伍俘、C對應(yīng)的事務(wù)是不會沖突的邪锌。
你一定會問,回滾日志總不能一直保留吧癌瘾,什么時候刪除呢觅丰?答案是,在不需要的時候才刪除柳弄。也就是說舶胀,系統(tǒng)會判斷,當(dāng)沒有事務(wù)再需要用到這些回滾日志時碧注,回滾日志會被刪除嚣伐。
什么時候才不需要了呢?就是當(dāng)系統(tǒng)里沒有比這個回滾日志更早的read-view的時候萍丐。
基于上面的說明轩端,我們來討論一下為什么建議你盡量不要使用長事務(wù)。
長事務(wù)意味著系統(tǒng)里面會存在很老的事務(wù)視圖逝变。由于這些事務(wù)隨時可能訪問數(shù)據(jù)庫里面的任何數(shù)據(jù)基茵,所以這個事務(wù)提交之前,數(shù)據(jù)庫里面它可能用到的回滾記錄都必須保留壳影,這就會導(dǎo)致大量占用存儲空間拱层。
在MySQL 5.5及以前的版本,回滾日志是跟數(shù)據(jù)字典一起放在ibdata文件里的宴咧,即使長事務(wù)最終提交根灯,回滾段被清理,文件也不會變小掺栅。我見過數(shù)據(jù)只有20GB烙肺,而回滾段有200GB的庫。最終只好為了清理回滾段氧卧,重建整個庫桃笙。
除了對回滾段的影響,長事務(wù)還占用鎖資源沙绝,也可能拖垮整個庫搏明,這個我們會在后面講鎖的時候展開。
事務(wù)的啟動方式
如前面所述宿饱,長事務(wù)有這些潛在風(fēng)險熏瞄,我當(dāng)然是建議你盡量避免。其實很多時候業(yè)務(wù)開發(fā)同學(xué)并不是有意使用長事務(wù)谬以,通常是由于誤用所致强饮。MySQL的事務(wù)啟動方式有以下幾種:
顯式啟動事務(wù)語句, begin 或 start transaction为黎。配套的提交語句是commit邮丰,回滾語句是rollback行您。
set autocommit=0,這個命令會將這個線程的自動提交關(guān)掉剪廉。意味著如果你只執(zhí)行一個select語句娃循,這個事務(wù)就啟動了,而且并不會自動提交斗蒋。這個事務(wù)持續(xù)存在直到你主動執(zhí)行commit 或 rollback 語句捌斧,或者斷開連接。
有些客戶端連接框架會默認連接成功后先執(zhí)行一個set autocommit=0的命令泉沾。這就導(dǎo)致接下來的查詢都在事務(wù)中捞蚂,如果是長連接,就導(dǎo)致了意外的長事務(wù)跷究。
因此姓迅,我會建議你總是使用set autocommit=1, 通過顯式語句的方式來啟動事務(wù)。
但是有的開發(fā)同學(xué)會糾結(jié)“多一次交互”的問題俊马。對于一個需要頻繁使用事務(wù)的業(yè)務(wù)丁存,第二種方式每個事務(wù)在開始時都不需要主動執(zhí)行一次 “begin”,減少了語句的交互次數(shù)柴我。如果你也有這個顧慮解寝,我建議你使用commit work and chain語法。
在autocommit為1的情況下艘儒,用begin顯式啟動的事務(wù)编丘,如果執(zhí)行commit則提交事務(wù)。如果執(zhí)行 commit work and chain彤悔,則是提交事務(wù)并自動啟動下一個事務(wù),這樣也省去了再次執(zhí)行begin語句的開銷索守。同時帶來的好處是從程序開發(fā)的角度明確地知道每個語句是否處于事務(wù)中晕窑。
你可以在information_schema庫的innodb_trx這個表中查詢長事務(wù),比如下面這個語句卵佛,用于查找持續(xù)時間超過60s的事務(wù)杨赤。
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60
小結(jié)
介紹了MySQL的事務(wù)隔離級別的現(xiàn)象和實現(xiàn),根據(jù)實現(xiàn)原理分析了長事務(wù)存在的風(fēng)險截汪,以及如何用正確的方式避免長事務(wù)疾牲。