本篇講訴數(shù)據(jù)庫中事務(wù)的四大特性(ACID)袜刷,并且將會詳細(xì)地說明事務(wù)的隔離級別瓜挽。
如果一個(gè)數(shù)據(jù)庫聲稱支持事務(wù)的操作晨抡,那么該數(shù)據(jù)庫必須要具備以下四個(gè)特性:
⑴ 原子性(Atomicity)
原子性是指事務(wù)包含的所有操作要么全部成功派昧,要么全部失敗回滾特笋,這和前面兩篇博客介紹事務(wù)的功能是一樣的概念剃浇,因此事務(wù)的操作如果成功就必須要完全應(yīng)用到數(shù)據(jù)庫,如果操作失敗則不能對數(shù)據(jù)庫有任何影響猎物。
⑵ 一致性(Consistency)
一致性是指事務(wù)必須使數(shù)據(jù)庫從一個(gè)一致性狀態(tài)變換到另一個(gè)一致性狀態(tài)虎囚,也就是說一個(gè)事務(wù)執(zhí)行之前和執(zhí)行之后都必須處于一致性狀態(tài)。
拿轉(zhuǎn)賬來說蔫磨,假設(shè)用戶A和用戶B兩者的錢加起來一共是5000淘讥,那么不管A和B之間如何轉(zhuǎn)賬,轉(zhuǎn)幾次賬堤如,事務(wù)結(jié)束后兩個(gè)用戶的錢相加起來應(yīng)該還得是5000蒲列,這就是事務(wù)的一致性。
⑶ 隔離性(Isolation)
隔離性是當(dāng)多個(gè)用戶并發(fā)訪問數(shù)據(jù)庫時(shí)搀罢,比如操作同一張表時(shí)蝗岖,數(shù)據(jù)庫為每一個(gè)用戶開啟的事務(wù),不能被其他事務(wù)的操作所干擾榔至,多個(gè)并發(fā)事務(wù)之間要相互隔離抵赢。
即要達(dá)到這么一種效果:對于任意兩個(gè)并發(fā)的事務(wù)T1和T2,在事務(wù)T1看來,T2要么在T1開始之前就已經(jīng)結(jié)束铅鲤,要么在T1結(jié)束之后才開始划提,這樣每個(gè)事務(wù)都感覺不到有其他事務(wù)在并發(fā)地執(zhí)行。
關(guān)于事務(wù)的隔離性數(shù)據(jù)庫提供了多種隔離級別彩匕,稍后會介紹到腔剂。
⑷ 持久性(Durability)
持久性是指一個(gè)事務(wù)一旦被提交了媒区,那么對數(shù)據(jù)庫中的數(shù)據(jù)的改變就是永久性的驼仪,即便是在數(shù)據(jù)庫系統(tǒng)遇到故障的情況下也不會丟失提交事務(wù)的操作。
例如我們在使用JDBC操作數(shù)據(jù)庫時(shí)袜漩,在提交事務(wù)方法后绪爸,提示用戶事務(wù)操作完成,當(dāng)我們程序執(zhí)行完成直到看到提示后宙攻,就可以認(rèn)定事務(wù)以及正確提交奠货,即使這時(shí)候數(shù)據(jù)庫出現(xiàn)了問題,也必須要將我們的事務(wù)完全執(zhí)行完成座掘,否則就會造成我們看到提示事務(wù)處理完畢递惋,但是數(shù)據(jù)庫因?yàn)楣收隙鴽]有執(zhí)行事務(wù)的重大錯(cuò)誤。
以上介紹完事務(wù)的四大特性(簡稱ACID)溢陪,現(xiàn)在重點(diǎn)來說明下事務(wù)的隔離性萍虽,當(dāng)多個(gè)線程都開啟事務(wù)操作數(shù)據(jù)庫中的數(shù)據(jù)時(shí),數(shù)據(jù)庫系統(tǒng)要能進(jìn)行隔離操作形真,以保證各個(gè)線程獲取數(shù)據(jù)的準(zhǔn)確性杉编,在介紹數(shù)據(jù)庫提供的各種隔離級別之前,我們先看看如果不考慮事務(wù)的隔離性咆霜,會發(fā)生的幾種問題:
1邓馒,臟讀
臟讀是指在一個(gè)事務(wù)處理過程里讀取了另一個(gè)未提交的事務(wù)中的數(shù)據(jù)。
2蛾坯,不可重復(fù)讀
不可重復(fù)讀是指在對于數(shù)據(jù)庫中的某個(gè)數(shù)據(jù)光酣,一個(gè)事務(wù)范圍內(nèi)多次查詢卻返回了不同的數(shù)據(jù)值,這是由于在查詢間隔脉课,被另一個(gè)事務(wù)修改并提交了挂疆。
例如事務(wù)T1在讀取某一數(shù)據(jù),而事務(wù)T2立馬修改了這個(gè)數(shù)據(jù)并且提交事務(wù)給數(shù)據(jù)庫下翎,事務(wù)T1再次讀取該數(shù)據(jù)就得到了不同的結(jié)果缤言,發(fā)送了不可重復(fù)讀。
不可重復(fù)讀和臟讀的區(qū)別是视事,臟讀是某一事務(wù)讀取了另一個(gè)事務(wù)未提交的臟數(shù)據(jù)胆萧,而不可重復(fù)讀則是讀取了前一事務(wù)提交的數(shù)據(jù)。
在某些情況下,不可重復(fù)讀并不是問題跌穗,比如我們多次查詢某個(gè)數(shù)據(jù)當(dāng)然以最后查詢得到的結(jié)果為主订晌。但在另一些情況下就有可能發(fā)生問題,例如對于同一個(gè)數(shù)據(jù)A和B依次查詢就可能不同蚌吸,A和B就可能打起來了……
3锈拨,虛讀(幻讀)
幻讀是事務(wù)非獨(dú)立執(zhí)行時(shí)發(fā)生的一種現(xiàn)象。例如事務(wù)T1對一個(gè)表中所有的行的某個(gè)數(shù)據(jù)項(xiàng)做了從“1”修改為“2”的操作羹唠,這時(shí)事務(wù)T2又對這個(gè)表中插入了一行數(shù)據(jù)項(xiàng)奕枢,而這個(gè)數(shù)據(jù)項(xiàng)的數(shù)值還是為“1”并且提交給數(shù)據(jù)庫。而操作事務(wù)T1的用戶如果再查看剛剛修改的數(shù)據(jù)佩微,會發(fā)現(xiàn)還有一行沒有修改缝彬,其實(shí)這行是從事務(wù)T2中添加的,就好像產(chǎn)生幻覺一樣哺眯,這就是發(fā)生了幻讀谷浅。
幻讀和不可重復(fù)讀都是讀取了另一條已經(jīng)提交的事務(wù)(這點(diǎn)就臟讀不同),所不同的是不可重復(fù)讀查詢的都是同一個(gè)數(shù)據(jù)項(xiàng)奶卓,而幻讀針對的是一批數(shù)據(jù)整體(比如數(shù)據(jù)的個(gè)數(shù))一疯。
三級封鎖協(xié)議
數(shù)據(jù)庫想要在“合適”的時(shí)機(jī)阻塞住數(shù)據(jù)庫操作,那么首先要定義好怎么樣的時(shí)機(jī)算是“合適”夺姑,因?yàn)楦鱾€(gè)系統(tǒng)支持的業(yè)務(wù)千差萬別墩邀,對數(shù)據(jù)的實(shí)時(shí)性和有效性的要求也不同。于是數(shù)據(jù)庫理論中就提出了封鎖級別的概念瑟幕,對不同的同步要求采用不同的封鎖級別磕蒲。
三級封鎖協(xié)議內(nèi)容如下:
一級封鎖協(xié)議:事務(wù)T在修改數(shù)據(jù)R之前必須先對其加X鎖,直到事務(wù)結(jié)束才釋放只盹。事務(wù)結(jié)束包括正常結(jié)束(COMMIT)和非正常結(jié)束(ROLLBACK)辣往。 一級封鎖協(xié)議可以防止丟失修改,并保證事務(wù)T是可恢復(fù)的殖卑。使用一級封鎖協(xié)議可以解決丟失修改問題站削。在一級封鎖協(xié)議中,如果僅僅是讀數(shù)據(jù)不對其進(jìn)行修改孵稽,是不需要加鎖的许起,它不能保證可重復(fù)讀和不讀“臟”數(shù)據(jù)。 二級封鎖協(xié)議:一級封鎖協(xié)議加上事務(wù)T在讀取數(shù)據(jù)R之前必須先對其加S鎖菩鲜,讀完后方可釋放S鎖园细。 二級封鎖協(xié)議除防止了丟失修改,還可以進(jìn)一步防止讀“臟”數(shù)據(jù)接校。但在二級封鎖協(xié)議中猛频,由于讀完數(shù)據(jù)后即可釋放S鎖,所以它不能保證可重復(fù)讀。 三級封鎖協(xié)議 :一級封鎖協(xié)議加上事務(wù)T在讀取數(shù)據(jù)R之前必須先對其加S鎖鹿寻,直到事務(wù)結(jié)束才釋放睦柴。 三級封鎖協(xié)議除防止了丟失修改和不讀“臟”數(shù)據(jù)外,還進(jìn)一步防止了不可重復(fù)讀毡熏。
現(xiàn)在來看看MySQL數(shù)據(jù)庫為我們提供的四種隔離級別:
① Serializable (串行化):可避免臟讀坦敌、不可重復(fù)讀、幻讀的發(fā)生痢法。
② Repeatable read (可重復(fù)讀):可避免臟讀狱窘、不可重復(fù)讀的發(fā)生。
③ Read committed (讀已提交):可避免臟讀的發(fā)生疯暑。
④ Read uncommitted (讀未提交):最低級別训柴,任何情況都無法保證哑舒。
臟讀 不可重復(fù)讀 幻讀
Read uncommitted √ √ √
Read committed × √ √
Repeatable read × × √
Serializable × × ×
四種級別對并發(fā)問題的解決由弱到強(qiáng)妇拯,相應(yīng)的系統(tǒng)性能由強(qiáng)到弱,MySQL的默認(rèn)級別是Repeatable Read洗鸵。
Read Uncommitted
在Read Uncommitted策略下越锈,數(shù)據(jù)庫遵循一級封鎖協(xié)議,只對修改數(shù)據(jù)的并發(fā)操作做限制膘滨。一個(gè)事務(wù)不能修改其他事務(wù)正在修改的數(shù)據(jù)甘凭,但可以讀取到其他事務(wù)中尚未提交的修改,這些修改如果未被提交火邓,將會成為臟數(shù)據(jù)丹弱。
Read committed
在Read committed策略下,數(shù)據(jù)庫遵循二級封鎖協(xié)議铲咨,只允許讀取已經(jīng)被提交的數(shù)據(jù)躲胳,反過來講,如果一個(gè)事務(wù)修改了某行數(shù)據(jù)且尚未提交纤勒,而第二個(gè)事務(wù)要讀取這行數(shù)據(jù)的話坯苹,那么是不允許的。在MySql的InnoDB下摇天,雖然這種操作不被允許粹湃,但MySQL不會阻塞住數(shù)據(jù)的查詢操作,而是會查詢出數(shù)據(jù)被修改之前的備份泉坐,返回給客戶端为鳄。MySQL的這種機(jī)制稱為MVCC(多版本并發(fā)控制),就是說數(shù)據(jù)庫在事務(wù)并發(fā)的過程中對數(shù)據(jù)維護(hù)多個(gè)版本腕让,使得不同的事務(wù)對不同的數(shù)據(jù)版本進(jìn)行讀寫(MVCC的實(shí)現(xiàn)參見引用中的文章)孤钦。這樣的機(jī)制反映在應(yīng)用中就是,在任何時(shí)候?qū)?shù)據(jù)庫查詢總是可以得到數(shù)據(jù)庫中最近提交的數(shù)據(jù)。為被提交的臟數(shù)據(jù)被隔離起來司训,無法被查詢到构捡,即防止臟讀發(fā)生。
Repeat Read
Repeat Read又比Read Committed更加嚴(yán)格一點(diǎn)壳猜,但仍然是在二級封鎖協(xié)議的范疇勾徽,只是讀取過程受到更多MVCC的影響。在Read Committed下统扳,允許一個(gè)事務(wù)中多次相同查詢得到不同的結(jié)果喘帚,就是所謂的不可重復(fù)讀問題。這在一些應(yīng)用中是允許的咒钟,所以oracle吹由、SQL server上默認(rèn)這一隔離級別,但MySQL沒有朱嘴,它默認(rèn)Repeat Read級別倾鲫。在這一級別下,有賴于MVCC萍嬉,同一個(gè)事務(wù)中的查詢只能查到版本號不高于當(dāng)前事務(wù)版本的數(shù)據(jù)乌昔,即事務(wù)只能看到該事務(wù)開始前或者被該事物影響的數(shù)據(jù)。反過來說壤追,這一級別下磕道,不允許事務(wù)讀取在該事務(wù)開始后新提交的數(shù)據(jù)。即防止了不可重復(fù)讀的發(fā)生行冰。
依靠上面的機(jī)制溺蕉,已經(jīng)做到了在事務(wù)內(nèi)數(shù)據(jù)內(nèi)容的不變,但是不能保證多次查詢得到的數(shù)據(jù)數(shù)量一致悼做。因?yàn)樵谝粋€(gè)事務(wù)執(zhí)行的過程中別的事務(wù)完全可以執(zhí)行數(shù)據(jù)插入疯特,當(dāng)插入了剛好符合查詢條件的數(shù)據(jù)時(shí),就會引發(fā)數(shù)據(jù)查詢結(jié)果集增加贿堰,引發(fā)幻讀辙芍。還有一種情況就是,如果一個(gè)事務(wù)想插入一條數(shù)據(jù)羹与,而另一個(gè)事務(wù)已經(jīng)插入了含有相同主鍵的數(shù)據(jù)故硅,那么當(dāng)前事務(wù)也會被阻塞,并最終執(zhí)行失敗纵搁,雖然當(dāng)前事務(wù)根本無法查詢到這一條數(shù)據(jù)吃衅,這也是一種幻讀。InnoDB提供的間隙鎖機(jī)制可以在一定程度上防止幻讀的發(fā)生腾誉,具體介紹見最后一篇引文徘层。
Serializable
最后峻呕,最強(qiáng)事務(wù)隔離機(jī)制Serializable,它遵循三級封鎖協(xié)議趣效,使得所有的事務(wù)必須串行化執(zhí)行瘦癌,只要有事務(wù)在對表進(jìn)行查詢,那么在此事務(wù)提交前跷敬,任何其他事務(wù)的修改都會被阻塞讯私。這解決了一切并發(fā)問題,但會造成大量的等待西傀、阻塞甚至死鎖斤寇,使系統(tǒng)性能降低。
要注意拥褂,在任何一種隔離機(jī)制下娘锁,都是不允許一個(gè)事務(wù)刪除或修改另一個(gè)事務(wù)影響過而未提交的數(shù)據(jù)的。因?yàn)槭聞?wù)增饺鹃、刪莫秆、改數(shù)據(jù)以后,會在該行加上排它鎖尤慰,排它鎖會阻塞其他事務(wù)再次對該行數(shù)據(jù)操作馏锡。也正是由于排它鎖的存在雷蹂,這四種隔離機(jī)制都不會出現(xiàn)任何一種更新丟失的現(xiàn)象伟端,因?yàn)橐粭l信息根本不允許第二個(gè)事務(wù)進(jìn)行修改。
在MySQL數(shù)據(jù)庫中匪煌,支持上面四種隔離級別责蝠,默認(rèn)的為Repeatable read (可重復(fù)讀);而在Oracle數(shù)據(jù)庫中萎庭,只支持Serializable (串行化)級別和Read committed (讀已提交)這兩種級別霜医,其中默認(rèn)的為Read committed級別。