事務(wù)定義及四大特性
事務(wù)是什么?
就是用戶定義的一系列數(shù)據(jù)庫(kù)操作臀规,這些操作可以視為一個(gè)完成的邏輯處理工作單元滩援,要么全部執(zhí)行,要么全部不執(zhí)行塔嬉,是不可分割的工作單元玩徊。
事務(wù)的四大特性(簡(jiǎn)稱ACID):
原子性(Atomicity):一個(gè)事務(wù)是一個(gè)不可分割的工作單位,事務(wù)中包括的操作要么都做谨究,要么都不做恩袱。
一致性(Consistency):事務(wù)必須是使數(shù)據(jù)庫(kù)從一個(gè)一致性狀態(tài)變到另一個(gè)一致性狀態(tài)。一致性與原子性是密切相關(guān)的胶哲。
隔離性(Isolation):一個(gè)事務(wù)的執(zhí)行不能被其他事務(wù)干擾畔塔。即一個(gè)事務(wù)內(nèi)部的操作及使用的數(shù)據(jù)對(duì)并發(fā)的其他事務(wù)是隔離的,并發(fā)執(zhí)行的各個(gè)事務(wù)之間不能互相干擾.
持久性(Durability):指一個(gè)事務(wù)一旦提交纪吮,它對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的改變就應(yīng)該是永久性的,接下來(lái)的其他操作或故障不應(yīng)該對(duì)其有任何影響俩檬。
事務(wù)中常見問(wèn)題
臟讀(dirty read):就是一個(gè)A事務(wù)即便沒(méi)有提交,它對(duì)數(shù)據(jù)的修改也可以被其他事務(wù)B事務(wù)看到碾盟,B事務(wù)讀到了A事務(wù)還未提交的數(shù)據(jù),這個(gè)數(shù)據(jù)有可能是錯(cuò)的技竟,有可能A不想提交這個(gè)數(shù)據(jù)冰肴,這只是A事務(wù)修改數(shù)據(jù)過(guò)程中的一個(gè)中間數(shù)據(jù),但是被B事務(wù)讀到了榔组,這種行為被稱作臟讀熙尉,這個(gè)數(shù)據(jù)被稱為臟數(shù)據(jù)
不可重復(fù)讀(non-repeatable read):在A事務(wù)內(nèi),多次讀取同一個(gè)數(shù)據(jù)搓扯,但是讀取的過(guò)程中检痰,B事務(wù)對(duì)這個(gè)數(shù)據(jù)進(jìn)行了修改,導(dǎo)致此數(shù)據(jù)變化了锨推,那么A事務(wù)再次讀取的時(shí)候铅歼,數(shù)據(jù)就和第一次讀取的時(shí)候不一樣了公壤,這就叫做不可重復(fù)讀
幻讀(phantom read):A事務(wù)多次查詢數(shù)據(jù)庫(kù),結(jié)果發(fā)現(xiàn)查詢的數(shù)據(jù)條數(shù)不一樣椎椰,A事務(wù)多次查詢的間隔中厦幅,B事務(wù)又寫入了一些符合查詢條件的多條數(shù)據(jù)(這里的寫入可以是update,insert慨飘,delete)确憨,A事務(wù)再查的話,就像發(fā)生了幻覺一樣瓤的,怎么突然改變了這么多休弃,這種現(xiàn)象這就叫做幻讀
隔離級(jí)別——產(chǎn)生問(wèn)題的原因
多個(gè)事務(wù)互相影響,并沒(méi)有隔離好圈膏,就是我們剛才提到的事務(wù)的四大特性中的 隔離性(Isolation) 出現(xiàn)了問(wèn)題 事務(wù)的隔離級(jí)別并沒(méi)有設(shè)置好玫芦,下面我們來(lái)看下事務(wù)究竟有哪幾種隔離級(jí)別
隔離級(jí)別
讀未提交(read uncommitted RU): 一個(gè)事務(wù)還沒(méi)提交時(shí),它做的變更就能被別的事務(wù)看到
讀提交(read committed RC): 一個(gè)事務(wù)提交之后本辐,它做的變更才會(huì)被其他事務(wù)看到桥帆。
可重復(fù)讀(repeatable read RR): 一個(gè)事務(wù)執(zhí)行過(guò)程中看到的數(shù)據(jù),總是跟這個(gè)事務(wù)在啟動(dòng)時(shí)看到的數(shù)據(jù)是一致的慎皱。當(dāng)然在可重復(fù)讀隔離級(jí)別下老虫,未提交變更對(duì)其他事務(wù)也是不可見的。
串行化(serializable ): 顧名思義是對(duì)于同一行記錄茫多,“寫”會(huì)加“寫鎖”祈匙,“讀”會(huì)加“讀鎖”。當(dāng)出現(xiàn)讀寫鎖沖突的時(shí)候天揖,后訪問(wèn)的事務(wù)必須等前一個(gè)事務(wù)執(zhí)行完成夺欲,才能繼續(xù)執(zhí)行。
我們來(lái)看個(gè)例子今膊,更加直觀的了解這四種隔離級(jí)別和上述問(wèn)題臟讀些阅,不可重復(fù)讀,幻讀的關(guān)系
下面我們討論下當(dāng)事務(wù)處于不同隔離級(jí)別情況時(shí)斑唬,V1,V2,V3分別是什么不同的值吧
下面我們討論下當(dāng)事務(wù)處于不同隔離級(jí)別情況時(shí)市埋,V1,V2,V3分別是什么不同的值吧
讀未提交 (RU): A事務(wù)可以讀取到B事務(wù)修改的值,即便B事務(wù)沒(méi)有提交恕刘。所以V1就是200
V1 : 200
V2 : 200
V3 : 200
讀提交(RC): 當(dāng)B事務(wù)沒(méi)有提交的時(shí)候缤谎,A事務(wù)不可以看到B事務(wù)修改的值,只有提交以后才可以看到
V1 : 100
V2 : 200
V3 : 200
可重復(fù)讀(RR): A事務(wù)多次讀取數(shù)據(jù)褐着,數(shù)據(jù)總和第一次讀取的一樣坷澡,
V1 : 100
V2 : 100
V3 : 200
串行化(S): 事務(wù)A在執(zhí)行的時(shí)候,事務(wù)B會(huì)被鎖住含蓉,等事務(wù)A執(zhí)行結(jié)束后频敛,事務(wù)B才可以繼續(xù)執(zhí)行
V1 : 100
V2 : 100
V3 : 200
MVCC原理
MVCC(Multi-Version Concurrency Control)多版本并發(fā)控制项郊,是數(shù)據(jù)庫(kù)控制并發(fā)訪問(wèn)的一種手段。
特別要注意MVCC只在 讀已提交(RC) 和 可重復(fù)度(RR) 這兩種事務(wù)隔離級(jí)別下才有效
是 數(shù)據(jù)庫(kù)引擎(InnoDB) 層面實(shí)現(xiàn)的姻政,用來(lái)處理讀寫沖突的手段(不用加鎖)呆抑,提高訪問(wèn)性能
MVCC是怎么實(shí)現(xiàn)的呢?它靠的就是版本鏈和一致性視圖
- 版本鏈
版本鏈?zhǔn)且粭l鏈表汁展,鏈接的是每條數(shù)據(jù)曾經(jīng)的修改記錄
那么這個(gè)版本鏈又是如何形成的呢鹊碍,每條數(shù)據(jù)又是靠什么鏈接起來(lái)的呢?
其實(shí)是這樣的食绿,對(duì)于InnoDB存儲(chǔ)引擎的表來(lái)說(shuō)侈咕,它的聚簇索引記錄包含兩個(gè)隱藏字段
trx_id: 存儲(chǔ)修改此數(shù)據(jù)的事務(wù)id,只有這個(gè)事務(wù)操作了某些表的數(shù)據(jù)后當(dāng)更改操作發(fā)生的時(shí)候(update,delete,insert)器紧,才會(huì)分配唯一的事務(wù)id,并且此事務(wù)id是遞增的
roll_pointer: 指針耀销,指向上一次修改的記錄
row_id(非必須): 當(dāng)有主鍵或者有不允許為null的unique鍵時(shí),不包含此字段
假如說(shuō)當(dāng)前數(shù)據(jù)庫(kù)有一條這樣的數(shù)據(jù)铲汪,假設(shè)是事務(wù)ID為100的事務(wù)插入的這條數(shù)據(jù)熊尉,那么此條數(shù)據(jù)的結(jié)構(gòu)如下
后來(lái),事務(wù)200掌腰,事務(wù)300狰住,分別來(lái)修改此數(shù)據(jù)
所以此時(shí)的版本鏈如下
我們每更改一次數(shù)據(jù),就會(huì)插入一條undo日志齿梁,并且記錄的roll_pointer指針會(huì)指向上一條記錄催植,如圖所示
第一條數(shù)據(jù)是小杰,事務(wù)ID為100
事務(wù)ID為200的事務(wù)將名稱從小杰改為了A
事務(wù)ID為200的事務(wù)將名稱從A又改為了B
事務(wù)ID為300的事務(wù)將名稱從B又改為了C
所以串成的鏈表就是 C -> B -> A -> 小杰 (從最新的數(shù)據(jù)到最老的數(shù)據(jù))
- 一致性視圖(ReadView)
需要判斷版本鏈中的哪個(gè)版本是是當(dāng)前事務(wù)可見的勺择,因此有了一致性視圖的概念创南。其中有四個(gè)屬性比較重要
m_ids: 在生成ReadView時(shí),當(dāng)前活躍的讀寫事務(wù)的事務(wù)id列表
min_trx_id: m_ids的最小值
max_trx_id: m_ids的最大值+1
creator_trx_id: 生成該事務(wù)的事務(wù)id省核,單純開啟事務(wù)是沒(méi)有事務(wù)id的稿辙,默認(rèn)為0,creator_trx_id是0芳撒。
版本鏈中的當(dāng)前版本是否可以被當(dāng)前事務(wù)可見的要根據(jù)這四個(gè)屬性按照以下幾種情況來(lái)判斷
當(dāng) trx_id = creator_trx_id 時(shí):當(dāng)前事務(wù)可以看見自己所修改的數(shù)據(jù)邓深, 可見,
當(dāng) trx_id < min_trx_id 時(shí) : 生成此數(shù)據(jù)的事務(wù)已經(jīng)在生成readView前提交了笔刹, 可見
當(dāng) trx_id >= max_trx_id 時(shí) :表明生成該數(shù)據(jù)的事務(wù)是在生成ReadView后才開啟的, 不可見
當(dāng) min_trx_id <= trx_id < max_trx_id 時(shí)
trx_id 在 m_ids 列表里面 :生成ReadView時(shí)冬耿,活躍事務(wù)還未提交舌菜,不可見
trx_id 不在 m_ids 列表里面 :事務(wù)在生成readView前已經(jīng)提交了,可見
如果某個(gè)版本數(shù)據(jù)對(duì)當(dāng)前事務(wù)不可見亦镶,那么則要順著版本鏈繼續(xù)向前尋找下個(gè)版本日月,繼續(xù)這樣判斷袱瓮,以此類推。
注:RR和RC生成一致性視圖的時(shí)機(jī)不一樣 (這也是兩種隔離級(jí)別實(shí)現(xiàn)的主要區(qū)別)
讀提交(read committed RC) 是在每一次select的時(shí)候生成ReadView的
可重復(fù)讀(repeatable read RR)是在第一次select的時(shí)候生成ReadView的
下面咱們一起來(lái)舉個(gè)例子實(shí)戰(zhàn)一下爱咬。
RR與RC和MVCC的例子實(shí)戰(zhàn)
假如說(shuō)尺借,我們有多個(gè)事務(wù)如下執(zhí)行,我們通過(guò)這個(gè)例子來(lái)分析當(dāng)數(shù)據(jù)庫(kù)隔離級(jí)別為RC和RR的情況下精拟,當(dāng)時(shí)讀數(shù)據(jù)的一致性視圖和版本鏈燎斩,也就是MVCC,分別是怎么樣的蜂绎。
假設(shè)數(shù)據(jù)庫(kù)中有一條初始數(shù)據(jù) 姓名是java小杰要加油栅表,id是1 (id,姓名,trx_id,roll_point),插入此數(shù)據(jù)的事務(wù)id是1
尤其要指出的是师枣,只有這個(gè)事務(wù)操作了某些表的數(shù)據(jù)后當(dāng)更改操作發(fā)生的時(shí)候(update,delete,insert)怪瓶,才會(huì)分配唯一的事務(wù)id,并且此事務(wù)id是遞增的,單純開啟事務(wù)是沒(méi)有事務(wù)id的践美,默認(rèn)為0洗贰,creator_trx_id是0。
以下例子中的A,B,C的意思是將姓名更改為A,B,C 讀也是讀取當(dāng)前時(shí)刻的姓名,默認(rèn)全都開啟事務(wù),并且此事務(wù)都經(jīng)歷過(guò)某些操作產(chǎn)生了事務(wù)id
時(shí)間事務(wù)100事務(wù)200事務(wù)300事務(wù)400T1A
讀已提交(RC)與MVCC
一個(gè)事務(wù)提交之后陨倡,它做的變更才會(huì)被其他事務(wù)看到
每次讀的時(shí)候敛滋,ReadView(一致性視圖)都會(huì)重新生成
當(dāng)T1時(shí)刻時(shí),事務(wù)100修改名字為A
當(dāng)T2時(shí)刻時(shí)玫膀,事務(wù)100修改名字為B
當(dāng)T3時(shí)刻時(shí)矛缨,事務(wù)200修改名字為C
當(dāng)T4時(shí)刻時(shí),事務(wù)300開始讀取名字
此時(shí)這條數(shù)據(jù)的版本鏈如下
同顏色代表是同一事務(wù)內(nèi)的操作
來(lái)我們靜下心來(lái)好好分析一下此時(shí)T4時(shí)刻事務(wù)300要讀了帖旨,究竟會(huì)讀到什么數(shù)據(jù)箕昭?
當(dāng)前最近的一條數(shù)據(jù)是,C解阅,事務(wù)200修改的落竹,還記得我們前文說(shuō)的一致性視圖的幾個(gè)屬性嗎,和按照什么規(guī)則判斷這個(gè)數(shù)據(jù)能不能被當(dāng)前事務(wù)讀货抄。我們就分析這個(gè)例子述召。
此時(shí) (生成一致性視圖ReadView)
m_ids 是[100,200]: 當(dāng)前活躍的讀寫事務(wù)的事務(wù)id列表
min_trx_id 是 100: m_ids的最小值
max_trx_id 是 201: m_ids的最大值+1
當(dāng)前數(shù)據(jù)的trx_id(事務(wù)id)是 200,符合min_trx_id<=trx_id<max_trx_id 此時(shí)需要判斷 trx_id 是否在m_ids活躍事務(wù)列表里面蟹地,一看积暖,活躍事務(wù)列表里面是【100,200】怪与,只有兩個(gè)事務(wù)活躍夺刑,而此時(shí)的trx_id是200,則trx_id在活躍事務(wù)列表里面,活躍事務(wù)列表代表還未提交的事務(wù)遍愿,所以該版本數(shù)據(jù)不可見存淫,就要根據(jù)roll_point指針指向上一個(gè)版本,繼續(xù)這樣的判斷沼填,上一個(gè)版本事務(wù)id是100桅咆,數(shù)據(jù)是B,發(fā)現(xiàn)100也在活躍事務(wù)列表里面坞笙,所以不可見岩饼,繼續(xù)找到上個(gè)版本,事務(wù)是100羞海,數(shù)據(jù)是A忌愚,發(fā)現(xiàn)是同樣的情況,繼續(xù)找到上個(gè)版本却邓,發(fā)現(xiàn)事務(wù)是1硕糊,數(shù)據(jù)是小杰,1小于100腊徙,trx_id<min_trx_id简十,代表生成這個(gè)數(shù)據(jù)的事務(wù)已經(jīng)在生成ReadView前提交了,此數(shù)據(jù)可以被讀到撬腾。所以讀取的數(shù)據(jù)就是小杰
分析完第一個(gè)讀螟蝙,我們繼續(xù)向下分析
當(dāng)T5時(shí)刻時(shí),事務(wù)100提交
當(dāng)T6時(shí)刻時(shí)民傻,事務(wù)300將名字改為D
當(dāng)T7時(shí)刻時(shí)胰默,事務(wù)400讀取當(dāng)前數(shù)據(jù)
此時(shí)這條數(shù)據(jù)的版本鏈如下
此時(shí) (重新生成一致性視圖ReadView)
m_ids 是[200,300]: 當(dāng)前活躍的讀寫事務(wù)的事務(wù)id列表
min_trx_id 是 200: m_ids的最小值
max_trx_id 是 301: m_ids的最大值+1
當(dāng)前數(shù)據(jù)事務(wù)id是300,數(shù)據(jù)為D漓踢,符合min_trx_id<=trx_id<max_trx_id 此時(shí)需要判斷數(shù)據(jù)是否在活躍事務(wù)列表里牵署,300在這里面,所以就是還未提交的事務(wù)就是不可見喧半,所以就去查看上個(gè)版本的數(shù)據(jù)奴迅,上個(gè)版本事務(wù)id是200,數(shù)據(jù)是C挺据,也在活躍事務(wù)列表里面取具,也不可見,繼續(xù)向上個(gè)版本找扁耐,上個(gè)版本事務(wù)id是100暇检,數(shù)據(jù)是B,100小于min_trx_id婉称,就代表占哟,代表生成這個(gè)數(shù)據(jù)的事務(wù)已經(jīng)在生成ReadView前提交了,此數(shù)據(jù)可見酿矢,所以讀取出來(lái)的數(shù)據(jù)就是B
分析完第二個(gè)讀榨乎,我們繼續(xù)向下分析
當(dāng)T8時(shí)刻時(shí),事務(wù)200將名字改為E
當(dāng)T9時(shí)刻時(shí)瘫筐,事務(wù)200提交
當(dāng)T10時(shí)刻時(shí)蜜暑,事務(wù)300讀取當(dāng)前數(shù)據(jù)
此時(shí)這條數(shù)據(jù)的版本鏈如下
此時(shí) (重新生成一致性視圖ReadView)
m_ids 是[300]: 當(dāng)前活躍的讀寫事務(wù)的事務(wù)id列表
min_trx_id 是 300: m_ids的最小值
max_trx_id 是 301: m_ids的最大值+1
當(dāng)前事務(wù)id是200,200<min_trx_id ,代表生成這個(gè)數(shù)據(jù)的事務(wù)已經(jīng)在生成ReadView前提交了策肝,此數(shù)據(jù)可見肛捍,所以讀出的數(shù)據(jù)就是E.
當(dāng)隔離級(jí)別是讀已提交RC的情況下,每次讀都會(huì)重新生成 一致性視圖(ReadView)
T4時(shí)刻 事務(wù)300讀取到的數(shù)據(jù)是小杰
T7時(shí)刻 事務(wù)400讀取到的數(shù)據(jù)是B
T10時(shí)刻 事務(wù)300讀取到的數(shù)據(jù)是E
可重復(fù)讀(RR)與MVCC
一個(gè)事務(wù)執(zhí)行過(guò)程中看到的數(shù)據(jù)之众,總是跟這個(gè)事務(wù)在啟動(dòng)時(shí)看到的數(shù)據(jù)是一致的
所以對(duì)于事務(wù)300來(lái)講拙毫,它分別在T4和T10的時(shí)候,讀取數(shù)據(jù)棺禾,但是它的一致性視圖缀蹄,用的永遠(yuǎn)都是第一次讀取時(shí)的視圖,就是T3時(shí)刻產(chǎn)生的一致性視圖
RR和RC的版本鏈?zhǔn)且粯拥谋焐簦桥袛喈?dāng)前數(shù)據(jù)可見與否用到的一致性視圖不一樣
在此可重復(fù)讀RR隔離級(jí)別下缺前,
T4時(shí)刻時(shí)事務(wù)300第一次讀時(shí)的分析和結(jié)果與RC都一樣,可以見上文分析與結(jié)果
T7時(shí)刻時(shí)事務(wù)400第一次讀時(shí)的分析和結(jié)果與RC都一樣悬襟,可以見上文分析與結(jié)果
T10時(shí)刻時(shí)事務(wù)300第二次讀時(shí)的一致性視圖和第一次讀時(shí)的一樣衅码,所以此時(shí)到底讀取到什么數(shù)據(jù)就要重新分析了
此時(shí) (用的是第一次讀時(shí)生成的一致性視圖ReadView)
m_ids 是[100,200]: 當(dāng)前活躍的讀寫事務(wù)的事務(wù)id列表
min_trx_id 是 100: m_ids的最小值
max_trx_id 是 201: m_ids的最大值+1
此時(shí)的版本鏈?zhǔn)?/p>
當(dāng)前數(shù)據(jù)的事務(wù)id是200,數(shù)據(jù)是E脊岳,在當(dāng)前事務(wù)活躍列表里面逝段,所以數(shù)據(jù)不可見,根據(jù)回滾指針找到上個(gè)版本割捅,發(fā)現(xiàn)事務(wù)id是300奶躯,當(dāng)前事務(wù)也是300,可見棺牧,所以讀取的數(shù)據(jù)是D
我們可以自己思考下巫糙,要是沒(méi)有事務(wù)300這條更改的這條記錄,又該怎么繼續(xù)向下分析呢颊乘?
當(dāng)隔離級(jí)別是可重復(fù)讀RR的情況下参淹,每次讀都會(huì)用第一次讀取數(shù)據(jù)時(shí)生成的一致性視圖(ReadView)
T4時(shí)刻 事務(wù)300讀取到的數(shù)據(jù)是小杰
T7時(shí)刻 事務(wù)400讀取到的數(shù)據(jù)是B
T10時(shí)刻 事務(wù)300讀取到的數(shù)據(jù)是D