MVCC概念:InnoDB使用MVCC實(shí)現(xiàn)高并發(fā)
MVCC并不是MySql獨(dú)有的饼煞,Oracle粱哼,PostgreSQL等都實(shí)現(xiàn)了MVCC,但各自實(shí)現(xiàn)機(jī)制不同墓律。因?yàn)镸VCC沒(méi)有統(tǒng)一實(shí)現(xiàn)標(biāo)準(zhǔn)赫粥。
MVCC可以認(rèn)為它是行級(jí)鎖的一個(gè)變種谎亩,但是它在很多情況下避免了加鎖操作梢薪,因此開(kāi)銷更低蹬铺。實(shí)現(xiàn)了非阻塞的讀操作,寫(xiě)操作也只鎖定必要的行秉撇。
MVCC的基本原理:
MVCC的實(shí)現(xiàn)甜攀,通過(guò)保存數(shù)據(jù)在某個(gè)時(shí)間點(diǎn)的快照來(lái)實(shí)現(xiàn)的。這意味著一個(gè)事務(wù)無(wú)論執(zhí)行多長(zhǎng)時(shí)間琐馆,在同一個(gè)事務(wù)里看到數(shù)據(jù)都實(shí)一致的规阀。根據(jù)事務(wù)開(kāi)始的時(shí)間不同,每個(gè)事務(wù)對(duì)同一張表同一個(gè)時(shí)刻看到的數(shù)據(jù)可能不同瘦麸。
MVCC的基本特征:
每行數(shù)據(jù)都存在一個(gè)版本谁撼,每次數(shù)據(jù)更新時(shí)都更新該版本。
修改時(shí)Copy出當(dāng)前版本隨意修改滋饲,各個(gè)事務(wù)之間無(wú)干擾厉碟。
保存時(shí)比較版本號(hào),如果成功(commit)屠缭,則覆蓋原記錄箍鼓;失敗則放棄copy(rollback)
InnoDB存儲(chǔ)引擎MVCC的實(shí)現(xiàn)策略:
通過(guò)在每一行數(shù)據(jù)后面保存兩個(gè)隱藏的列實(shí)現(xiàn):當(dāng)前行創(chuàng)建時(shí)的版本號(hào)和刪除時(shí)的版本號(hào)(可能為空)。這里的版本號(hào)并不是實(shí)際的時(shí)間值呵曹,而是系統(tǒng)版本號(hào)袄秩。每開(kāi)始一個(gè)新的事務(wù),系統(tǒng)版本號(hào)都會(huì)自動(dòng)遞增。事務(wù)開(kāi)始時(shí)刻的系統(tǒng)版本號(hào)會(huì)作為事務(wù)的版本號(hào)之剧,用來(lái)和查詢到的每行記錄的版本號(hào)進(jìn)行比較郭卫。
每個(gè)事務(wù)又有自己的版本號(hào),這樣事務(wù)內(nèi)執(zhí)行CRUD操作時(shí)背稼,就通過(guò)版本號(hào)的比較來(lái)達(dá)到數(shù)據(jù)版本控制的目的贰军。具體做法見(jiàn)下面的示意圖。
MVCC具體的操作如下:
SELECT:InnoDB會(huì)根據(jù)以下兩個(gè)條件檢查每行記錄:
1)InnoDB只查找版本早于當(dāng)前事務(wù)版本的數(shù)據(jù)行(也就是蟹肘,行的系統(tǒng)版本號(hào)小于或等于事務(wù)的系統(tǒng)版本號(hào))词疼,這樣可以確保事務(wù)讀取的行,要么是在事務(wù)開(kāi)始前已經(jīng)存在的帘腹,要么是事務(wù)自身插入或者修改過(guò)的贰盗。
2)行的刪除版本要么未定義,要么大于當(dāng)前事務(wù)版本號(hào)阳欲。這可以確保事務(wù)讀取到的行舵盈,在事務(wù)開(kāi)始之前未被刪除。
INSERT:InnoDB為新插入的每一行保存當(dāng)前系統(tǒng)版本號(hào)作為行版本號(hào)球化。
DELETE:InnoDB為刪除的每一行保存當(dāng)前系統(tǒng)版本號(hào)作為行刪除標(biāo)識(shí)秽晚。
UPDATE:InnoDB為插入一行新記錄,保存當(dāng)前系統(tǒng)版本號(hào)作為行版本號(hào)筒愚,同時(shí)保存當(dāng)系統(tǒng)的版本號(hào)為原來(lái)的行作為刪除標(biāo)識(shí)赴蝇。
保存這兩個(gè)額外系統(tǒng)版本號(hào),使大多數(shù)操作都可以不用加鎖巢掺。這樣設(shè)計(jì)使得計(jì)數(shù)據(jù)操作很簡(jiǎn)單句伶,性能很好,并且也能保證只會(huì)讀取到符合標(biāo)準(zhǔn)的行陆淀。不足之處是每行記錄都需要額外的存儲(chǔ)空間熄阻,需要做更多的行檢查工作,以及一些額外的維護(hù)工作倔约。
MVCC只在REPEATABLE READ和READ COMMITED兩個(gè)隔離級(jí)別下工作,其它兩個(gè)隔離級(jí)別和MVCC不兼容坝初。
Purge流程
Purge功能:
InnoDB由于要支持多版本協(xié)議浸剩,因此無(wú)論是更新,刪除鳄袍,都只是設(shè)置記錄上的deleted bit標(biāo)記位绢要,而不是真正的刪除記錄。后續(xù)這些記錄的真正刪除拗小,是通過(guò)Purge后臺(tái)進(jìn)程實(shí)現(xiàn)的重罪。Purge進(jìn)程定期掃描InnoDB的undo,按照先讀老undo,再讀新undo的順序剿配,讀取每條undo record搅幅。對(duì)于每一條undo record,判斷其對(duì)應(yīng)的記錄是否可以被purge
MVCC 可以保證不阻塞地讀到一致的數(shù)據(jù)
參考:
http://blog.csdn.net/chen77716/article/details/6742128