阿牛去一家中意的公司面試榕茧,本以為憑借以往豐富的經(jīng)驗(yàn),肯定手到擒來客给,結(jié)果第一個(gè)問題用押,我就“出門右拐”了。
問題就是:MySQL是怎么保證事務(wù)一致性的靶剑?
回到家阿牛翻閱資料蜻拨,終于搞懂了池充,在這里分享給大家。
定義
在搞清楚問題答案之前缎讼,先搞清楚以下幾個(gè)名詞以及大致的用處
redo log:
通常是物理日志收夸,記錄的是數(shù)據(jù)頁的物理修改,而不是某一行或某幾行修改成怎樣怎樣血崭,它用來恢復(fù)提交后的物理數(shù)據(jù)頁(恢復(fù)數(shù)據(jù)頁卧惜,且只能恢復(fù)到最后一次提交的位置)、Innodb特有的夹纫,他在存儲(chǔ)引擎層咽瓷。循環(huán)寫的,空間固定會(huì)用完舰讹。作用是crash-safe能力
binlog:
是邏輯日志茅姜,記錄的是這個(gè)語句的原始邏輯,比如“給 ID=2 這一行的 c 字段加 1 ” 是 MySQL 的 Server 層實(shí)現(xiàn)的跺涤,所有引擎都可以使用。是可以追加寫入的,“追加寫”是指 binlog 文件寫到一定大小后會(huì)切換到下一個(gè)监透,并不會(huì)覆蓋以前的日志桶错。作用是數(shù)據(jù)歸檔
undo log:
有兩個(gè)作用:提供回滾和多個(gè)行版本控制(MVCC)。
在數(shù)據(jù)修改的時(shí)候胀蛮,不僅記錄了redo院刁,還記錄了相對(duì)應(yīng)的undo,如果因?yàn)槟承┰驅(qū)е率聞?wù)失敗或回滾了粪狼,可以借助該undo進(jìn)行回滾退腥。
SQL執(zhí)行的過程
了解了以上名詞之后,讓我們看一下“一條更新SQL語句執(zhí)行的過程是什么再榄?”
如圖1有幾個(gè)關(guān)鍵步驟:
1狡刘、先查找記錄所在的Innodb頁在不在內(nèi)存里;如果不在內(nèi)存里則將記錄所在的頁加載在內(nèi)存里困鸥;根據(jù)SQL語句在內(nèi)存中將記錄更新
2嗅蔬、將更新前的記錄寫入undolog
3、根據(jù)記錄的更新值將變更寫入redolog(buffer)中疾就,并將狀態(tài)變更為prepare
4澜术、將變更記錄到邏輯日志
5、redolog日志中的狀態(tài)修改為commit猬腰,返回結(jié)束
至此:一條更新語句的過程結(jié)束
上面的步驟中有些同學(xué)可能會(huì)有一些疑問:為什么更新一條記錄要把一整頁數(shù)據(jù)加載到內(nèi)存里答:因?yàn)镮nnodb引擎中鸟废,最小的存儲(chǔ)單位是頁為什么一定要加載到內(nèi)存里?答:因?yàn)樗械挠?jì)算操作都是在內(nèi)存里姑荷,操作完成后最終才寫回磁盤為什么要寫入redolog盒延,直接寫入磁盤缩擂,然后寫入binlog就好了啊兰英?答:這將在下面會(huì)提到撇叁,請(qǐng)往后看
為了加深理解,準(zhǔn)備了下面2張圖輔助理解
以圖3為例畦贸,讓我們看看在每個(gè)步驟出現(xiàn)異常的時(shí)候陨闹,到底怎么保證事物一致性的吧!1薄坏、步驟123趋厉,所有的操作最多還只是內(nèi)存里,如果出現(xiàn)宕機(jī)胶坠、斷電等異常君账,? 記錄不會(huì)有任何變動(dòng),事物是一致的2沈善、步驟4剛執(zhí)行完乡数,斷電了,因?yàn)閞edolog還處在prepare狀態(tài)闻牡,???這時(shí)候事物也是一致的3净赴、步驟5記錄binlog的過程中斷電了,這時(shí)候要保證主從一致性罩润,? 事物也是不生效的玖翅,最終也是一致的4、步驟6割以、7如果中間任何一個(gè)時(shí)刻斷電了金度,這時(shí)候情況就不一樣了,事物是生效的严沥,因?yàn)閞edolog猜极、binlog的數(shù)據(jù)都是完整的,服務(wù)器重啟后可以按照xid來去查看binlog消玄、redolog中是否都存在魔吐,? 都存在該事物就是生效的。上面就是怎么保證事務(wù)一致性的根本原因
為什么要使用redolog莱找?
回答這個(gè)問題之前酬姆,我們先看看redolog用圖形表示的
圖4是redolog的形象一點(diǎn)的表現(xiàn),并不是說redolog 長(zhǎng)這個(gè)樣子奥溺,只是為了更形象辞色;一般情況下redolog一組4個(gè)文件,每個(gè)文件1個(gè)G浮定,其中write pos是指redolog當(dāng)前寫到什么位置了相满,check point是指上次刷臟結(jié)束的位置层亿,當(dāng)write log和check point重合時(shí),所有的進(jìn)程停止立美,開始新一輪的刷臟操作匿又。刷完后redolog清空開始下一輪的寫入,往返重復(fù)建蹄。
可能這樣表示有點(diǎn)抽象碌更,讓我們看下圖5
從上圖中可以看的更形象一點(diǎn),在sql執(zhí)行的時(shí)候洞慎,會(huì)有磁盤IO將數(shù)據(jù)頁加載到內(nèi)存痛单,然后在內(nèi)存中將數(shù)據(jù)修改,修改后的數(shù)據(jù)頁在內(nèi)存中叫做臟頁(叫臟頁因?yàn)楹痛疟P中的數(shù)據(jù)不一致熬⑼取)旭绒,又因?yàn)樵趦?nèi)存中容易丟失,所以將數(shù)據(jù)頁的變更記錄如redolog中焦人,隨著記錄插入挥吵、更新等操作的增多,redolog空間慢慢的滿了花椭,這時(shí)候就開始刷臟操作了忽匈,page cleaner thread線程會(huì)將所有的臟頁數(shù)據(jù)刷新到磁盤,使得變更最終被持久化到磁盤个从。
講到這里一定還會(huì)有人不太理解脉幢,刷臟之前斷電了咋辦歪沃?
這就是redolog的另一個(gè)重要的作用嗦锐,crash-safe能力,實(shí)現(xiàn)的邏輯是這樣的沪曙,斷電后內(nèi)存的數(shù)據(jù)都沒了奕污,重啟后讀取redolog文件,因?yàn)閞edolog文件記錄的是在Innodb頁x的m處做了y的修改液走,所以根據(jù)redolog將涉及到的Innodb頁重新加載到內(nèi)存碳默,根據(jù)redolog的記錄將內(nèi)存中的數(shù)據(jù)重新修改,這樣就能恢復(fù)斷電前的數(shù)據(jù)了缘眶。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?完
下期預(yù)告:還是MySQL嘱根,敬請(qǐng)期待
本文首發(fā)自:程序員阿牛