事務(wù):
說起mysql innodb存儲(chǔ)引擎的事務(wù)棺克,首先想到就是ACID(不知道的請google)卓鹿,數(shù)據(jù)庫是如何做到ACID的呢泪电?舉個(gè)例子:
數(shù)據(jù)庫數(shù)據(jù)存放的文件稱為data file挎峦;日志文件稱為log file陈哑;數(shù)據(jù)庫數(shù)據(jù)是有緩存的诲泌,如果沒有緩存盲赊,每次都寫或者讀物理disk,那性能就太低下了敷扫。數(shù)據(jù)庫數(shù)據(jù)的緩存稱為data buffer哀蘑,日志(redo)緩存稱為log buffer;既然數(shù)據(jù)庫數(shù)據(jù)有緩存葵第,就很難保證緩存數(shù)據(jù)(臟數(shù)據(jù))與磁盤數(shù)據(jù)的一致性绘迁。比如某次數(shù)據(jù)庫操作:
update driver_info set driver_status = 2 where driver_id = 10001;
更新driver_status字段的數(shù)據(jù)會(huì)存放在緩存中,等待存儲(chǔ)引擎將driver_status刷新data_file卒密,并返回給業(yè)務(wù)方更新成功脊髓。如果此時(shí)數(shù)據(jù)庫宕機(jī),緩存中的數(shù)據(jù)就丟失了栅受,業(yè)務(wù)方卻以為更新成功了将硝,數(shù)據(jù)不一致,也沒有持久化存儲(chǔ)屏镊。
上面的問題就可以通過事務(wù)的ACID特性來保證依疼。
BEGIN trans;
update driver_info set driver_status = 2 where driver_id = 10001;
COMMIT;
這樣執(zhí)行后而芥,更新要么成功律罢,要么失敗。業(yè)務(wù)方的返回和數(shù)據(jù)庫data file中的數(shù)據(jù)保持一致。要保證這樣的特性這就不得不說存儲(chǔ)引擎innodb的redo和undo日志误辑。
redo日志沧踏、undo日志:
存儲(chǔ)引擎也會(huì)為redo undo日志開辟內(nèi)存緩存空間,log buffer巾钉。磁盤上的日志文件稱為log file翘狱,是順序追加的,性能非常高砰苍,注:磁盤的順序?qū)懶阅鼙葍?nèi)存的寫性能差不了多少潦匈。
undo日志用于記錄事務(wù)開始前的狀態(tài),用于事務(wù)失敗時(shí)的回滾操作赚导;redo日志記錄事務(wù)執(zhí)行后的狀態(tài)茬缩,用來恢復(fù)未寫入data file的已成功事務(wù)更新的數(shù)據(jù)。例如某一事務(wù)的事務(wù)序號(hào)為T1吼旧,其對數(shù)據(jù)X進(jìn)行修改凰锡,設(shè)X的原值是5,修改后的值為15圈暗,那么Undo日志為<T1, X, 5>寡夹,Redo日志為<T1, X, 15>。
梳理下事務(wù)執(zhí)行的各個(gè)階段:
(1)寫undo日志到log buffer厂置;
(2)執(zhí)行事務(wù),并寫redo日志到log buffer魂角;
(3)如果innodb_flush_log_at_trx_commit=1昵济,則將redo日志寫到log file,并刷新落盤野揪。
(4)提交事務(wù)访忿。
可能有同學(xué)會(huì)問,為什么沒有寫data file斯稳,事務(wù)就提交了海铆?
在數(shù)據(jù)庫的世界里,數(shù)據(jù)從來都不重要挣惰,日志才是最重要的卧斟,有了日志就有了一切。
因?yàn)閐ata buffer中的數(shù)據(jù)會(huì)在合適的時(shí)間 由存儲(chǔ)引擎寫入到data file憎茂,如果在寫入之前珍语,數(shù)據(jù)庫宕機(jī)了,根據(jù)落盤的redo日志竖幔,完全可以將事務(wù)更改的數(shù)據(jù)恢復(fù)板乙。好了,看出日志的重要性了吧拳氢。先持久化日志的策略叫做Write Ahead Log募逞,即預(yù)寫日志蛋铆。
分析幾種異常情況:
- innodb_flush_log_at_trx_commit=2(innodb_flush_log_at_trx_commit和sync_binlog參數(shù)詳解)時(shí),將redo日志寫入logfile后放接,為提升事務(wù)執(zhí)行的性能刺啦,存儲(chǔ)引擎并沒有調(diào)用文件系統(tǒng)的sync操作,將日志落盤透乾。如果此時(shí)宕機(jī)了洪燥,那么未落盤redo日志事務(wù)的數(shù)據(jù)是無法保證一致性的。
- undo日志同樣存在未落盤的情況乳乌,可能出現(xiàn)無法回滾的情況捧韵。
checkpoint:
checkpoint是為了定期將db buffer的內(nèi)容刷新到data file。當(dāng)遇到內(nèi)存不足汉操、db buffer已滿等情況時(shí)再来,需要將db buffer中的內(nèi)容/部分內(nèi)容(特別是臟數(shù)據(jù))轉(zhuǎn)儲(chǔ)到data file中。在轉(zhuǎn)儲(chǔ)時(shí)磷瘤,會(huì)記錄checkpoint發(fā)生的”時(shí)刻“芒篷。在故障回復(fù)時(shí)候,只需要redo/undo最近的一次checkpoint之后的操作采缚。