Mysql 是怎么保證數(shù)據(jù)不丟的

binlog寫盤狀態(tài).png

一顷蟀、binlog的寫入機(jī)制

  1. binlog寫入邏輯:
    1. 事務(wù)執(zhí)行過(guò)程中、先寫日志導(dǎo)binlog cache囤萤、事務(wù)提交時(shí)、再把binlog cache寫入到binlog文件中.
    2. 一個(gè)事務(wù)的binlog不能被拆開富雅、因此不論事務(wù)有多大滚婉、也要確保一次性寫入. 系統(tǒng)給binlog cache每個(gè)線程分配一片內(nèi)存(binlog_cache_size大小), 超過(guò)會(huì)先暫存到磁盤.
    3. 事務(wù)提交時(shí)、執(zhí)行器會(huì)把binlog cache里的完整事務(wù)寫入binlog锥余、清空binlog cache.
  2. 每個(gè)線程有自己的binlog cache、但共用binlog文件.
    事務(wù)提交、先寫入到文件系統(tǒng)的page cache(write), 然后調(diào)用fsync寫入磁盤(占用IOPS)
    write和fsync的時(shí)機(jī):
    sync_binlog=0, 每次事務(wù)提交只write蔬将、不fsync
    sync_binlog=1, 每次事務(wù)提交都執(zhí)行fsync
    sync_binlog=N, 每次事務(wù)提交都write莉给、累積N個(gè)事務(wù)才fsync
    所以、在出現(xiàn)IO瓶頸的場(chǎng)景里丧蘸、可以將sync_binlog設(shè)置為一個(gè)比較大的值演训、可以提升性能.
    風(fēng)險(xiǎn): 若主機(jī)異常重啟庭猩、會(huì)丟失最近N個(gè)事務(wù)的binlog.

二、redo log的寫入機(jī)制
事務(wù)執(zhí)行過(guò)程中會(huì)先寫redo log buffer, 然后才寫redo log


redo log存儲(chǔ)狀態(tài).png

從redo log的三種狀態(tài)說(shuō)起:

  1. 存在redo log buffer中、物理上是在 mysql 進(jìn)程內(nèi)存中.
  2. 寫到磁盤write、但未持久化fsync蠢护、物理上是在文件系統(tǒng)的Page Cache中
  3. 持久化到磁盤

1单寂、2的過(guò)程都很快、但3的速度就慢很多了. InnoDB提供了三種策略, 通過(guò) innodb_flush_log_at_trx_commit參數(shù)控制:

  1. 0, 表示每次事務(wù)提交只把redo log留在redo log buffer中
  2. 1, 表示每次事務(wù)提交都將redo log直接持久化到磁盤
  3. 2, 表示每次事務(wù)提交都把redo log寫到Page Cache.
    InnoDB 有一個(gè)后臺(tái)線程贤惯、每隔1s屁商、會(huì)把redo log buffer中的日志調(diào)用write寫到FS Pae Cache官还、然后調(diào)用 fsync 持久化到磁盤.

注意: 事務(wù)執(zhí)行過(guò)程中的redo log也是在buffer中、可能會(huì)被后臺(tái)線程一起持久化到磁盤
還有兩種場(chǎng)景會(huì)將一個(gè)未提交的事務(wù)redo log寫入磁盤:

  1. redo log buffer占用的空間即將達(dá)到innodb_log_buffer_size 一半的時(shí)候、后臺(tái)線程會(huì)主動(dòng)寫盤. (此時(shí)事務(wù)未提交、只是write、并未fsync, 即: 只留在FS Page Cache)
  2. 并行事務(wù)提交時(shí), 順帶將該事務(wù)的 redo log buffer持久化到磁盤、eg. Trx A執(zhí)行到一半、Trx B要把buffer數(shù)據(jù)寫入磁盤、會(huì)順帶把Trx A的日志一起持久化到磁盤
    注意: 若將 innodb_flush_log_at_trx_commit 設(shè)為1, redo log在prepare階段就要持久化一次、因?yàn)橛幸粋€(gè)崩潰恢復(fù)依賴于prepare的redo log + binlog.
    通常說(shuō)的雙1配置堰塌、是redo log 和binlog的刷盤機(jī)制都設(shè)為1, 即: 一個(gè)事務(wù)完整提交前、需要等待兩次刷盤: redo log(prepare階段) 和 binlog

思考: TPS 2w/s 的話、寫盤就是 4w/s, 但磁盤能力只有2w/s, 是怎么實(shí)現(xiàn)的呢 ?
組提交: 三個(gè)并發(fā)事務(wù)trx1, trx2, trx3, 對(duì)應(yīng)LSN(日志邏輯序列化、單調(diào)遞增)分別為:50, 120, 160, trx1寫盤時(shí)、這組(trx1->3)已經(jīng)有3個(gè)事務(wù)、LSN也變成了160, 去寫盤時(shí)、帶的LSN=160, 等trx1返回時(shí)、所有LSN<160的redo log都已持久化到磁盤, trx2,trx3可直接返回.


兩階段提交細(xì)化.png

在并發(fā)更新場(chǎng)景下柑蛇、第一個(gè)事務(wù)寫完 redo log buffer粘我、調(diào)用fsync越晚娇豫、組員越多浦楣、節(jié)約IOPS效果越好.
binlog的write 和 fsync的時(shí)間間隔短历恐、組提交優(yōu)化不如redo log.
可以通過(guò)設(shè)置以下參數(shù)來(lái)提升效果:

  1. binlog_group_commit_sync_delay, 延遲x 微秒后才調(diào)用fsync
  2. binlog_group_commit_sync_no_delay_count, 累積x次以后調(diào)用fsync
    二者滿足其一就調(diào)用 fsync

另: 不建議設(shè)置 innodb_flush_log_at_trx_commit=0, 因?yàn)檫@樣redo log只保存在內(nèi)存中溪烤、MySQL異常重啟會(huì)丟失數(shù)據(jù)枪眉、風(fēng)險(xiǎn)太大. 而redo log寫到 FS Page Cache的速度也是很快的蒿秦、不會(huì)損失很多性能, 可以保證異常重啟不丟數(shù)據(jù)渡处、風(fēng)險(xiǎn)小很多.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市拗盒,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,820評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件改含,死亡現(xiàn)場(chǎng)離奇詭異鹃觉,居然都是意外死亡疗隶,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)戈毒,“玉大人道宅,你說(shuō)我怎么就攤上這事泞当〉蟹洌” “怎么了秸脱?”我有些...
    開封第一講書人閱讀 168,324評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵岛请,是天一觀的道長(zhǎng)缩膝。 經(jīng)常有香客問(wèn)我云芦,道長(zhǎng)琉历,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,714評(píng)論 1 297
  • 正文 為了忘掉前任贿衍,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘弊攘。我一直安慰自己啼染,他們只是感情好斜棚,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,724評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般发绢。 火紅的嫁衣襯著肌膚如雪坯认。 梳的紋絲不亂的頭發(fā)上巩趁,一...
    開封第一講書人閱讀 52,328評(píng)論 1 310
  • 那天番川,我揣著相機(jī)與錄音,去河邊找鬼。 笑死祝旷,一個(gè)胖子當(dāng)著我的面吹牛吻谋,可吹牛的內(nèi)容都是我干的闽撤。 我是一名探鬼主播矾芙,決...
    沈念sama閱讀 40,897評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼岖是,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼烈疚!你這毒婦竟也來(lái)了屹电?” 一聲冷哼從身側(cè)響起危号,我...
    開封第一講書人閱讀 39,804評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤磨确,失蹤者是張志新(化名)和其女友劉穎邓了,沒(méi)想到半個(gè)月后照宝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡嫂侍,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,431評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了荚坞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片挑宠。...
    茶點(diǎn)故事閱讀 40,561評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖颓影,靈堂內(nèi)的尸體忽然破棺而出各淀,到底是詐尸還是另有隱情,我是刑警寧澤诡挂,帶...
    沈念sama閱讀 36,238評(píng)論 5 350
  • 正文 年R本政府宣布碎浇,位于F島的核電站临谱,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏奴璃。R本人自食惡果不足惜悉默,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,928評(píng)論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望苟穆。 院中可真熱鬧抄课,春花似錦、人聲如沸雳旅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)岭辣。三九已至,卻和暖如春甸饱,著一層夾襖步出監(jiān)牢的瞬間沦童,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工叹话, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留偷遗,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,983評(píng)論 3 376
  • 正文 我出身青樓驼壶,卻偏偏與公主長(zhǎng)得像氏豌,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子热凹,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,573評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容