面試官心理分析
只要聊到你做了分布式系統(tǒng)雹嗦,必問分布式事務(wù)范舀,你對分布式事務(wù)一無所知的話,確實會很坑了罪,你起碼得知道有哪些方案锭环,一般怎么來做,每個方案的優(yōu)缺點是什么泊藕。
現(xiàn)在面試田藐,分布式系統(tǒng)成了標(biāo)配,而分布式系統(tǒng)帶來的分布式事務(wù)也成了標(biāo)配了吱七。因為你做系統(tǒng)肯定要用事務(wù)吧汽久,如果是分布式系統(tǒng),肯定要用分布式事務(wù)吧踊餐。先不說你搞過沒有景醇,起碼你得明白有哪幾種方案,每種方案可能有啥坑吝岭?比如 TCC 方案的網(wǎng)絡(luò)問題三痰、XA 方案的一致性問題。
面試題剖析
分布式事務(wù)的實現(xiàn)主要有以下 5 種方案:
? ??????????XA 方案
? ??????????TCC 方案
? ??????????本地消息表
? ??????????可靠消息最終一致性方案
? ??????????最大努力通知方案
兩階段提交方案/XA 方案
所謂的 XA 方案窜管,即:兩階段提交散劫,有一個事務(wù)管理器的概念,負(fù)責(zé)協(xié)調(diào)多個數(shù)據(jù)庫(資源管理器)的事務(wù)幕帆,事務(wù)管理器先問問各個數(shù)據(jù)庫你準(zhǔn)備好了嗎获搏?如果每個數(shù)據(jù)庫都回復(fù) ok,那么就正式提交事務(wù)失乾,在各個數(shù)據(jù)庫上執(zhí)行操作常熙;如果任何其中一個數(shù)據(jù)庫回答不 ok,那么就回滾事務(wù)碱茁。
這種分布式事務(wù)方案裸卫,比較適合單塊應(yīng)用里,跨多個庫的分布式事務(wù)纽竣,而且因為嚴(yán)重依賴于數(shù)據(jù)庫層面來搞定復(fù)雜的事務(wù)墓贿,效率很低,絕對不適合高并發(fā)的場景蜓氨。如果要玩兒聋袋,那么基于 Spring + JTA 就可以搞定,自己隨便搜個 demo 看看就知道了语盈。
這個方案舱馅,我們很少用缰泡,一般來說某個系統(tǒng)內(nèi)部如果出現(xiàn)跨多個庫的這么一個操作刀荒,是不合規(guī)的代嗤。我可以給大家介紹一下, 現(xiàn)在微服務(wù)缠借,一個大的系統(tǒng)分成幾十個甚至幾百個服務(wù)干毅。一般來說,我們的規(guī)定和規(guī)范泼返,是要求每個服務(wù)只能操作自己對應(yīng)的一個數(shù)據(jù)庫硝逢。
如果你要操作別的服務(wù)對應(yīng)的庫,不允許直連別的服務(wù)的庫绅喉,違反微服務(wù)架構(gòu)的規(guī)范渠鸽,你隨便交叉胡亂訪問,幾百個服務(wù)的話柴罐,全體亂套徽缚,這樣的一套服務(wù)是沒法管理的,沒法治理的革屠,可能會出現(xiàn)數(shù)據(jù)被別人改錯凿试,自己的庫被別人寫掛等情況。
如果你要操作別人的服務(wù)的庫似芝,你必須是通過調(diào)用別的服務(wù)的接口來實現(xiàn)那婉,絕對不允許交叉訪問別人的數(shù)據(jù)庫。
TCC 方案
TCC 的全稱是:Try党瓮、Confirm详炬、Cancel。
????????????Try 階段:這個階段說的是對各個服務(wù)的資源做檢測以及對資源進(jìn)行鎖定或者預(yù)留寞奸。
????????????Confirm 階段:這個階段說的是在各個服務(wù)中執(zhí)行實際的操作痕寓。
????????????Cancel 階段:如果任何一個服務(wù)的業(yè)務(wù)方法執(zhí)行出錯,那么這里就需要進(jìn)行補(bǔ)償蝇闭,就是執(zhí)行已經(jīng)執(zhí)行成功的業(yè)務(wù)邏輯的回滾操作呻率。(把那些執(zhí)行成功的回滾)
這種方案說實話幾乎很少人使用,我們用的也比較少呻引,但是也有使用的場景礼仗。因為這個事務(wù)回滾實際上是嚴(yán)重依賴于你自己寫代碼來回滾和補(bǔ)償了,會造成補(bǔ)償代碼巨大逻悠,非常之惡心元践。
比如說我們,一般來說跟錢相關(guān)的童谒,跟錢打交道的单旁,支付、交易相關(guān)的場景饥伊,我們會用 TCC象浑,嚴(yán)格保證分布式事務(wù)要么全部成功蔫饰,要么全部自動回滾,嚴(yán)格保證資金的正確性愉豺,保證在資金上不會出現(xiàn)問題篓吁。
而且最好是你的各個業(yè)務(wù)執(zhí)行的時間都比較短。
但是說實話蚪拦,一般盡量別這么搞杖剪,自己手寫回滾邏輯,或者是補(bǔ)償邏輯驰贷,實在太惡心了盛嘿,那個業(yè)務(wù)代碼是很難維護(hù)的。
本地消息表
本地消息表其實是國外的 ebay 搞出來的這么一套思想括袒。
這個大概意思是這樣的:
????????1. A 系統(tǒng)在自己本地一個事務(wù)里操作同時孩擂,插入一條數(shù)據(jù)到消息表;
????????2. 接著 A 系統(tǒng)將這個消息發(fā)送到 MQ 中去箱熬;
? ? ? ? 3. B 系統(tǒng)接收到消息之后类垦,在一個事務(wù)里,往自己本地消息表里插入一條數(shù)據(jù)城须,同時執(zhí)行其他的業(yè)務(wù)操作蚤认,如果這個消息已經(jīng)被處理過了,那么此時這個事務(wù)會回滾糕伐,這樣保證不會重復(fù)處理消息砰琢;
????????4. B 系統(tǒng)執(zhí)行成功之后,就會更新自己本地消息表的狀態(tài)以及 A 系統(tǒng)消息表的狀態(tài)良瞧;
????????5. 如果 B 系統(tǒng)處理失敗了陪汽,那么就不會更新消息表狀態(tài),那么此時 A 系統(tǒng)會定時掃描自己的消息表褥蚯,如果有未處理的消息挚冤,會再次發(fā)送到 MQ 中去,讓 B 再次處理赞庶;
????????6. 這個方案保證了最終一致性训挡,哪怕 B 事務(wù)失敗了,但是 A 會不斷重發(fā)消息歧强,直到 B 那邊成功為止澜薄。
這個方案說實話最大的問題就在于嚴(yán)重依賴于數(shù)據(jù)庫的消息表來管理事務(wù)啥的,如果是高并發(fā)場景咋辦呢摊册?咋擴(kuò)展呢肤京?所以一般確實很少用。
可靠消息最終一致性方案
這個的意思茅特,就是干脆不要用本地的消息表了忘分,直接基于 MQ 來實現(xiàn)事務(wù)棋枕。比如阿里的 RocketMQ 就支持消息事務(wù)。
大概的意思就是:
????????1. A 系統(tǒng)先發(fā)送一個 prepared 消息到 mq饭庞,如果這個 prepared 消息發(fā)送失敗那么就直接取消操作別執(zhí)行了;
????????2. 如果這個消息發(fā)送成功過了熬荆,那么接著執(zhí)行本地事務(wù)舟山,如果成功就告訴 mq 發(fā)送確認(rèn)消息,如果失敗就告訴 mq 回滾消息卤恳;
????????3. 如果發(fā)送了確認(rèn)消息累盗,那么此時 B 系統(tǒng)會接收到確認(rèn)消息,然后執(zhí)行本地的事務(wù)突琳;
????????4. mq 會自動定時輪詢所有 prepared 消息回調(diào)你的接口若债,問你,這個消息是不是本地事務(wù)處理失敗了拆融,所有沒發(fā)送確認(rèn)的消息蠢琳,是繼續(xù)重試還是回滾?一般來說這里你就可以查下數(shù)據(jù)庫看之前本地事務(wù)是否執(zhí)行镜豹,如果回滾了傲须,那么這里也回滾吧。這個就是避免可能本地事務(wù)執(zhí)行成功了趟脂,而確認(rèn)消息卻發(fā)送失敗了泰讽。
????????5. 這個方案里,要是系統(tǒng) B 的事務(wù)失敗了咋辦昔期?重試咯已卸,自動不斷重試直到成功,如果實在是不行硼一,要么就是針對重要的資金類業(yè)務(wù)進(jìn)行回滾累澡,比如 B 系統(tǒng)本地回滾后,想辦法通知系統(tǒng) A 也回滾般贼;或者是發(fā)送報警由人工來手工回滾和補(bǔ)償永乌。
????????6. 這個還是比較合適的,目前國內(nèi)互聯(lián)網(wǎng)公司大都是這么玩兒的具伍,要不你舉用 RocketMQ 支持的翅雏,要不你就自己基于類似 ActiveMQ?RabbitMQ人芽?自己封裝一套類似的邏輯出來望几,總之思路就是這樣子的。
最大努力通知方案
這個方案的大致意思就是:
????????1. 系統(tǒng) A 本地事務(wù)執(zhí)行完之后萤厅,發(fā)送個消息到 MQ橄抹;
????????2. 這里會有個專門消費 MQ 的最大努力通知服務(wù)靴迫,這個服務(wù)會消費 MQ 然后寫入數(shù)據(jù)庫中記錄下來,或者是放入個內(nèi)存隊列也可以楼誓,接著調(diào)用系統(tǒng) B 的接口玉锌;
????????3. 要是系統(tǒng) B 執(zhí)行成功就 ok 了;要是系統(tǒng) B 執(zhí)行失敗了疟羹,那么最大努力通知服務(wù)就定時嘗試重新調(diào)用系統(tǒng) B主守,反復(fù) N 次,最后還是不行就放棄榄融。
你們公司是如何處理分布式事務(wù)的参淫?
如果你真的被問到,可以這么說愧杯,我們某某特別嚴(yán)格的場景涎才,用的是 TCC 來保證強(qiáng)一致性;然后其他的一些場景基于阿里的 RocketMQ 來實現(xiàn)分布式事務(wù)力九。
你找一個嚴(yán)格資金要求絕對不能錯的場景耍铜,你可以說你是用的 TCC 方案;如果是一般的分布式事務(wù)場景跌前,訂單插入之后要調(diào)用庫存服務(wù)更新庫存业扒,庫存數(shù)據(jù)沒有資金那么的敏感,可以用可靠消息最終一致性方案舒萎。
友情提示一下程储,RocketMQ 3.2.6 之前的版本,是可以按照上面的思路來的臂寝,但是之后接口做了一些改變章鲤,我這里不再贅述了。
當(dāng)然如果你愿意咆贬,你可以參考可靠消息最終一致性方案來自己實現(xiàn)一套分布式事務(wù)败徊,比如基于 RocketMQ 來玩兒趾徽。