最近開發(fā)新需求村生,在測(cè)試環(huán)境測(cè)試和解決了兩個(gè)很有意思的問題惊暴,特此記錄一下。
- 在數(shù)據(jù)庫事務(wù)中發(fā)送MQ消息(MQ消息消費(fèi)和事務(wù)提交順序不確定)
- 問題描述
如下圖所示梆造,業(yè)務(wù)流程是在數(shù)據(jù)庫讀提交隔離級(jí)別下缴守,首先插入數(shù)據(jù),然后發(fā)送MQ消息镇辉。MQ消息中包含數(shù)據(jù)id,消費(fèi)者拿到消息后根據(jù)id查數(shù)據(jù)庫贴捡。
由于MQ消息是在數(shù)據(jù)庫事務(wù)中發(fā)送的忽肛,所以可能會(huì)導(dǎo)致MQ發(fā)送成功,消費(fèi)者開始消費(fèi)MQ烂斋,但是此時(shí)生產(chǎn)者所在的事務(wù)還未提交屹逛,所以消費(fèi)者根據(jù)id查不到數(shù)據(jù),由此產(chǎn)生問題汛骂。
產(chǎn)生問題的原因
數(shù)據(jù)庫事務(wù)中的代碼順序是插入數(shù)據(jù)->發(fā)送MQ->提交事務(wù)罕模,但是因?yàn)镸Q發(fā)送后,消費(fèi)者消費(fèi)是異步的帘瞭,所以并不能保證MQ消費(fèi)和提交事務(wù)的順序淑掌,有可能提交事務(wù)在前,這種情況就沒有問題蝶念,消費(fèi)者可以看到事務(wù)提交后的數(shù)據(jù)抛腕,但如果是MQ消費(fèi)在前,事務(wù)提交在后媒殉,那MQ消費(fèi)者是看不到未提交的事務(wù)數(shù)據(jù)的担敌。解決方法
最簡(jiǎn)單的方案是什么也不用做,MQ消費(fèi)者消費(fèi)失敗的話廷蓉,重新消費(fèi)或者人工接入解決全封,當(dāng)然這種方案也有問題,就是MQ發(fā)送成功,但是事務(wù)回滾...
或者可以把MQ發(fā)送放在事務(wù)之外刹悴,確保發(fā)送MQ的時(shí)候事務(wù)已經(jīng)提交行楞,也是可以的,消費(fèi)失敗就重新消費(fèi)唄颂跨。還是不建議把發(fā)送MQ的操作放在事務(wù)里敢伸,因?yàn)榭赡軙?huì)加大事務(wù)執(zhí)行時(shí)間,有造成大事務(wù)的風(fēng)險(xiǎn)恒削。
還有一種終極解決方案就是使用事務(wù)消息池颈,在數(shù)據(jù)庫事務(wù)中發(fā)送半消息,然后事務(wù)提交后钓丰,發(fā)送消息確認(rèn)半事務(wù)消息躯砰,并提供事務(wù)回查接口。
- 消息生產(chǎn)者和消費(fèi)消費(fèi)者產(chǎn)生了并發(fā)修改
- 問題描述
消息生產(chǎn)者連續(xù)兩次修改數(shù)據(jù)携丁,并兩次發(fā)送數(shù)據(jù)改動(dòng)消息到消息消費(fèi)者琢歇,消息消費(fèi)者收到消息后,從數(shù)據(jù)庫查數(shù)據(jù)并寫入緩存梦鉴,最后更新數(shù)據(jù)的is_cache字段李茫。
邏輯流程簡(jiǎn)單來說是這樣的:修改data.time=t1->發(fā)送MQ通知消費(fèi)者將數(shù)據(jù)寫入緩存->修改data.time=t2->發(fā)送MQ通知消費(fèi)者將數(shù)據(jù)寫入緩存。原來的本意是將data.time=t2的最終結(jié)果更新到緩存肥橙。但是最后發(fā)現(xiàn)魄宏,執(zhí)行完畢后,數(shù)據(jù)庫中的時(shí)間總是t1而不是期望的t2存筏。
- 產(chǎn)生問題的原因
最終發(fā)現(xiàn)是消息消費(fèi)者更新is_cache字段用的sql有問題宠互,他并不是單獨(dú)更新指定id的is_cache字段,而是先查數(shù)據(jù)庫數(shù)據(jù)椭坚,然后修改is_cache字段予跌,然后用數(shù)據(jù)庫數(shù)據(jù)對(duì)象更新全部字段。和問題1一樣善茎,MQ消息消費(fèi)是異步的券册,所以修改t1,t2的順序和消息消費(fèi)的順便是不確定的,可能會(huì)產(chǎn)生這樣的順序:修改data.time=t1->發(fā)送MQ->消費(fèi)MQ巾表,加載數(shù)據(jù)庫數(shù)據(jù)data.time=t1汁掠,寫入緩存->修改data.time=t2->前面的消費(fèi)者繼續(xù)執(zhí)行,寫入緩存后更新is_cahce字段集币,并將data.time=t1更新回去考阱,覆蓋了data.time=t2的預(yù)期結(jié)果
最主要的還是因?yàn)橄M(fèi)者修改了本不屬于自己要更新的字段data.time,由此和生產(chǎn)者產(chǎn)生了數(shù)據(jù)修改競(jìng)爭(zhēng)鞠苟,相當(dāng)于多線程修改共享數(shù)據(jù)乞榨,造成了問題秽之。
- 解決方案
消費(fèi)者只修改更新data.is_cache字段,避免和消費(fèi)者競(jìng)爭(zhēng)修改共享字段吃既,避免競(jìng)爭(zhēng)考榨。