1朽缴、面試題
如何保證消息不被重復消費安捉摹(如何保證消息消費時的冪等性)可霎?
2、面試官心里分析
其實這個很常見的一個問題宴杀,這倆問題基本可以連起來問癣朗。既然是消費消息,那肯定要考慮考慮會不會重復消費旺罢?能不能避免重復消費旷余?或者重復消費了也別造成系統(tǒng)異尘罴牵可以嗎?這個是MQ領域的基本問題正卧,其實本質上還是問你使用消息隊列如何保證冪等性蠢熄,這個是你架構里要考慮的一個問題。
面試官問你炉旷,肯定是必問的签孔,這是你要考慮的實際生產上的系統(tǒng)設計問題。
3窘行、面試題剖析
回答這個問題饥追,首先你別聽到重復消息這個事兒,就一無所知吧罐盔,你先大概說一說可能會有哪些重復消費的問題但绕。
首先就是比如rabbitmq、rocketmq惶看、kafka壁熄,都有可能會出現消費重復消費的問題,正常碳竟。因為這問題通常不是mq自己保證的,是給你保證的狸臣。然后我們挑一個kafka來舉個例子莹桅,說說怎么重復消費吧。
kafka實際上有個offset的概念烛亦,就是每個消息寫進去诈泼,都有一個offset,代表他的序號煤禽,然后consumer消費了數據之后铐达,每隔一段時間,會把自己消費過的消息的offset提交一下檬果,代表我已經消費過了瓮孙,下次我要是重啟啥的,你就讓我繼續(xù)從上次消費到的offset來繼續(xù)消費吧选脊。
但是凡事總有意外杭抠,比如我們之前生產經常遇到的,就是你有時候重啟系統(tǒng)恳啥,看你怎么重啟了偏灿,如果碰到點著急的,直接kill進程了钝的,再重啟翁垂。這會導致consumer有些消息處理了铆遭,但是沒來得及提交offset,尷尬了沿猜。重啟之后枚荣,少數消息會再次消費一次。
其實重復消費不可怕邢疙,可怕的是你沒考慮到重復消費之后棍弄,怎么保證冪等性。
給你舉個例子吧疟游。假設你有個系統(tǒng)呼畸,消費一條往數據庫里插入一條,要是你一個消息重復兩次颁虐,你不就插入了兩條蛮原,這數據不就錯了?但是你要是消費到第二次的時候另绩,自己判斷一下已經消費過了儒陨,直接扔了,不就保留了一條數據笋籽?
一條數據重復出現兩次蹦漠,數據庫里就只有一條數據,這就保證了系統(tǒng)的冪等性
冪等性车海,我通俗點說笛园,就一個數據,或者一個請求侍芝,給你重復來多次研铆,你得確保對應的數據是不會改變的,不能出錯州叠。
那所以第二個問題來了棵红,怎么保證消息隊列消費的冪等性?
其實還是得結合業(yè)務來思考咧栗,我這里給幾個思路:
(1)比如你拿個數據要寫庫逆甜,你先根據主鍵查一下,如果這數據都有了致板,你就別插入了忆绰,update一下好吧
(2)比如你是寫redis,那沒問題了可岂,反正每次都是set错敢,天然冪等性
(3)比如你不是上面兩個場景,那做的稍微復雜一點,你需要讓生產者發(fā)送每條數據的時候稚茅,里面加一個全局唯一的id纸淮,類似訂單id之類的東西,然后你這里消費到了之后亚享,先根據這個id去比如redis里查一下咽块,之前消費過嗎?如果沒有消費過欺税,你就處理侈沪,然后這個id寫redis。如果消費過了晚凿,那你就別處理了亭罪,保證別重復處理相同的消息即可。
還有比如基于數據庫的唯一鍵來保證重復數據不會重復插入多條歼秽,我們之前線上系統(tǒng)就有這個問題应役,就是拿到數據的時候,每次重啟可能會有重復燥筷,因為kafka消費者還沒來得及提交offset箩祥,重復數據拿到了以后我們插入的時候,因為有唯一鍵約束了肆氓,所以重復數據只會插入報錯袍祖,不會導致數據庫中出現臟數據
如何保證MQ的消費是冪等性的,需要結合具體的業(yè)務來看