Kafka生產(chǎn)者ack機(jī)制剖析

Kafka有兩個(gè)很重要的配置參數(shù)沿量,acksmin.insync.replicas.其中acks是producer的配置參數(shù),min.insync.replicas是Broker端的配置參數(shù)冤荆,這兩個(gè)參數(shù)對(duì)于生產(chǎn)者不丟失數(shù)據(jù)起到了很大的作用.接下來(lái)朴则,本文會(huì)以圖示的方式講解這兩個(gè)參數(shù)的含義和使用方式。通過本文钓简,你可以了解到:

  • Kafka的分區(qū)副本
  • 什么是同步副本(In-sync replicas)
  • 什么是acks確認(rèn)機(jī)制
  • 什么是最小同步副本
  • ack=all與最小同步副本是如何發(fā)揮作用的

分區(qū)副本

Kafka的topic是可以分區(qū)的乌妒,并且可以為分區(qū)配置多個(gè)副本,改配置可以通過replication.factor參數(shù)實(shí)現(xiàn). Kafka中的分區(qū)副本包括兩種類型:領(lǐng)導(dǎo)者副本(Leader Replica)和追隨者副本(Follower Replica)外邓,每個(gè)分區(qū)在創(chuàng)建時(shí)都要選舉一個(gè)副本作為領(lǐng)導(dǎo)者副本撤蚊,其余的副本自動(dòng)變?yōu)樽冯S者副本. 在 Kafka 中,追隨者副本是不對(duì)外提供服務(wù)的坐榆,也就是說(shuō)拴魄,任何一個(gè)追隨者副本都不能響應(yīng)消費(fèi)者和生產(chǎn)者的讀寫請(qǐng)求. 所有的請(qǐng)求都必須由領(lǐng)導(dǎo)者副本來(lái)處理. 換句話說(shuō),所有的讀寫請(qǐng)求都必須發(fā)往領(lǐng)導(dǎo)者副本所在的 Broker席镀,由該 Broker 負(fù)責(zé)處理. 追隨者副本不處理客戶端請(qǐng)求匹中,它唯一的任務(wù)就是從領(lǐng)導(dǎo)者副本異步拉取消息,并寫入到自己的提交日志中豪诲,從而實(shí)現(xiàn)與領(lǐng)導(dǎo)者副本的同步.

Kafka默認(rèn)的副本因子是3顶捷,即每個(gè)分區(qū)只有1個(gè)leader副本和2個(gè)follower副本.具體如下圖所示:

上面提到生產(chǎn)者客戶端僅寫入Leader broker,跟隨者異步復(fù)制數(shù)據(jù)屎篱。由于Kafka是一個(gè)分布式系統(tǒng)服赎,必然會(huì)存在與 Leader 不能實(shí)時(shí)同步的風(fēng)險(xiǎn),所以需要一種方法來(lái)判斷這些追隨者是否跟上了領(lǐng)導(dǎo)者的步伐, 即追隨者是否同步了最新的數(shù)據(jù).換句話說(shuō)交播,Kafka 要明確地告訴我們重虑,追隨者副本到底在什么條件下才算與 Leader 同步?這就是下面所要說(shuō)的ISR同步副本機(jī)制.

同步副本(In-sync replicas)

In-sync replica(ISR)稱之為同步副本秦士,ISR中的副本都是與Leader進(jìn)行同步的副本缺厉,所以不在該列表的follower會(huì)被認(rèn)為與Leader是不同步的. 那么,ISR中存在是什么副本呢?首先可以明確的是:Leader副本總是存在于ISR中. 而follower副本是否在ISR中提针,取決于該follower副本是否與Leader副本保持了“同步”.

尖叫提示:對(duì)于"follower副本是否與Leader副本保持了同步"的理解如下:

(1)上面所說(shuō)的同步不是指完全的同步命爬,即并不是說(shuō)一旦follower副本同步滯后與Leader副本,就會(huì)被踢出ISR列表.

(2)Kafka的broker端有一個(gè)參數(shù)replica.lag.time.max.ms, 該參數(shù)表示follower副本滯后與Leader副本的最長(zhǎng)時(shí)間間隔辐脖,默認(rèn)是10秒. 這就意味著饲宛,只要follower副本落后于leader副本的時(shí)間間隔不超過10秒,就可以認(rèn)為該follower副本與leader副本是同步的嗜价,所以哪怕當(dāng)前follower副本落后于Leader副本幾條消息艇抠,只要在10秒之內(nèi)趕上Leader副本,就不會(huì)被踢出出局.

(3)如果follower副本被踢出ISR列表炭剪,等到該副本追上了Leader副本的進(jìn)度练链,該副本會(huì)被再次加入到ISR列表中,所以ISR是一個(gè)動(dòng)態(tài)列表奴拦,并不是靜態(tài)不變的媒鼓。

如上圖所示:Broker3上的partition1副本超過了規(guī)定時(shí)間,未與Leader副本同步错妖,所以被踢出ISR列表绿鸣,此時(shí)的ISR為[1,3].

acks確認(rèn)機(jī)制

acks參數(shù)指定了必須要有多少個(gè)分區(qū)副本收到消息,生產(chǎn)者才認(rèn)為該消息是寫入成功的暂氯,這個(gè)參數(shù)對(duì)于消息是否丟失起著重要作用潮模,該參數(shù)的配置具體如下:

  • acks=0,表示生產(chǎn)者在成功寫入消息之前不會(huì)等待任何來(lái)自服務(wù)器的響應(yīng). 換句話說(shuō)痴施,一旦出現(xiàn)了問題導(dǎo)致服務(wù)器沒有收到消息擎厢,那么生產(chǎn)者就無(wú)從得知,消息也就丟失了. 改配置由于不需要等到服務(wù)器的響應(yīng)辣吃,所以可以以網(wǎng)絡(luò)支持的最大速度發(fā)送消息动遭,從而達(dá)到很高的吞吐量。
  • acks=1神得,表示只要集群的leader分區(qū)副本接收到了消息厘惦,就會(huì)向生產(chǎn)者發(fā)送一個(gè)成功響應(yīng)的ack,此時(shí)生產(chǎn)者接收到ack之后就可以認(rèn)為該消息是寫入成功的. 一旦消息無(wú)法寫入leader分區(qū)副本(比如網(wǎng)絡(luò)原因哩簿、leader節(jié)點(diǎn)崩潰),生產(chǎn)者會(huì)收到一個(gè)錯(cuò)誤響應(yīng)宵蕉,當(dāng)生產(chǎn)者接收到該錯(cuò)誤響應(yīng)之后,為了避免數(shù)據(jù)丟失节榜,會(huì)重新發(fā)送數(shù)據(jù).這種方式的吞吐量取決于使用的是異步發(fā)送還是同步發(fā)送.

    尖叫提示:如果生產(chǎn)者收到了錯(cuò)誤響應(yīng)羡玛,即便是重新發(fā)消息,還是會(huì)有可能出現(xiàn)丟數(shù)據(jù)的現(xiàn)象. 比如宗苍,如果一個(gè)沒有收到消息的節(jié)點(diǎn)成為了新的Leader稼稿,消息就會(huì)丟失.

  • acks =all,表示只有所有參與復(fù)制的節(jié)點(diǎn)(ISR列表的副本)全部收到消息時(shí)亿遂,生產(chǎn)者才會(huì)接收到來(lái)自服務(wù)器的響應(yīng). 這種模式是最高級(jí)別的,也是最安全的渺杉,可以確保不止一個(gè)Broker接收到了消息. 該模式的延遲會(huì)很高.

最小同步副本

上面提到,當(dāng)acks=all時(shí)挪钓,需要所有的副本都同步了才會(huì)發(fā)送成功響應(yīng)到生產(chǎn)者. 其實(shí)這里面存在一個(gè)問題:如果Leader副本是唯一的同步副本時(shí)會(huì)發(fā)生什么呢是越?此時(shí)相當(dāng)于acks=1.所以是不安全的.

Kafka的Broker端提供了一個(gè)參數(shù)min.insync.replicas,該參數(shù)控制的是消息至少被寫入到多少個(gè)副本才算是"真正寫入",該值默認(rèn)值為1,生產(chǎn)環(huán)境設(shè)定為一個(gè)大于1的值可以提升消息的持久性. 因?yàn)槿绻礁北镜臄?shù)量低于該配置值碌上,則生產(chǎn)者會(huì)收到錯(cuò)誤響應(yīng)倚评,從而確保消息不丟失.

Case 1

如下圖,當(dāng)min.insync.replicas=2且acks=all時(shí)馏予,如果此時(shí)ISR列表只有[1,2],3被踢出ISR列表天梧,只需要保證兩個(gè)副本同步了,生產(chǎn)者就會(huì)收到成功響應(yīng).

Case 2

如下圖霞丧,當(dāng)min.insync.replicas=2呢岗,如果此時(shí)ISR列表只有[1],2和3被踢出ISR列表,那么當(dāng)acks=all時(shí)蛹尝,則不能成功寫入數(shù)后豫;當(dāng)acks=0或者acks=1可以成功寫入數(shù)據(jù).

Case 3

這種情況是很容易引起誤解的,如果acks=all且min.insync.replicas=2突那,此時(shí)ISR列表為[1,2,3],那么還是會(huì)等到所有的同步副本都同步了消息挫酿,才會(huì)向生產(chǎn)者發(fā)送成功響應(yīng)的ack.因?yàn)閙in.insync.replicas=2只是一個(gè)最低限制,即同步副本少于該配置值愕难,則會(huì)拋異常早龟,而acks=all,是需要保證所有的ISR列表的副本都同步了才可以發(fā)送成功響應(yīng). 如下圖所示:

總結(jié)

acks=0猫缭,生產(chǎn)者在成功寫入消息之前不會(huì)等待任何來(lái)自服務(wù)器的響應(yīng).

acks=1,只要集群的leader分區(qū)副本接收到了消息葱弟,就會(huì)向生產(chǎn)者發(fā)送一個(gè)成功響應(yīng)的ack.

acks=all,表示只有所有參與復(fù)制的節(jié)點(diǎn)(ISR列表的副本)全部收到消息時(shí),生產(chǎn)者才會(huì)接收到來(lái)自服務(wù)器的響應(yīng)饵骨,此時(shí)如果ISR同步副本的個(gè)數(shù)小于min.insync.replicas的值翘悉,消息不會(huì)被寫入.

公眾號(hào)『大數(shù)據(jù)技術(shù)與數(shù)倉(cāng)』,回復(fù)『資料』領(lǐng)取大數(shù)據(jù)資料包

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末居触,一起剝皮案震驚了整個(gè)濱河市妖混,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌轮洋,老刑警劉巖制市,帶你破解...
    沈念sama閱讀 218,640評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異弊予,居然都是意外死亡祥楣,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)误褪,“玉大人责鳍,你說(shuō)我怎么就攤上這事∈藜洌” “怎么了历葛?”我有些...
    開封第一講書人閱讀 165,011評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)嘀略。 經(jīng)常有香客問我恤溶,道長(zhǎng),這世上最難降的妖魔是什么帜羊? 我笑而不...
    開封第一講書人閱讀 58,755評(píng)論 1 294
  • 正文 為了忘掉前任咒程,我火速辦了婚禮,結(jié)果婚禮上讼育,老公的妹妹穿的比我還像新娘帐姻。我一直安慰自己,他們只是感情好窥淆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評(píng)論 6 392
  • 文/花漫 我一把揭開白布卖宠。 她就那樣靜靜地躺著,像睡著了一般忧饭。 火紅的嫁衣襯著肌膚如雪扛伍。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,610評(píng)論 1 305
  • 那天词裤,我揣著相機(jī)與錄音刺洒,去河邊找鬼。 笑死吼砂,一個(gè)胖子當(dāng)著我的面吹牛逆航,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播渔肩,決...
    沈念sama閱讀 40,352評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼因俐,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了周偎?” 一聲冷哼從身側(cè)響起抹剩,我...
    開封第一講書人閱讀 39,257評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎蓉坎,沒想到半個(gè)月后澳眷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,717評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡蛉艾,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評(píng)論 3 336
  • 正文 我和宋清朗相戀三年钳踊,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了衷敌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,021評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡拓瞪,死狀恐怖缴罗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情祭埂,我是刑警寧澤瞒爬,帶...
    沈念sama閱讀 35,735評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站沟堡,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏矢空。R本人自食惡果不足惜航罗,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望屁药。 院中可真熱鬧粥血,春花似錦、人聲如沸酿箭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)缭嫡。三九已至缔御,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間妇蛀,已是汗流浹背耕突。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留评架,地道東北人眷茁。 一個(gè)月前我還...
    沈念sama閱讀 48,224評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像纵诞,于是被迫代替她去往敵國(guó)和親上祈。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評(píng)論 2 355