??在kafka中,副本分成兩種:一種是領導者副本熊赖,每個partition只有一個指厌;還有一種是追隨者副本凹蜂,每個partition會存在多個。領導者副本負責響應生產者和消費者的讀寫請求性宏,而追隨者副本對外不提供任何服務群井,只負責從領導者副本拉取消息,在領導者副本掛掉后或者領導者副本所在broker宕機后毫胜,從ISR(inSyncReplicas,同步副本集合)副本集合中選取一個領導者副本(unclean.leader.election.enable
為false)书斜,或者是從AR(allReplicas,全部副本集合)副本集合中選取(unclean.leader.election.enable
為true),kafka的高可用就是基于此實現的。
??很多人包括我在內在一開始學習kafka的時候可能都有這樣的疑惑酵使,那就是為什么kafka的follower副本不對外提供服務荐吉,就像MySQL和Redis的從節(jié)點一樣讀寫分離,主節(jié)點提供寫服務,從節(jié)點提供讀服務口渔。這篇文章就來分析下這個問題样屠。
??我們先看看讀寫分離的好處:
1.從節(jié)點能夠分擔主節(jié)點的壓力,避免主節(jié)點負載過大
2.提高了數據庫集群的性能
3.一定程度上提升了集群的可用性
4.改善了數據局部性
??既然好處這么多,為什么kafka不采用讀寫分離的模式呢痪欲?因為讀寫分離有幾個明顯的問題:
1.主從同步有一定的延遲悦穿,對于kafka來說主從之間的數據同步需要經歷網絡 —> 主節(jié)點內存 —> 主節(jié)點磁盤 —> 網絡 —> 從節(jié)點內存 —> 從節(jié)點磁盤這幾個步驟,相對redis只經歷網絡和內存來說比較耗時业踢。
2.由于主從同步有一定的延遲栗柒,會出現主從節(jié)點數據不一致的情況
3.和MySQL、Redis不同知举,kafka有一個offset的概念瞬沦,在kafka消費完消息后,需要更新消息的offset雇锡。如果kafka采用了讀寫分離的模式逛钻,那么每個分區(qū)的offset比較難控制
另外,kafka的每個topic下有多個partition遮糖,這些partition分擔了讀寫的壓力绣的,就不再需要主寫從讀來分擔主節(jié)點的壓力叠赐。
??kafka追隨者副本不對外提供服務還有幾點好處:
1.Read-your-wirtes:這句話中文的意思是“讀自己所寫”欲账,指的是當生產者向kafka成功寫入消息后,消費者能立刻讀到這條消息芭概。在做社交產品時赛不,用戶修改完自己的用戶資料或是發(fā)送一條feed以后,肯定需要立刻能看到罢洲。因為kafka的追隨者副本不會提供讀服務踢故,用戶向領導者副本發(fā)送的消息立刻就能在領導者副本上讀到。但是如果允許追隨者副本提供讀服務惹苗,由于副本之間是異步同步的殿较,有可能追隨者副本還沒有拉取到最新的消息,使得用戶無法看到自己最新的資料或者feed桩蓉。
2.Monotonic Reads:單調讀淋纲。對于一個消費者而言,在多次消費消息的時候院究,不會出現某條消息一會存在一會不存在的情況洽瞬。比如某個partition下面有三個副本,分別是領導者副本Leader和兩個追隨者副本F1业汰、F2伙窃。在追隨者副本對外提供服務的情況下,就有可能出現F1拉取到新消息样漆,而F2沒有拉取到新消息的情況为障。如果這時候消費者先從F1消費消息,再從F2消費消息,就會看到這樣的情況:第一次消費時拿到的消息在第二次消費的時候消失了鳍怨,這就違背了單調讀的要求鹅髓。
??以上就是我理解的kafka的追隨者副本不對外提供讀服務的原因。