根據(jù)kafka消息的管理晨川,我們知道kafka對消息進行了分區(qū)管理,并將分區(qū)盡量均勻分布到集群中共虑,每個partition都有一個leader。那么客戶端怎么知道某個partition的leader信息拥坛?partition leader又是怎么維護的呢?
1.partition isr
每個partition在其zk的/state節(jié)點中保存了該partition的信息猜惋,如下:
{"controller_epoch":1,"leader":0,"version":1,"leader_epoch":0,"isr":[0]}
其中isr全稱in sync replica,這個partition同步中的副本缓窜,是partition所有副本的子集谍咆,若partition leader宕機后將從該列表中選取broker作為leader。該集合中的broker均能夠跟進partition leader的消息同步進度摹察,這里的進度是根據(jù)配置文件配置的,包含最大落后消息數(shù)黄娘、心跳時間間隔克滴,若落后消息數(shù)超過配置上限或心跳間隔超過配置時間將從該列表中移除。
2.controller
早期版本kafka依賴zk管理集群偿曙,新版本引入controller來管理。所有的broker啟動后會去zk上注冊controller臨時節(jié)點罩阵,但只有一個broker能夠注冊成功,這個broker即為contoller启摄。若controller宕機后,zk上的臨時節(jié)點會消失歉备,其他broker又會一起去注冊,產(chǎn)生新的controller蕾羊。注冊失敗的broker叫做broker follower,會讀取controller的信息并保存到內(nèi)存中书闸。
由zookeeper如何保存kafka集群信息metadata
可知利凑,這個controller節(jié)點為zk下的/controller節(jié)點嫌术,包含如下信息:
{"version":1,"brokerid":0,"timestamp":"1605488793510"}
controller注冊成功后牌借,會向zk注冊監(jiān)聽器watcher,監(jiān)聽相關(guān)節(jié)點變化膨报,而其他broker則不用再監(jiān)聽zk。
controller主要職責包括:
監(jiān)聽partition變化择示,處理partition重新分配晒旅、leader選舉、isr列表更新废恋;
監(jiān)聽/broker/ids節(jié)點,處理broker移除拟烫、新增變化迄本;
監(jiān)聽topic的新增移除;
監(jiān)聽/broker/topics節(jié)點嘉赎,維護topic、partition metadata公条;
3.controller分區(qū)管理
- controller首先從zk的/broker/topics節(jié)點讀取各topic partition的副本信息靶橱,從中選取一個作為leader寥袭,選取方法見kafka消息的管理关霸,將所有副本放入isr集合,并將數(shù)據(jù)同步到各broker尝江。
- controller會監(jiān)聽zk 的/admin/ressign_part節(jié)點英上,用戶執(zhí)行分區(qū)更改腳步的內(nèi)容會寫入該節(jié)點,controller讀取格式化信息并重新分區(qū)苍日。
- controller監(jiān)聽/broker/topic節(jié)點變化信息,監(jiān)聽partition的增減情況辜纲,當發(fā)生partition增減時拦耐,重新執(zhí)行l(wèi)eader選舉和isr同步,并更新所有broker信息杀糯。
- controller監(jiān)聽/broker/ids節(jié)點,當有broker宕機時狼纬,controller從isr列表中選取新的leader骂际;若isr列表為空,則從所有副本中選取leader歉铝;若所有副本列表都為空,則等待副本重新加入送火。