摘要
之前講解了leader選舉况凉,選舉完了之后,leader與learner的角色明確了各拷,要先完成一些啟動期的交互刁绒,主要是數(shù)據(jù)同步過程,這里大概介紹一下各步驟所對應的源碼在哪烤黍,后續(xù)對類進行詳細的分析
啟動期交互步驟
步驟可參考源碼分析26的,啟動概述
0.創(chuàng)建Leader服務器和Follower服務器
在選舉出leader時知市,服務器角色明確了
QuorumPeer#run
1.Leader服務器啟動Follower接收器LearnerCnxAcceptor(leader端)
運行期間,Leader服務器需要和所有其余的服務器(統(tǒng)稱為Learner)保持連接以確集群的機器存活情況蚊荣,LearnerCnxAcceptor負責接收所有非Leader服務器的連接請求初狰。
Leader#lead
cnxAcceptor = new LearnerCnxAcceptor();//等待learner的連接
cnxAcceptor.start();
2.Learner服務器開始和Leader建立連接。(learner端)
所有Learner會找到Leader服務器互例,并與其建立連接奢入。
以Follower為例
Follower#followLeader
Learner#connectToLeader
3.Leader服務器創(chuàng)建LearnerHandler(leader端)
Leader接收到來自其他機器連接創(chuàng)建請求后,會創(chuàng)建一個LearnerHandler實例媳叨,每個LearnerHandler實例都對應一個Leader與Learner服務器之間的連接腥光,其負責Leader和Learner服務器之間幾乎所有的消息通信和數(shù)據(jù)同步。
Leader.LearnerCnxAcceptor#run
LearnerHandler#run
4.向Leader注冊(learner端)
Learner完成和Leader的連接后糊秆,會向Leader進行注冊武福,即將Learner服務器的基本信息(LearnerInfo),包括SID和ZXID痘番,發(fā)送給Leader服務器捉片。
Follower#followLeader
Learner#registerWithLeader
5.Leader解析Learner信息,計算新的epoch(leader端)
Leader接收到Learner服務器基本信息后汞舱,會解析出該Learner的SID和ZXID伍纫,然后根據(jù)ZXID解析出對應的epoch_of_learner,并和當前Leader服務器的epoch_of_leader進行比較昂芜,如果該Learner的epoch_of_learner更大莹规,則更新Leader的epoch_of_leader = epoch_of_learner + 1。然后LearnHandler進行等待泌神,直到過半Learner已經(jīng)向Leader進行了注冊良漱,同時更新了epoch_of_leader后,Leader就可以確定當前集群的epoch了欢际。
LearnerHandler#run
Leader#getEpochToPropose
6.發(fā)送Leader狀態(tài)母市。(leader端)
計算出新的epoch后,Leader會將該信息以一個LEADERINFO消息的形式發(fā)送給Learner损趋,并等待Learner的響應窒篱。
LearnerHandler#run
QuorumPacket newEpochPacket = new QuorumPacket(Leader.LEADERINFO, ZxidUtils.makeZxid(newEpoch, 0), ver, null); //發(fā)送leader狀態(tài),以LEADERINFO的形式
7.Learner發(fā)送ACK消息。(learner端)
Learner接收到LEADERINFO后,會解析出epoch和ZXID墙杯,然后向Leader反饋一個ACKEPOCH響應配并。
Learner#registerWithLeader
if (qp.getType() == Leader.LEADERINFO)
...
QuorumPacket ackNewEpoch = new QuorumPacket(Leader.ACKEPOCH, lastLoggedZxid, epochBytes, null);//8.接受完了leader狀態(tài)之后,要發(fā)送ACK消息
8.數(shù)據(jù)同步(leader,learner端)
Leader收到Learner的ACKEPOCH后高镐,即可進行數(shù)據(jù)同步溉旋。
這個后面源碼詳細講,涉及DIFF嫉髓,SNAP观腊,TRUNC等操作
learner端
Follower#followLeader
Learner#syncWithLeader
leader端
LearnerHandler#run
9.啟動Leader和Learner服務器。(learner和leader)
當有過半Learner已經(jīng)完成了數(shù)據(jù)同步算行,那么Leader和Learner服務器實例就可以啟動了梧油。
leader端
Leader#lead
Leader#startZkServer
learner
Learner#syncWithLeader
zk.startup();
問題
什么時候出現(xiàn)第5步中的learner的epoch比leader高的情況
何時出現(xiàn)該情況,執(zhí)行 epoch_of_leader = epoch_of_learner + 1
其中epoch_of_learner 是learner的 acceptedEpoch
因為選舉的時候是按currentEpoch來的州邢,大部分情況currentEpoch是acceptedEpoch相等的
什么時候會出現(xiàn)learner的leader的acceptedEpoch高儡陨??量淌?
refer
http://blog.csdn.net/xhh198781/article/details/6587558
http://www.aboutyun.com/thread-10286-1-1.html
http://ju.outofmemory.cn/entry/138169