前言
Zookeeper為了保證各節(jié)點的協(xié)同工作朦肘,在工作時需要一個Leader角色灯抛,而Zookeerper默認采用FastLeaderElection算法,且投票數(shù)大于半數(shù)則勝出的機制。
相關概念
-
服務器ID
這是在配置集群時設置的myid參數(shù)文件嫉鲸,且參數(shù)分別表示為服務器1、服務器2、服務器3次慢,編號越大在FastLeaderElection算法的權(quán)重越大。 -
選舉狀態(tài)
在選舉過程中,Zookeeper服務器有四種狀態(tài)迫像,它們分別為競選狀態(tài)(Looking)劈愚、隨從狀態(tài)(Following,同步leader狀態(tài),參與投票)闻妓、觀察狀態(tài)(Observing,同步不leader狀態(tài)菌羽,不參與投票)、領導者狀態(tài)(Leader)由缆。 -
數(shù)據(jù)id
是服務器中存放的最新數(shù)據(jù)版本號注祖,該值越大則說明數(shù)據(jù)越新,在選舉過程中數(shù)據(jù)越新權(quán)重越大均唉。 -
邏輯時鐘
通俗的講是晨,邏輯時鐘被稱為投票次數(shù),同一輪投票過程中的邏輯時鐘值是相同的舔箭,邏輯時鐘起始值為0罩缴,每投一次票,這個數(shù)據(jù)就會增加层扶。如果某臺機器宕機靴庆,那么這臺機器不會參與投票,因此邏輯時鐘會比其他的低怒医。
選舉機制類型
Zookeeper選舉機制有兩種類型炉抒,分別為全新集群選舉和非全新集群選舉,下面分別對兩種類型進行詳細講解稚叹。
全新集群選舉
全新集群選舉是新建搭建起來的焰薄,沒有數(shù)據(jù)ID和邏輯時鐘的數(shù)據(jù)影響集群的選舉。假設扒袖,目前有5臺服務器塞茅,它們的編號分別是1-5,按編號依次啟動Zoopeer服務,以下是全過程季率。
- 步驟1:服務器1啟動野瘦,首先,會給自己投票飒泻;其次鞭光,發(fā)投票信息。由于其他機器還沒有啟動所以它無法收到投票的反饋信息泞遗,因此服務器1的狀態(tài)一直屬于Looking狀態(tài)惰许。
- 步驟2:服務器2的啟動,首先史辙,會給自己投票汹买;其次在集群中啟動的zookeeper服務的機器發(fā)起投票對比佩伤,這時它會與服務器1交換結(jié)果,由于服務器2的編號大晦毙,所以服務器2勝出生巡,此時服務器1會將票投給服務器2,但此時服務器2的投票數(shù)并沒有大于集群半數(shù)(2<5/2),所以兩個服務器的狀態(tài)依然是Looking狀態(tài)见妒。
- 步驟3:服務器3啟動孤荣,首先會給自己投票;其次徐鹤,與之前啟動的服務器1垃环、2交換信息 ,由于服務器3的編號最大所以服務器3勝出返敬,那么服務器1遂庄、2會將票投給服務器3,此時投票數(shù)正好大于半數(shù)(3>5/2),所以服務器3成為領導者狀態(tài)劲赠,服務器1涛目、2稱為追隨者狀態(tài)。
- 步驟4:服務器4啟動凛澎,首先霹肝,給自己投票;其次塑煎,與之前啟動的服務器1沫换、2、3交換信息最铁,盡管服務器4的編號大讯赏,但是服務器3已經(jīng)勝出,所以服務器4只能成為追隨者狀態(tài)冷尉。
- 步驟5:服務器5啟動漱挎,同服務器4一樣,均成為追隨者狀態(tài)雀哨。
非全新集群選舉
對于正常運行的Zookeeper集群磕谅,-一旦中途有服務器宕機,則需耍重新選舉時雾棺,選舉的過程中就需要引入服務器ID膊夹、數(shù)據(jù)ID和邏輯時鐘。這是由于Zookeeper集群已經(jīng)運行過一-段時間垢村,那么服務器中就會存在運行的數(shù)據(jù)割疾。下面來講解非全新集群選舉的過程。
- 步驟1:首先,統(tǒng)計邏輯時鐘是否相同嘉栓,邏輯時鐘小宏榕,則說明途中可能存在宕機問題,因此數(shù)據(jù)不完整侵佃,那么該選舉結(jié)果被忽略麻昼,重新投票選舉;
- 步驟2:步驟2:其次,統(tǒng)- -邏輯時鐘后馋辈,對比數(shù)據(jù)ID值抚芦,數(shù)據(jù)ID反應數(shù)據(jù)的新舊程度,因此數(shù)據(jù)ID大的勝出:
- 步驟3:步驟3:如果邏輯時鐘和數(shù)據(jù)ID都相同的情況下迈螟,那么比較服務器以(編號)叉抡,值大則勝出。
簡單的講答毫,非全新集群選舉時是優(yōu)中選優(yōu)褥民,保證Leader是Zookeeper集群中數(shù)據(jù)最完整的