etcd-raft源碼分析3-leader選舉

當(dāng)server啟動(dòng)后辛孵,初始狀態(tài)是follower固惯,然后如果在集群中第一個(gè)觸發(fā)選舉超時(shí)薇正,則變?yōu)閏andicate柑晒,然后向其他server發(fā)起投票欧瘪,當(dāng)收到過(guò)半數(shù)的贊成票后變?yōu)閘eader,開始每隔一個(gè)心跳時(shí)間向其他server發(fā)送心跳匙赞。啟動(dòng)流程如下:

leader選舉.png

在server正常工作前佛掖,需要進(jìn)行l(wèi)eader選舉,server啟動(dòng)時(shí)為follower罚屋,在raftNode的一個(gè)routine中苦囱,會(huì)監(jiān)聽ticker.C這個(gè)通道的事件,這個(gè)通道對(duì)應(yīng)一個(gè)定時(shí)器脾猛,每隔100ms觸發(fā)一次撕彤,每次觸發(fā)該100ms定時(shí)事件,raftNode會(huì)向node的n.tickc通道寫入事件猛拴,這樣相當(dāng)于node有了一個(gè)每隔100ms觸發(fā)一次的時(shí)鐘信號(hào)羹铅,node在自己的一個(gè)routine中會(huì)根據(jù)該時(shí)鐘信號(hào)判斷是否達(dá)到了選舉超時(shí)時(shí)間,到達(dá)選舉超時(shí)時(shí)間后愉昆,會(huì)變?yōu)閏andicate狀態(tài)职员,然后對(duì)集群中其他每個(gè)server(在peer中保存該server與其他server的關(guān)聯(lián)數(shù)據(jù)),構(gòu)造選舉請(qǐng)求消息跛溉,追加到raft算法模塊的msgs中焊切,而在node的一個(gè)routine中會(huì)監(jiān)聽r.msgs是否有消息要處理,有的話會(huì)將r.msgs封裝成Ready寫入到node的n.readyc通道芳室,raftNode當(dāng)監(jiān)聽到n.readyc通道有消息時(shí)會(huì)將消息寫入到cw.msgc通道专肪,streamWriter會(huì)把cw.msgc通道的消息發(fā)送到對(duì)應(yīng)的server。
當(dāng)對(duì)應(yīng)peer的streamReader監(jiān)聽到p.recvc通道有事件并且事件為投票響應(yīng)消息時(shí)會(huì)將消息寫入到node的n.recvc通道堪侯,node根據(jù)投票響應(yīng)結(jié)果統(tǒng)計(jì)投贊成票的server個(gè)數(shù)嚎尤,如果超過(guò)半數(shù)則變?yōu)閘eader,開始向其他server發(fā)送心跳伍宦。

下面看下follower在收到選舉請(qǐng)求時(shí)如何處理芽死,在raft的Step方法中:

case pb.MsgVote, pb.MsgPreVote:
    // The m.Term > r.Term clause is for MsgPreVote. For MsgVote m.Term should
    // always equal r.Term.
    if (r.Vote == None || m.Term > r.Term || r.Vote == m.From) && r.raftLog.isUpToDate(m.Index, m.LogTerm) {
        r.logger.Infof("%x [logterm: %d, index: %d, vote: %x] cast %s for %x [logterm: %d, index: %d] at term %d",
            r.id, r.raftLog.lastTerm(), r.raftLog.lastIndex(), r.Vote, m.Type, m.From, m.LogTerm, m.Index, r.Term)
        r.send(pb.Message{To: m.From, Type: voteRespMsgType(m.Type)})
        if m.Type == pb.MsgVote {
            // Only record real votes.
            r.electionElapsed = 0
            r.Vote = m.From
        }
    } else {
        r.logger.Infof("%x [logterm: %d, index: %d, vote: %x] rejected %s from %x [logterm: %d, index: %d] at term %d",
            r.id, r.raftLog.lastTerm(), r.raftLog.lastIndex(), r.Vote, m.Type, m.From, m.LogTerm, m.Index, r.Term)
        r.send(pb.Message{To: m.From, Type: voteRespMsgType(m.Type), Reject: true})
    }

投票消息為pb.MsgVote,直接看投贊成票的條件r.raftLog.isUpToDate(m.Index, m.LogTerm)次洼,方法如下:

func (l *raftLog) isUpToDate(lasti, term uint64) bool {
  return term > l.lastTerm() || (term == l.lastTerm() && lasti >= l.lastIndex())
}

m.Index為candicate的最新日志的索引位置关贵,即參數(shù)中的lasti,m.LogTerm為candicate最新日志的任期號(hào)卖毁,即參數(shù)中的term揖曾。贊成條件為candicate的最新日志的任期號(hào)比f(wàn)ollower的最新日志的任期號(hào)大term > l.lastTerm(),或者在雙方最新日志任期號(hào)相同的情況下,candicate最新日志的索引位置要比f(wàn)ollower的最新日志索引位置大翩肌,即比f(wàn)ollower的日志更新 (term == l.lastTerm() && lasti >= l.lastIndex()模暗。

下面看下candicate對(duì)于投票響應(yīng)請(qǐng)求的處理,在raft的stepCandicate方法中:

case myVoteRespType:
    gr := r.poll(m.From, m.Type, !m.Reject)
    r.logger.Infof("%x [quorum:%d] has received %d %s votes and %d vote rejections", r.id, r.quorum(), gr, m.Type, len(r.votes)-gr)
    switch r.quorum() {
    case gr:
        if r.state == StatePreCandidate {
            r.campaign(campaignElection)
        } else {
            r.becomeLeader()
            r.bcastAppend()
        }
    case len(r.votes) - gr:
        r.becomeFollower(r.Term, None)
    }

關(guān)鍵語(yǔ)句在這一行g(shù)r := r.poll(m.From, m.Type, !m.Reject)念祭,下面看下這個(gè)方法:

func (r *raft) poll(id uint64, t pb.MessageType, v bool) (granted int) {
  if v {
      r.logger.Infof("%x received %s from %x at term %d", r.id, t, id, r.Term)
  } else {
      r.logger.Infof("%x received %s rejection from %x at term %d", r.id, t, id, r.Term)
  }
  if _, ok := r.votes[id]; !ok {
      r.votes[id] = v
  }
  for _, vv := range r.votes {
      if vv {
          granted++
      }
  }
  return granted
}

m.From為投票響應(yīng)請(qǐng)求來(lái)源follower的id兑宇,!m.Reject是該follower是否同意投票,首先設(shè)置follower的投票結(jié)果:

r.votes[id] = v

v就是!m.Reject粱坤,然后統(tǒng)計(jì)所有server的贊成票數(shù):

for _, vv := range r.votes {
    if vv {
        granted++
    }
}

回到raft的stepCandicate方法隶糕,gr就是poll返回的贊成票數(shù)granted,當(dāng)贊成票數(shù)達(dá)到r.quorum()站玄,即過(guò)半數(shù)枚驻,如下:

func (r *raft) quorum() int { 
  return len(r.prs)/2 + 1 
}

當(dāng)贊成票達(dá)到過(guò)半數(shù)時(shí),成為leader株旷,并向其他follower發(fā)送附加日志rpc再登。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市晾剖,隨后出現(xiàn)的幾起案子锉矢,更是在濱河造成了極大的恐慌,老刑警劉巖齿尽,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件沽损,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡循头,警方通過(guò)查閱死者的電腦和手機(jī)绵估,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)卡骂,“玉大人国裳,你說(shuō)我怎么就攤上這事〕ゾ” “怎么了躏救?”我有些...
    開封第一講書人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵唯笙,是天一觀的道長(zhǎng)螟蒸。 經(jīng)常有香客問(wèn)我,道長(zhǎng)崩掘,這世上最難降的妖魔是什么七嫌? 我笑而不...
    開封第一講書人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮苞慢,結(jié)果婚禮上诵原,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好绍赛,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開白布蔓纠。 她就那樣靜靜地躺著,像睡著了一般吗蚌。 火紅的嫁衣襯著肌膚如雪腿倚。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,541評(píng)論 1 305
  • 那天蚯妇,我揣著相機(jī)與錄音敷燎,去河邊找鬼。 笑死箩言,一個(gè)胖子當(dāng)著我的面吹牛硬贯,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播陨收,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼饭豹,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了务漩?” 一聲冷哼從身側(cè)響起墨状,我...
    開封第一講書人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎菲饼,沒想到半個(gè)月后肾砂,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡宏悦,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年镐确,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片饼煞。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡源葫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出砖瞧,到底是詐尸還是另有隱情息堂,我是刑警寧澤,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布块促,位于F島的核電站荣堰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏竭翠。R本人自食惡果不足惜振坚,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望斋扰。 院中可真熱鬧渡八,春花似錦啃洋、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至逮壁,卻和暖如春绝编,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背貌踏。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工十饥, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人祖乳。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓逗堵,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親眷昆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蜒秤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容