Raft算法中成員變更過(guò)程解析
在Raft論文中,成員變更屬于難點(diǎn)肠槽,但這一部分相比于論文其他部分牌废,確實(shí)講解最不詳細(xì)蜂挪,讓人讀完之后很迷惑寝蹈。
什么是成員變更慧域?
成員變更指的是系統(tǒng)成員變化榆骚,即服務(wù)器節(jié)點(diǎn)的上下線(xiàn)片拍,這和由于宕機(jī)故障導(dǎo)致的上下線(xiàn)是不同的。宕機(jī)或者重啟導(dǎo)致的上下線(xiàn)妓肢,是不會(huì)影響系統(tǒng)的注冊(cè)的成員數(shù)量的捌省,也就不會(huì)影響到一致性判斷所依據(jù)的“多數(shù)派”的生成,眾所周知碉钠,“多數(shù)派”是所有一致性的基礎(chǔ)纲缓。成員變更時(shí)卷拘,會(huì)修改注冊(cè)的成員數(shù)量,比如在實(shí)際應(yīng)用中祝高,為了提高安全等級(jí)栗弟,就很可能出現(xiàn)需要把備機(jī)數(shù)量由三臺(tái)擴(kuò)充到五臺(tái),在這種情況下工闺,就發(fā)生了成員變更乍赫。
Raft的成員變更實(shí)現(xiàn)方案
Raft提出了通過(guò)一個(gè)中間過(guò)渡階段,即聯(lián)合共識(shí)(joint consensus)陆蟆,逐步把數(shù)據(jù)寫(xiě)入的新的集群中雷厂。其具體做法是2階段提交式的:
第一階段:先寫(xiě)一條<Cold, Cnew>同步到新舊兩個(gè)集群的多數(shù)派,寫(xiě)入這條日志后叠殷,系統(tǒng)中的任何寫(xiě)入請(qǐng)求罗侯,都要同步到Cold和Cnew兩個(gè)集群的多數(shù)派才算寫(xiě)入成功
第二階段:當(dāng)<Cold, Cnew>同步成功后,再寫(xiě)一條<Cnew>溪猿,同步給新集群钩杰,然后就可以完成切換了。
這個(gè)過(guò)程看起來(lái)比較復(fù)雜诊县,其實(shí)從宏觀(guān)來(lái)理解讲弄,可以把Cnew看作原有集群的一個(gè)熱備,在聯(lián)合共識(shí)階段依痊,一個(gè)請(qǐng)求要寫(xiě)入原有系統(tǒng)和熱備避除,之后,不論<Cold, Cnew>這條日志是否寫(xiě)成功到多數(shù)派胸嘁,不論熱備出現(xiàn)了何種故障瓶摆,原有系統(tǒng)會(huì)一直保證數(shù)據(jù)是一致的。當(dāng)寫(xiě)入<Cnew>到多數(shù)派備機(jī)成功后性宏,就保證了新集群和熱備有了一致且完備的數(shù)據(jù)群井,在這種情況下,新集群就可以接替原有集群工作了毫胜。