? ? ?高可用性读处,高穩(wěn)定性以及數(shù)據(jù)一致性是衡量服務(wù)的三個基本要素凯傲。其中數(shù)據(jù)一致性在分布式服務(wù)中是根基----不管是強一致性還是最終一致性等都需要保證其數(shù)據(jù)的一致性,不然高可用和高穩(wěn)定沒有任何意義(即便服務(wù)容忍一定時延的不一致)署驻。
? ? ?分布式一致性的保證:
? ? ?數(shù)據(jù)保證一致性主要是這兩種形式:一種是集群只有一個節(jié)點能進行數(shù)據(jù)的增刪改驾霜,然后其它節(jié)點和單前節(jié)點進行同步數(shù)據(jù)乎串。第二種就是集群節(jié)點通過溝通下在合適的時間大家一起進行數(shù)據(jù)的增刪改數(shù)據(jù)來達到數(shù)據(jù)一致性店枣。這兩種方式細想下它們都需要有一個發(fā)起人,由發(fā)起人開個頭然后集群開始數(shù)據(jù)的同步操作叹誉,這個發(fā)起人也就成為leader鸯两。
? ? ?如何選leader比如:
? ? ?方式一 :大家都讀數(shù)據(jù)庫然后讀取時增加讀鎖,誰獲取了值就是leader长豁,這種方式在獲取鎖時需要連接數(shù)據(jù)庫钧唐,執(zhí)行查詢操作,增加鎖匠襟,執(zhí)行完操作后釋放鎖钝侠,同時還有單點問題,性能瓶頸酸舍,通過這種方式提供的鎖服務(wù)無法滿足需求帅韧,同時獲取了鎖的節(jié)點如果掛了呢? 或者獲取鎖的節(jié)點在腦裂網(wǎng)絡(luò)區(qū)間呢啃勉?? ?這種方式選取leader不合適弱匪。
? ? ?方式二:由一臺服務(wù)器與所有機器保持心跳,當(dāng)需要選擇leader時 就在其中隨機選擇一臺璧亮,同時通知所有的,如果超過半數(shù)同意就成功了斥难。問題關(guān)鍵是一臺服務(wù)器和所有機器保持心跳枝嘶,為了提高高可用性增加備用機器,在這臺機器掛掉后哑诊,備用機器需要和所有機器建立連接群扶,為了提高速度,使用熱備,master和熱備也用心跳保持關(guān)系竞阐,一旦掛掉缴饭,就接過master的權(quán)限,執(zhí)行其職能骆莹,同時客戶機的配置中需要增加關(guān)于這兩臺機器的配置颗搂,方便為其創(chuàng)建連接,同時檢測連接是否正常幕垦,這種方式就算出現(xiàn)腦裂問題也不影響丢氢,一切以連接到master機器上的所有節(jié)點為準。
? ? 方式三:集群中每個節(jié)點與其余所有節(jié)點共同商量誰來當(dāng)leader先改。
? ? 目前業(yè)界使用的不管是Paxos還是Raft算法以及它們的變種算法都是采用方式三來進行l(wèi)eader選舉疚察。方式二有點資源浪費,但是按照常理來講參與決策方越多效率越低仇奶,方式二卻是避免了這種方式(暫時用不上)貌嫡。
? ? ?Raft算法由于其容易理解和實現(xiàn)等原因開始在后期大受歡迎比如:etcd就是基于此實現(xiàn)的,而大名鼎鼎的Kubernetes是基于etcd實現(xiàn)的(間接基于Raft)该溯,以及百度的braft(raft變種)岛抄。
? ? ?Raft算法實現(xiàn)一致性通過實現(xiàn)下面:
? ? ? 》選擇leader----這個是用來保證其是第一個執(zhí)行操作的,保證獨立性朗伶,不會在別的節(jié)點同時出現(xiàn)別的操作弦撩。
? ? ? 》日志復(fù)制----這是leader節(jié)點執(zhí)行操作產(chǎn)生的操作日志,用來和leader節(jié)點保存一致论皆,這是選舉leader的原因益楼,然后把日志復(fù)制到其余節(jié)點,每個節(jié)點執(zhí)行成功以后就可以保證和leader節(jié)點保證一致了点晴,這和傳統(tǒng)的2pc(2 phase commit 2階段提交) 優(yōu)勢在于---2pc在整個過程中是hold全部資源的感凤,需要全部節(jié)點執(zhí)行成功后才能釋放而這個只需要leader節(jié)點執(zhí)行成功,然后保存到日志并復(fù)制到別的節(jié)點后就可以了粒督,其余節(jié)點什么時候執(zhí)行陪竿,自有各個節(jié)點來保證日志的執(zhí)行, 在leader任期內(nèi)執(zhí)行別的操作時必須 上一個執(zhí)行的操作的log的日志已經(jīng)分發(fā)到別的所有大部分節(jié)點了屠橄,不需要執(zhí)行族跛,只需要保存,后期執(zhí)行就可以锐墙。
? ? ?Raft這種算法選舉時對性能有一定影響礁哄,不僅是Raft,其余的選舉算法溪北,隨著節(jié)點的增加桐绒,選舉的效率就越低夺脾,比如etcd就是建議部署3或5個節(jié)點就可以。如果需要大規(guī)模選舉可以采用上面的方式二茉继。(這就好比股票的撮合交易競價或者是區(qū)塊鏈中有比特幣的公共鏈到聯(lián)盟鏈等轉(zhuǎn)換)咧叭。
? ? ?問題:
? ? ? 選舉時如何得知其獲得了大多數(shù)選票,節(jié)點是會掛的烁竭,會隨時變化:
? ? ? 當(dāng)前節(jié)點參加選舉時會和其余節(jié)點通訊菲茬,如果在通訊的大多數(shù)節(jié)點都同意,那就ok颖变,那問題又來了生均,如何保障能和其它節(jié)點都能通訊? 這個除非節(jié)點掛掉腥刹,如果在投后節(jié)點掛掉了也不影響马胧,因為只能投給一個節(jié)點不能再投別的節(jié)點,投票前掛掉不沒有影響衔峰。還有一種就是腦裂問題佩脊,這可能會在不同區(qū)域都選舉一個區(qū)域的leader,對于腦裂問題 可以人工干預(yù)或者定時檢查垫卤,對于腦裂區(qū)域是否不提供服務(wù)或者提供部分服務(wù)這個依據(jù)具體業(yè)務(wù)場景來威彰。