1. tcp只保證tcp棧消息不丟失,不能保證應(yīng)用層
2.系統(tǒng)狀態(tài):成功,失敗泊交,未知
3.一致性類(lèi)型
強(qiáng)一致(mysql事務(wù))臭觉,順序一致性,會(huì)話一致性辨液,
最終一致性(paox)
虐急,弱一致性(mysql同步)
1.2 分布式系統(tǒng)評(píng)價(jià)指標(biāo)
1.性能 ?2.可用性 3.擴(kuò)展性 4.一致性
2.1 數(shù)據(jù)分布方式
1.hash ??
優(yōu)點(diǎn):只記錄分桶數(shù)即可
缺點(diǎn):擴(kuò)容數(shù)據(jù)移動(dòng)大,值如果分布不均衡發(fā)生數(shù)據(jù)傾斜滔迈,
2.按數(shù)據(jù)范圍
缺點(diǎn):需要維護(hù)數(shù)據(jù)分布的元數(shù)據(jù)
??3.按數(shù)據(jù)量切分 chunk
缺點(diǎn):
2.2 副本的數(shù)據(jù)分布
1.以機(jī)器為單位
缺點(diǎn):
(1)不好擴(kuò)容(每臺(tái)機(jī)器是1/3的分片)止吁,擴(kuò)容必須增加三臺(tái)
(2)一個(gè)節(jié)點(diǎn)宕機(jī), ? copy全量數(shù)據(jù)
2.數(shù)據(jù)分段燎悍,一個(gè)機(jī)器多個(gè)分片
優(yōu)點(diǎn):一個(gè)節(jié)點(diǎn)宕機(jī)敬惦,能從所有節(jié)點(diǎn)同步數(shù)據(jù)
2.3 副本協(xié)議
1.中心化
更新只針對(duì)primary 節(jié)點(diǎn),然后同步給副本
流程:
(1)
2.去中心化
paox
3 分布式協(xié)議
1.lease
流程:
? ?(1)master 想slave同步時(shí)發(fā)送一個(gè)lease谈山,帶有有效期俄删。保證在此有效期不對(duì)數(shù)據(jù)做修改
(2)slave上的lease,刪除此數(shù)據(jù)
(3)master收到更新請(qǐng)求
? ? ?<1>會(huì)阻塞請(qǐng)求
? ? ?優(yōu)化:(開(kāi)始更新時(shí),不發(fā)放lease畴椰,或發(fā)放的lease是以發(fā)放里最大的)
? ? ? <2>等待發(fā)出的lease過(guò)期臊诊。
? ? ? 優(yōu)化:master主動(dòng)請(qǐng)求slave清除lease
讀取流程:
(1)發(fā)現(xiàn)數(shù)據(jù)有cache,并且lease 未過(guò)期迅矛,直接本地返回妨猩。否則轉(zhuǎn)給master
用途:使用lease選主,中央節(jié)點(diǎn)Q給master 發(fā)送一個(gè)特殊lease秽褒,每次收到slave心跳發(fā)放一個(gè)lease
2.quorum
定義:更新是一系列順序過(guò)程壶硅,wi(i是版本號(hào))
類(lèi)型:
?write-all-read-one(所有節(jié)點(diǎn)寫(xiě)成功,才算成功)=
w + r = n+1
缺點(diǎn):
必須讀取到w個(gè)節(jié)點(diǎn)销斟,才能確定當(dāng)前成功的最高版本
4.兩階段提交過(guò)程
角色:一個(gè)中心化協(xié)調(diào)者庐椒,n個(gè)參與者
流程:
?協(xié)調(diào)者:(1)本地寫(xiě)入日子begin-commit ,進(jìn)入wait狀態(tài)(2)向參與者發(fā)送prpare
(3)等待參與者對(duì)prepare的響應(yīng),收到全部vote-commit蚂踊,寫(xiě)入gloabl-commit日志约谈,進(jìn)入commit狀態(tài),并發(fā)送gloabl-commit消息犁钟。只要收到一個(gè)abort棱诱,寫(xiě)入gloabl-abort,進(jìn)入abort狀態(tài)涝动,發(fā)送gloabl-abort消息
(4)等待確認(rèn)消息迈勋,都收到后寫(xiě)入end-transaction日志
參與者(1)寫(xiě)入init日志,進(jìn)入init狀態(tài) (2)等待協(xié)調(diào)者prepare消息 (3)如果能提交醋粟,寫(xiě)入ready日志靡菇,進(jìn)入ready狀態(tài)(3.1)向協(xié)調(diào)者發(fā)送vote-commit (3.2)等待協(xié)調(diào)者消息,如果是gloabl-commit,寫(xiě)入commit日志米愿,進(jìn)入commit狀態(tài)厦凤。如果是gloabl-abort,寫(xiě)入abort日志育苟,進(jìn)入abort狀態(tài)较鼓,向協(xié)調(diào)者發(fā)送確認(rèn)消息。
(4)不能提交宙搬,寫(xiě)入abort日志笨腥,進(jìn)入abort狀態(tài),發(fā)送vote-abort消息勇垛,后續(xù)可響應(yīng)gloabl-abort消息
缺點(diǎn): 沒(méi)有容錯(cuò)能力,如果協(xié)調(diào)者發(fā)送gloabl-commit或者gloabl-abort超時(shí)士鸥,需要一直不斷的重發(fā)闲孤。如果有參與者宕機(jī)或者網(wǎng)絡(luò)斷開(kāi),流程卡住了∷匣或者參與者在進(jìn)入ready狀態(tài)肥照,等待gloabl-commit超時(shí),只有不斷發(fā)送vote-commit勤众,如果和協(xié)調(diào)者網(wǎng)絡(luò)斷開(kāi)舆绎,流程卡住了。
5.mvcc
類(lèi)似svn们颜。每個(gè)事務(wù)一個(gè)分支吕朵,后提交的如果沒(méi)有沖突就合并。有則失敗窥突。
保證不影響真正的數(shù)據(jù)努溃,有2種方式。(1)copy后在修改阻问,類(lèi)似svn的checkout (2)只提交修改記錄梧税,然后從基礎(chǔ)版本計(jì)算,類(lèi)似git称近。????
6.paxos
角色: proper第队,acceptor,learner
流程:每輪都有個(gè)編號(hào)(下面用b來(lái)表示)
proper 端
? 準(zhǔn)備階段
? ? (1)發(fā)送Proper(b)?
? ?(2)如果收到一個(gè)Reject(B)刨秆,本輪失敗凳谦,輪次號(hào)加1(b+1)重新執(zhí)行步驟一
?批準(zhǔn)階段
?(3)如果收到的Promise(b,vi)的數(shù)量超過(guò)半數(shù),如果v都是空坛善,可以設(shè)置任意的值晾蜘。否則選擇i最大的v。廣播accept(b,v)
(4)如果收到nack(b)眠屎,輪次號(hào)加1(b+1)重新執(zhí)行步驟一
acceptor端:
準(zhǔn)備階段:
(1)接收proper(b)
? ? ?參數(shù)B是之前接收到的最大輪次號(hào)剔交,V是之前選定的值(可為空)
? ?如果b > B ,回復(fù)promise(b,V_B),設(shè)置B= b。否則回復(fù)Rejec(B)
(2)接收accept(b,v)
如果b>B,設(shè)置V= v改衩,廣播accept消息岖常,否則回復(fù)Nack(B),