CAP理論作為分布式系統(tǒng)的基礎(chǔ)理論,它描述的是一個(gè)分布式系統(tǒng)在以下三個(gè)特性中:
一致性(Consistency)
可用性(Availability)
分區(qū)容錯(cuò)性(Partition tolerance)
最多滿(mǎn)足其中的兩個(gè)特性。也就是下圖所描述的钧大。分布式系統(tǒng)要么滿(mǎn)足CA,要么CP炕舵,要么AP捶障。無(wú)法同時(shí)滿(mǎn)足CAP。
I.?什么是 一致性通危、可用性和分區(qū)容錯(cuò)性
分區(qū)容錯(cuò)性:指的分布式系統(tǒng)中的某個(gè)節(jié)點(diǎn)或者網(wǎng)絡(luò)分區(qū)出現(xiàn)了故障的時(shí)候励幼,整個(gè)系統(tǒng)仍然能對(duì)外提供滿(mǎn)足一致性和可用性的服務(wù)。也就是說(shuō)部分故障不影響整體使用雕什。
事實(shí)上我們?cè)谠O(shè)計(jì)分布式系統(tǒng)是都會(huì)考慮到bug,硬件缠俺,網(wǎng)絡(luò)等各種原因造成的故障显晶,所以即使部分節(jié)點(diǎn)或者網(wǎng)絡(luò)出現(xiàn)故障,我們要求整個(gè)系統(tǒng)還是要繼續(xù)使用的
(不繼續(xù)使用,相當(dāng)于只有一個(gè)分區(qū),那么也就沒(méi)有后續(xù)的一致性和可用性了)
可用性:?一直可以正常的做讀寫(xiě)操作壹士。簡(jiǎn)單而言就是客戶(hù)端一直可以正常訪(fǎng)問(wèn)并得到系統(tǒng)的正常響應(yīng)磷雇。用戶(hù)角度來(lái)看就是不會(huì)出現(xiàn)系統(tǒng)操作失敗或者訪(fǎng)問(wèn)超時(shí)等問(wèn)題。
一致性:在分布式系統(tǒng)完成某寫(xiě)操作后任何讀操作躏救,都應(yīng)該獲取到該寫(xiě)操作寫(xiě)入的那個(gè)最新的值唯笙。相當(dāng)于要求分布式系統(tǒng)中的各節(jié)點(diǎn)時(shí)時(shí)刻刻保持?jǐn)?shù)據(jù)的一致性。
II.?該怎么理解
如果我們事先保證了分區(qū)容錯(cuò)性盒使,也意味著若某個(gè)節(jié)點(diǎn)故障了崩掘,用戶(hù)還是可以繼續(xù)訪(fǎng)問(wèn)。這時(shí)用戶(hù)在訪(fǎng)問(wèn)過(guò)程中就會(huì)出現(xiàn)一致性和可用性不能同時(shí)滿(mǎn)足的情況少办,參考下圖:
如圖假設(shè)分布式系統(tǒng)有G1苞慢,G2兩個(gè)節(jié)點(diǎn),初始值都是v0∮⒓耍現(xiàn)在有一個(gè)client向系統(tǒng)寫(xiě)入了值v1挽放,這里假設(shè)直接寫(xiě)的是節(jié)點(diǎn)G1。寫(xiě)完之后client再去讀取這個(gè)值蔓纠,這時(shí)讀到了G2節(jié)點(diǎn),
由于G2節(jié)點(diǎn)與G1節(jié)點(diǎn)失去連接辑畦,這時(shí)G1節(jié)點(diǎn)上的數(shù)據(jù)還未同步到G2節(jié)點(diǎn),因此客戶(hù)端讀取到的是修改之前的值v0贺纲。 這就出現(xiàn)了不滿(mǎn)足一致性的情況了航闺。相當(dāng)于滿(mǎn)足了可用性,失去了一致性猴誊。
類(lèi)似的,如果系統(tǒng)保證了強(qiáng)的一致性侮措,那么在client 寫(xiě)完G1節(jié)點(diǎn)后, 而G1向G2節(jié)點(diǎn)同步數(shù)據(jù)出現(xiàn)了問(wèn)題懈叹,這時(shí)如果client再去讀取G2節(jié)點(diǎn)的數(shù)據(jù)時(shí),client就會(huì)一直處于等待狀態(tài)分扎,因?yàn)橄到y(tǒng)內(nèi)各節(jié)點(diǎn)
數(shù)據(jù)為同步上澄成,需要等同步上才能使用。這就相當(dāng)于滿(mǎn)足了一致性畏吓,而失去了可用性墨状。
考慮多個(gè)客戶(hù)端訪(fǎng)問(wèn)時(shí),一致性和可用性還可以這么理解:假如client1 向G1 修改某個(gè)值的時(shí)候, 寫(xiě)操作還未完成菲饼,client2就發(fā)起來(lái)對(duì)該值的讀操作肾砂,讀的是G2節(jié)點(diǎn),這時(shí)如果要滿(mǎn)足一致性宏悦,
那么就得讓client2 暫時(shí)無(wú)法使用镐确,如果要讓client2 使用包吝,那么獲取到的數(shù)據(jù)不是最新的,系統(tǒng)就不滿(mǎn)足一致性源葫。
?III.?CAP三者不可兼得诗越,該如何取舍:
(1) CA: 優(yōu)先保證一致性和可用性,放棄分區(qū)容錯(cuò)息堂。 這也意味著放棄系統(tǒng)的擴(kuò)展性嚷狞,系統(tǒng)不再是分布式的,有違設(shè)計(jì)的初衷荣堰。
(2) CP: 優(yōu)先保證一致性和分區(qū)容錯(cuò)性感耙,放棄可用性。在數(shù)據(jù)一致性要求比較高的場(chǎng)合(譬如:zookeeper,Hbase) 是比較常見(jiàn)的做法持隧,一旦發(fā)生網(wǎng)絡(luò)故障或者消息丟失即硼,就會(huì)犧牲用戶(hù)體驗(yàn),等恢復(fù)之后用戶(hù)才逐漸能訪(fǎng)問(wèn)屡拨。
(3) AP: 優(yōu)先保證可用性和分區(qū)容錯(cuò)性只酥,放棄一致性。NoSQL中的Cassandra 就是這種架構(gòu)呀狼。跟CP一樣裂允,放棄一致性不是說(shuō)一致性就不保證了,而是逐漸的變得一致哥艇。