? ? 保證數(shù)據(jù)一致性是對存儲(chǔ)系統(tǒng)的基本要求吞加,對于分布式文件系統(tǒng)來說挑戰(zhàn)比較大撮抓,本文將介紹FastCFS采用的數(shù)據(jù)一致性模型及基礎(chǔ)結(jié)構(gòu)。
? ? 說到數(shù)據(jù)一致性响鹃,大家會(huì)想到分布式系統(tǒng)必須符合CAP理論:一個(gè)分布式系統(tǒng)依啰,不可能完全滿足CAP乎串,只能做到其中的兩個(gè),即 CA速警、AP或CP叹誉。
? ? FastCFS的目標(biāo)是支持跑數(shù)據(jù)庫鸯两,保證數(shù)據(jù)一致性是基本要求;保證可用性也是分布式系統(tǒng)的一個(gè)基本要求长豁,因此FastCFS選擇全力做到 CA钧唐,萬一發(fā)生網(wǎng)絡(luò)分區(qū),可用性可能會(huì)受到影響蕉斜,但不會(huì)破壞數(shù)據(jù)一致性逾柿。FastCFS采用leader選舉過半數(shù)等機(jī)制防止腦裂缀棍,并且有數(shù)據(jù)校驗(yàn)及自動(dòng)修復(fù)功能宅此;v3.5支持?jǐn)?shù)據(jù)復(fù)制過半數(shù)機(jī)制,保證極端情況下數(shù)據(jù)一致性和可靠性爬范。FastCFS的leader和master不是基于中心節(jié)點(diǎn)父腕,而是以服務(wù)器分組為單元自洽的。由此可見FastCFS在架構(gòu)和實(shí)現(xiàn)機(jī)制上采用分而治之的局部化做法青瀑,最大程度地規(guī)避了發(fā)生網(wǎng)絡(luò)分區(qū)的風(fēng)險(xiǎn)璧亮。
? ? FastCFS對數(shù)據(jù)分組采用master/slave結(jié)構(gòu),對于服務(wù)器分組采用leader/follower結(jié)構(gòu)斥难。細(xì)心的朋友會(huì)有這樣的困惑:FastCFS居然有l(wèi)eader和master兩種角色枝嘶,只要其中一種不就可以了嗎?二者都是大家所熟知的概念哑诊,我相信業(yè)界一定有l(wèi)eader + master的做法群扶,但將二者并存于一組服務(wù)器,并且以原生方式實(shí)現(xiàn)镀裤,也許是FastCFS的獨(dú)創(chuàng)竞阐。
? ? FastCFS采用的是數(shù)據(jù)強(qiáng)一致模型,客戶端的更新操作只能在master上執(zhí)行暑劝,然后master通過RPC調(diào)用將更新操作同步給ACTIVE狀態(tài)(此狀態(tài)方可提供在線服務(wù))的slave骆莹。因服務(wù)重啟或網(wǎng)絡(luò)嚴(yán)重抖動(dòng)等異常導(dǎo)致slave掉線,slave將進(jìn)入數(shù)據(jù)恢復(fù)階段担猛,追上master的數(shù)據(jù)后幕垦,才能切換為ACTIVE狀態(tài)。
? ? 那么引入 leader/follower目的何在呢傅联?因?yàn)橐唤M服務(wù)器上通常會(huì)包含多個(gè)數(shù)據(jù)分組(為了便于集群擴(kuò)容會(huì)預(yù)分配較大的數(shù)據(jù)分組智嚷,比如1024個(gè);一組服務(wù)器上配置的數(shù)據(jù)分組建議不少于64個(gè))纺且,每個(gè)數(shù)據(jù)分組的master選舉如果按照選舉流程來一遍盏道,這個(gè)消耗太大。因此FastCFS創(chuàng)新地引入leader角色载碌,由leader直接任命其管轄的若干個(gè)數(shù)據(jù)分組的master猜嘱。一句話總結(jié)leader和master的產(chǎn)生機(jī)制:leader通過組內(nèi)服務(wù)器選舉產(chǎn)生衅枫,而master則由leader直接任命。
? ? 最后小結(jié)一下朗伶,本文介紹了FastCFS采用的數(shù)據(jù)一致性模型和基礎(chǔ)結(jié)構(gòu)弦撩,包括leader/follower和master/slave兩種。