談大規(guī)模分布式系統(tǒng)的伸縮性架構(gòu)

要實(shí)現(xiàn)伸縮性架構(gòu)钧椰,最重要的是使用集群怨愤,只要能做到向集群中加入服務(wù)器的數(shù)量和集群處理能力成正比寞缝,網(wǎng)站就能夠無限增強(qiáng)處理能力癌压。

一類是不同的服務(wù)器部署不同的服務(wù)實(shí)現(xiàn)伸縮性,這類問題通過縱向分離(分層后分離)和橫向分離(業(yè)務(wù)分割后分離)實(shí)現(xiàn)荆陆;

另一類是集群中多臺(tái)服務(wù)器部署相同的服務(wù)實(shí)現(xiàn)伸縮性滩届,這類問題需要設(shè)計(jì)應(yīng)用服務(wù)器和數(shù)據(jù)服務(wù)器的伸縮性。

一被啼、應(yīng)用服務(wù)器的伸縮性

應(yīng)用服務(wù)器伸縮性的核心是無狀態(tài)和負(fù)載均衡帜消。

負(fù)載均衡服務(wù)器的分類:

a. Http重定向LB:需要兩次請(qǐng)求;

b. DNSLB:DNS有緩存可能導(dǎo)致訪問到下線的服務(wù)器浓体;

c. 反向代理LB:成為所有請(qǐng)求和響應(yīng)的中轉(zhuǎn)站泡挺,壓力大;

d. IPLB:通過修改數(shù)據(jù)包的IP地址實(shí)現(xiàn)命浴;

e. 鏈路層LB:修改數(shù)據(jù)的MAC地址娄猫;

常用的LB算法有:輪詢、加權(quán)輪詢生闲、隨機(jī)媳溺、最少連接、源地址散列

二碍讯、緩存集群的伸縮性

1. Memcached模型

Memcached使用Key-Value形式存儲(chǔ)和訪問數(shù)據(jù)悬蔽,在內(nèi)存中維護(hù)一張巨大的HashTable,使得對(duì)數(shù)據(jù)查詢的時(shí)間復(fù)雜度降低到O(1)捉兴,保證了對(duì)數(shù)據(jù)的高性能訪問蝎困。內(nèi)存的空間總是有限的,當(dāng)內(nèi)存沒有更多的空間來存儲(chǔ)新數(shù)據(jù)時(shí)倍啥,memcached就會(huì)利用LRU算法將不常使用的數(shù)據(jù)淘汰掉禾乘。

Memcached本身并不是分布式緩存系統(tǒng),它的分布式是由訪問它的客戶端實(shí)現(xiàn)的逗栽。

常用的路由算法有:

a. 余數(shù)Hash:算法簡(jiǎn)單盖袭,但一旦有服務(wù)器宕機(jī)或者要新增服務(wù)器就會(huì)導(dǎo)致緩存失效,引起雪崩。

b. 一致性Hash:服務(wù)器的增減不會(huì)引起雪崩效應(yīng)鳄虱,但當(dāng)服務(wù)器節(jié)點(diǎn)較少時(shí)可能某臺(tái)服務(wù)器壓力過大弟塞。

c. 帶虛擬節(jié)點(diǎn)的一致性Hash:每臺(tái)服務(wù)器對(duì)應(yīng)多個(gè)虛擬節(jié)點(diǎn),避免某臺(tái)服務(wù)器壓力過大拙已,尋址的過程多了一步從虛擬節(jié)點(diǎn)到服務(wù)器的映射决记。

三、數(shù)據(jù)服務(wù)器的伸縮性

1. 關(guān)系數(shù)據(jù)庫(kù)集群的伸縮性

a. 讀寫分離:主server負(fù)責(zé)寫入倍踪,并同步到從server系宫,從server負(fù)責(zé)讀取和數(shù)據(jù)分析。

要實(shí)現(xiàn)數(shù)據(jù)庫(kù)的復(fù)制建车,需要開啟Master服務(wù)器端的Binary log扩借。數(shù)據(jù)復(fù)制的過程實(shí)際就是從slave從master獲取binary log,然后再在本地鏡像中執(zhí)行日志中的操作缤至。由于復(fù)制是異步的潮罪,因此只能保證最終一致性。

b. 數(shù)據(jù)分庫(kù)

對(duì)ID按照表的數(shù)量取模领斥,計(jì)算出數(shù)據(jù)存儲(chǔ)在哪個(gè)數(shù)據(jù)庫(kù)里嫉到。

c. 拆表

對(duì)ID按照表的數(shù)量取模,計(jì)算出數(shù)據(jù)存儲(chǔ)在哪張表里月洛。

常見的有Corba

2. Nosql集群的伸縮性

HBase的伸縮性依賴其可分裂的HRegion和可伸縮的HDFS實(shí)現(xiàn)何恶。

HBase使用ColumnFamily。Hbase表的創(chuàng)建的時(shí)候就必須指定列族嚼黔。

Rowkey的概念和mysql中的主鍵是完全一樣的细层,Rawkey的設(shè)計(jì)。

TimeStamp對(duì)Hbase來說至關(guān)重要隔崎,因?yàn)樗菍?shí)現(xiàn)Hbase多版本的關(guān)鍵今艺。在Hbase中使用不同的timestame來標(biāo)識(shí)相同rowkey行對(duì)應(yīng)的不同版本的數(shù)據(jù)韵丑。

主要組建包括ZooKeeper爵卒、HMaster、HRegionServer撵彻、HRegion钓株。

ZooKeeper的主要作用:

a. 分布式鎖:選舉記錄主HMaster;

b. 集群管理:監(jiān)控HRegionServer的狀態(tài)陌僵,在HRegionServer故障時(shí)通知HMaster重新分配HRegion轴合;

c. 通過Zoopkeeper存儲(chǔ)元數(shù)據(jù)的統(tǒng)一入口地址。

HRegionServer:分布多個(gè)HRegion碗短。

HMaster的主要作用:

a. 為RegionServer分配Region受葛,當(dāng)收到ZooKeeper的HRegionServer失效的通知時(shí)為HRegion重新分配HRegionServer;

b. 維護(hù)HRegionServer集群的負(fù)載均衡;

c. 當(dāng)RegionSever失效的時(shí)候总滩,協(xié)調(diào)對(duì)應(yīng)Hlog的拆分纲堵。

HRegionServer的主要作用:

a. 處理來自客戶端的讀寫請(qǐng)求;

b. 負(fù)責(zé)和底層HDFS的交互闰渔,存儲(chǔ)數(shù)據(jù)到HDFS席函;

c. 負(fù)責(zé)Region變大以后的拆分;

d. 負(fù)責(zé)Storefile的合并工作冈涧。

尋址

第1步:Client請(qǐng)求ZK獲取.META.所在的RegionServer的地址茂附。

第2步:Client請(qǐng)求.META.所在的RegionServer獲取訪問數(shù)據(jù)所在的RegionServer地址,client會(huì)將.META.的相關(guān)信息cache下來督弓,以便下一次快速訪問营曼。

第3步:Client請(qǐng)求數(shù)據(jù)所在的RegionServer,獲取所需要的數(shù)據(jù)愚隧。

寫操作

上圖可以看出氛圍3步驟:

Hbase的寫入流程如下圖所示:


第1步:Client獲取數(shù)據(jù)寫入的Region所在的RegionServer

第2步:請(qǐng)求寫Hlog

第3步:請(qǐng)求寫MemStore

只有當(dāng)寫Hlog和寫MemStore都成功了才算請(qǐng)求寫入完成溶推。MemStore后續(xù)會(huì)逐漸刷到HDFS中。


HBase的伸縮性:

當(dāng)表的數(shù)據(jù)量越來越大奸攻,Region越來越多的時(shí)候蒜危,只需要添加RegionServer,此時(shí)RegionServer向ZooKeeper寫入節(jié)點(diǎn)睹耐,ZooKeeper通知HMaster為其分配HRegion辐赞。

HBase的可用性:

當(dāng)某個(gè)HRegionServer異常時(shí),ZooKeeper會(huì)監(jiān)測(cè)到并通知HMaster硝训,HMaster會(huì)將故障的RegionServer的Region重新分配給其他RegionServer响委,并通過Hlog將RegionServer的操作還原到新的RegionServer上。

HBase的高性能:

隨著數(shù)據(jù)量增大窖梁,Region會(huì)越來越大赘风,當(dāng)Region的大小超過設(shè)定的閾值時(shí)會(huì)分裂,分裂后的Region可能位于同一個(gè)RegionServer纵刘,也可能位于不同的RegionServer邀窃。這就保證了Region不會(huì)太大以至于影響讀寫性能。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末假哎,一起剝皮案震驚了整個(gè)濱河市瞬捕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌舵抹,老刑警劉巖肪虎,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異惧蛹,居然都是意外死亡扇救,警方通過查閱死者的電腦和手機(jī)刑枝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來迅腔,“玉大人仅讽,你說我怎么就攤上這事〖匦” “怎么了洁灵?”我有些...
    開封第一講書人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)掺出。 經(jīng)常有香客問我徽千,道長(zhǎng),這世上最難降的妖魔是什么汤锨? 我笑而不...
    開封第一講書人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任双抽,我火速辦了婚禮,結(jié)果婚禮上闲礼,老公的妹妹穿的比我還像新娘牍汹。我一直安慰自己,他們只是感情好柬泽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開白布慎菲。 她就那樣靜靜地躺著,像睡著了一般锨并。 火紅的嫁衣襯著肌膚如雪露该。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,598評(píng)論 1 305
  • 那天第煮,我揣著相機(jī)與錄音解幼,去河邊找鬼。 笑死包警,一個(gè)胖子當(dāng)著我的面吹牛撵摆,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播害晦,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼特铝,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了篱瞎?” 一聲冷哼從身側(cè)響起苟呐,我...
    開封第一講書人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎俐筋,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體严衬,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡澄者,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片粱挡。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡赠幕,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出询筏,到底是詐尸還是另有隱情榕堰,我是刑警寧澤,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布嫌套,位于F島的核電站逆屡,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏踱讨。R本人自食惡果不足惜魏蔗,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望痹筛。 院中可真熱鬧莺治,春花似錦、人聲如沸帚稠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)滋早。三九已至蔓挖,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間馆衔,已是汗流浹背瘟判。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留角溃,地道東北人拷获。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像减细,于是被迫代替她去往敵國(guó)和親匆瓜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容