淺談數(shù)據(jù)庫(kù)集群方案

單點(diǎn)數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)往往是系統(tǒng)中的性能瓶頸筷弦，所以通常在系統(tǒng)設(shè)計(jì)中會(huì)引入各種各樣的緩存機(jī)制肋演，以避免頻繁訪問(wèn)數(shù)據(jù)庫(kù)。另外奸笤，數(shù)據(jù)庫(kù)由于其重要性惋啃，高可用要求也是避免不了的，因?yàn)橐坏?shù)據(jù)庫(kù)掛了基本上整個(gè)系統(tǒng)也就不能使用了监右。

而以上這些常見問(wèn)題都是單點(diǎn)數(shù)據(jù)庫(kù)帶來(lái)的限制边灭，為了解決這些問(wèn)題，達(dá)到高性能健盒、高可用的目的绒瘦，我們就需要在系統(tǒng)架構(gòu)設(shè)計(jì)中采用數(shù)據(jù)庫(kù)集群方案称簿。

性能測(cè)試

既然單點(diǎn)數(shù)據(jù)庫(kù)存在性能問(wèn)題，那么有沒有實(shí)際數(shù)據(jù)呢惰帽？下面我們就來(lái)對(duì)單點(diǎn)數(shù)據(jù)庫(kù)進(jìn)行一個(gè)性能測(cè)試憨降，看看其并發(fā)極限大概是多少。我這里使用了一臺(tái)2核2G的云服務(wù)该酗，mysql版本為8.0.18授药。

mysql自帶了一個(gè)性能測(cè)試工具：mysqlslap，我們可以使用該工具進(jìn)行測(cè)試呜魄，具體的測(cè)試參數(shù)如下：

[root@localhost ~]# mysqlslap -hlocalhost -uroot -pyour_password -P3306 --concurrency=500 --iterations=1 --auto-generate-sql --auto-generate-sql-load-type=mixed --auto-generate-sql-add-autoincrement --engine=innodb --number-of-queries=500

主要參數(shù)說(shuō)明：

參數(shù)	說(shuō)明
`--concurrency`	并發(fā)數(shù)量悔叽，即模擬的客戶端數(shù)量
`--iterations`	執(zhí)行多少次該測(cè)試
`--auto-generate-sql`	使用系統(tǒng)自己生成的SQL腳本來(lái)測(cè)
`--auto-generate-sql-load-type`	要測(cè)試的是讀還是寫還是兩者混合的（取值：read, write, update, mixed）
`--auto-generate-sql-add-autoincrement`	將自增的列添加到自動(dòng)生成的表中
`--engine`	要測(cè)試的存儲(chǔ)引擎
`--number-of-queries`	每個(gè)客戶端的訪問(wèn)次數(shù)，該數(shù)值除以并發(fā)數(shù)量就是每個(gè)客戶端的訪問(wèn)次數(shù)爵嗅，在本例中：`500 / 500 = 1`

更多內(nèi)容詳見官方文檔

這里我分別進(jìn)行了不同量級(jí)的測(cè)試娇澎，在并發(fā)500、1000和5000個(gè)連接時(shí)睹晒，數(shù)據(jù)庫(kù)還可以正常處理趟庄，沒有太大問(wèn)題：

# 500個(gè)并發(fā)連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.391 seconds
    Minimum number of seconds to run all queries: 0.391 seconds
    Maximum number of seconds to run all queries: 0.391 seconds
    Number of clients running queries: 500
    Average number of queries per client: 1

# 1000個(gè)并發(fā)連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 0.802 seconds
    Minimum number of seconds to run all queries: 0.802 seconds
    Maximum number of seconds to run all queries: 0.802 seconds
    Number of clients running queries: 1000
    Average number of queries per client: 1

# 5000個(gè)并發(fā)連接
Benchmark
    Running for engine innodb
    Average number of seconds to run all queries: 3.884 seconds
    Minimum number of seconds to run all queries: 3.884 seconds
    Maximum number of seconds to run all queries: 3.884 seconds
    Number of clients running queries: 5000
    Average number of queries per client: 1

但在測(cè)試1w個(gè)并發(fā)連接時(shí)，數(shù)據(jù)庫(kù)就開始報(bào)無(wú)法連接的錯(cuò)誤了：

image.png

由該測(cè)試案例可知伪很，普通的單節(jié)點(diǎn)數(shù)據(jù)庫(kù)性能瓶頸大概在1w個(gè)并發(fā)連接左右戚啥。當(dāng)然這里的測(cè)試結(jié)果與機(jī)器的硬件差異有關(guān)，只是提供一個(gè)參考是掰。

PXC集群方案

上一小節(jié)介紹了單點(diǎn)數(shù)據(jù)庫(kù)存在的問(wèn)題虑鼎，以及進(jìn)行了一個(gè)簡(jiǎn)單的性能測(cè)試。為了應(yīng)對(duì)這些問(wèn)題键痛，我們需要將單點(diǎn)數(shù)據(jù)庫(kù)向集群轉(zhuǎn)變炫彩。

目前存在許多的數(shù)據(jù)庫(kù)集群方案，而這些方案中也沒有哪個(gè)好那個(gè)壞絮短，只有適合的才是好的江兢。本小節(jié)則介紹一下主流的方案之一：PXC集群方案，其架構(gòu)圖大致如下：

image.png

PXC集群最大的特點(diǎn)就是數(shù)據(jù)讀寫的強(qiáng)一致性丁频，在圖中的任意一個(gè)節(jié)點(diǎn)寫入數(shù)據(jù)杉允，其他的節(jié)點(diǎn)就一定能讀到這個(gè)數(shù)據(jù)。不會(huì)出現(xiàn)A節(jié)點(diǎn)成功寫入席里，而讀B節(jié)點(diǎn)時(shí)讀取不到數(shù)據(jù)叔磷。該特性使得PXC集群適合存儲(chǔ)高價(jià)值重要數(shù)據(jù)，因?yàn)轭愃朴谟唵谓贝拧㈠X有關(guān)的數(shù)據(jù)基本都有強(qiáng)一致性的要求

上圖只是PXC集群最基礎(chǔ)的架構(gòu)改基，所以還有優(yōu)化的余地。我們都知道m(xù)ysql的單表數(shù)據(jù)處理的性能極限在2千萬(wàn)左右咖为，當(dāng)數(shù)據(jù)達(dá)到這個(gè)量級(jí)時(shí)秕狰，mysql的處理性能就會(huì)很低下了塞琼。而上圖中每個(gè)PXC節(jié)點(diǎn)都會(huì)進(jìn)行數(shù)據(jù)的同步寨辩，所以當(dāng)每個(gè)節(jié)點(diǎn)的數(shù)據(jù)量級(jí)都達(dá)到2千萬(wàn)時(shí)瀑凝，整個(gè)集群的性能就會(huì)降低虽填。

這時(shí)就需要增加多一個(gè)集群，并且這兩個(gè)集群之間的數(shù)據(jù)是不進(jìn)行同步的我衬。為了讓不同的集群存儲(chǔ)不同的數(shù)據(jù)叹放，就得引入Mycat這種數(shù)據(jù)庫(kù)中間件將數(shù)據(jù)進(jìn)行切分，讓數(shù)據(jù)可以在不同的集群上進(jìn)行讀寫挠羔，分散存儲(chǔ)壓力许昨。在這個(gè)場(chǎng)景下，一個(gè)集群稱為一個(gè)數(shù)據(jù)分片褥赊。如圖：

image.png

PXC集群工作原理

我們知道數(shù)據(jù)庫(kù)數(shù)據(jù)的一致性和持久性是通過(guò)事務(wù)來(lái)保證的，而PXC集群的強(qiáng)一致性也是采用了事務(wù)莉恼，只不過(guò)這個(gè)事務(wù)是分布式事務(wù)拌喉。

客戶端在寫入數(shù)據(jù)完成后，同樣需要提交一個(gè)事務(wù)俐银，在事務(wù)內(nèi)節(jié)點(diǎn)之間會(huì)進(jìn)行數(shù)據(jù)的同步復(fù)制尿背。該事務(wù)會(huì)作用到集群內(nèi)的所有節(jié)點(diǎn)上，保證所有節(jié)點(diǎn)要么全寫入成功捶惜，要么全寫入失敗田藐。這里用一個(gè)時(shí)序圖表達(dá)一下大致流程：

image.png

搭建PXC集群需要注意的事項(xiàng)：

PXC集群中的節(jié)點(diǎn)并不是越多越好，節(jié)點(diǎn)多并不能提高性能吱七。相反汽久，節(jié)點(diǎn)多意味著同步數(shù)據(jù)所需的耗時(shí)就越多，反而會(huì)降低性能踊餐。通常來(lái)講景醇，一個(gè)PXC集群最好是不超過(guò)15個(gè)節(jié)點(diǎn)。若需要更多的節(jié)點(diǎn)時(shí)吝岭，應(yīng)當(dāng)搭建一個(gè)新的集群三痰，然后用中間件來(lái)做分片。
PXC集群的性能不取決于配置最好的那個(gè)節(jié)點(diǎn)窜管，而是取決于配置最差的那個(gè)節(jié)點(diǎn)散劫，這和電腦硬件是類似的。所以我們應(yīng)當(dāng)盡量保證PXC集群內(nèi)的節(jié)點(diǎn)配置都趨于一致幕帆，避免某個(gè)節(jié)點(diǎn)配置太差而拖慢了集群的整體性能获搏。

PXC簡(jiǎn)介

說(shuō)了那么多，我們還沒介紹PXC是個(gè)啥玩意呢蜓肆。PXC是Percona XtraDB Cluster的縮寫颜凯，PXC是基于mysql自帶的Galera集群技術(shù)谋币，將不同的mysql實(shí)例連接起來(lái)，實(shí)現(xiàn)的多主集群症概。在PXC集群中每個(gè)mysql節(jié)點(diǎn)都是可讀可寫的蕾额，也就是主從概念中的主節(jié)點(diǎn)，不存在只讀的節(jié)點(diǎn)彼城。

image.png

PXC可以集群任何mysql的衍生版本诅蝶，例如MariaDB和Percona Server。由于Percona Server的性能最接近于mysql企業(yè)版募壕，性能相對(duì)于標(biāo)準(zhǔn)版的mysql有顯著的提升调炬，并且對(duì)mysql基本兼容。所以在搭建PXC集群時(shí)舱馅，通常建議基于Percona Server進(jìn)行搭建缰泡。

Replication集群方案

PXC集群的數(shù)據(jù)強(qiáng)一致性是以犧牲性能為代價(jià)的，因?yàn)榭蛻舳诵枰却械墓?jié)點(diǎn)寫入數(shù)據(jù)代嗤。而與之相反的一種集群方案就是本小節(jié)要介紹的Replication集群棘钞。該方案不犧牲性能，但不具有數(shù)據(jù)強(qiáng)一致性干毅，正可謂魚和熊掌不可兼得宜猜。

image.png

所謂讀寫非強(qiáng)一致的意思就是在A節(jié)點(diǎn)成功寫入數(shù)據(jù)，并提交了事務(wù)硝逢。但在B節(jié)點(diǎn)上進(jìn)行讀取時(shí)姨拥，可能會(huì)讀取不到寫入的數(shù)據(jù)。

因?yàn)檫@里提交的事務(wù)只是該節(jié)點(diǎn)的本地事務(wù)渠鸽，只能保證數(shù)據(jù)成功寫入了該節(jié)點(diǎn)叫乌，而不保證數(shù)據(jù)成功寫入整個(gè)集群內(nèi)的節(jié)點(diǎn)。當(dāng)該節(jié)點(diǎn)與其他節(jié)點(diǎn)進(jìn)行數(shù)據(jù)同步時(shí)拱绑，可能會(huì)由于種種原因沒有成功同步數(shù)據(jù)综芥，從而導(dǎo)致在其他節(jié)點(diǎn)上讀不到該數(shù)據(jù)。

所以該集群方案就不適合保存高價(jià)值的數(shù)據(jù)猎拨，但對(duì)于非高價(jià)值的數(shù)據(jù)膀藐，又對(duì)讀寫性能要求高的，就適合采用該集群方案红省。例如额各，用戶行為日志、操作日志及商品描述等這類非重要的數(shù)據(jù)吧恃。

同樣的虾啦，上圖只是Replication集群最基礎(chǔ)的架構(gòu)，也需要在數(shù)據(jù)量達(dá)到一定規(guī)模時(shí)采用Mycat對(duì)數(shù)據(jù)進(jìn)行分片處理。如圖：

image.png

實(shí)際上傲醉，在大型的系統(tǒng)架構(gòu)中蝇闭，往往不是單獨(dú)采用某一種特定的集群方案，而是多種方案進(jìn)行結(jié)合硬毕。例如呻引，PXC集群和Replication集群就可以結(jié)合使用，讓PXC集群存儲(chǔ)高價(jià)值數(shù)據(jù)吐咳，Replication集群存儲(chǔ)低價(jià)值數(shù)據(jù)逻悠。然后采用Mycat等數(shù)據(jù)庫(kù)中間件來(lái)完成集群之間的數(shù)據(jù)分片及管理，如圖：

image.png

總結(jié)

PXC集群采用同步復(fù)制韭脊，事務(wù)在所有的集群節(jié)點(diǎn)要么同時(shí)提交童谒，要么不提交，能夠保證集群中的數(shù)據(jù)強(qiáng)一致性沪羔。但性能相對(duì)較低饥伊，客戶端需等待所有節(jié)點(diǎn)同步復(fù)制完成
Replication集群采用異步復(fù)制，無(wú)法保證數(shù)據(jù)的強(qiáng)一致性蔫饰。性能相對(duì)較高撵渡，客戶端只需要等待目標(biāo)節(jié)點(diǎn)的本地事務(wù)提交成功即可，而不需要等待所有節(jié)點(diǎn)成功復(fù)制完數(shù)據(jù)
PXC和Replication集群都只實(shí)現(xiàn)了數(shù)據(jù)的同步死嗦，沒有數(shù)據(jù)切分功能。當(dāng)數(shù)據(jù)量大時(shí)粒氧，需要引入Mycat等數(shù)據(jù)庫(kù)中間件來(lái)做數(shù)據(jù)的切分及管理
PXC和Replication集群方案并不排他越除，且各有優(yōu)劣，可以結(jié)合一起使用外盯，以達(dá)到取長(zhǎng)補(bǔ)短的效果摘盆。高價(jià)值數(shù)據(jù)存儲(chǔ)至PXC集群，低價(jià)值數(shù)據(jù)存儲(chǔ)至Replication集群

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末饱苟，一起剝皮案震驚了整個(gè)濱河市孩擂，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌箱熬，老刑警劉巖类垦，帶你破解...
沈念sama閱讀 211,348評(píng)論 6贊 491
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異城须，居然都是意外死亡蚤认，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,122評(píng)論 2贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門糕伐，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)砰琢，“玉大人，你說(shuō)我怎么就攤上這事∨闫” “怎么了训唱？”我有些...
開封第一講書人閱讀 156,936評(píng)論 0贊 347
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)挚冤。經(jīng)常有香客問(wèn)我况增，道長(zhǎng)，這世上最難降的妖魔是什么你辣？我笑而不...
開封第一講書人閱讀 56,427評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任巡通，我火速辦了婚禮，結(jié)果婚禮上舍哄，老公的妹妹穿的比我還像新娘宴凉。我一直安慰自己，他們只是感情好表悬，可當(dāng)我...
茶點(diǎn)故事閱讀 65,467評(píng)論 6贊 385
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布弥锄。她就那樣靜靜地躺著，像睡著了一般蟆沫。火紅的嫁衣襯著肌膚如雪籽暇。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,785評(píng)論 1贊 290
城市分裂傳說(shuō)
那天饭庞，我揣著相機(jī)與錄音戒悠，去河邊找鬼。笑死舟山，一個(gè)胖子當(dāng)著我的面吹牛绸狐，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播累盗，決...
沈念sama閱讀 38,931評(píng)論 3贊 406
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼寒矿，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了若债？” 一聲冷哼從身側(cè)響起符相，我...
開封第一講書人閱讀 37,696評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎蠢琳，沒想到半個(gè)月后啊终，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,141評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡傲须，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,483評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年孕索，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片躏碳。...
茶點(diǎn)故事閱讀 38,625評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡搞旭，死狀恐怖散怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情肄渗，我是刑警寧澤镇眷，帶...
沈念sama閱讀 34,291評(píng)論 4贊 329
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站翎嫡，受9級(jí)特大地震影響欠动，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜惑申，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,892評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一具伍、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧圈驼，春花似錦人芽、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,741評(píng)論 0贊 21
一樁弒父案萤厅，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至靴迫，卻和暖如春惕味，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背玉锌。一陣腳步聲響...
開封第一講書人閱讀 31,977評(píng)論 1贊 265
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工名挥，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人主守。一個(gè)月前我還...
沈念sama閱讀 46,324評(píng)論 2贊 360
代替公主和親
正文我出身青樓躺同，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親丸逸。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,492評(píng)論 2贊 348

淺談數(shù)據(jù)庫(kù)集群方案

單點(diǎn)數(shù)據(jù)庫(kù)

性能測(cè)試

PXC集群方案

PXC集群工作原理

PXC簡(jiǎn)介

Replication集群方案

總結(jié)

推薦閱讀更多精彩內(nèi)容