分布式數(shù)據(jù)庫(kù)架構(gòu)--分庫(kù)昼扛、分表寸齐、排序、分頁(yè)抄谐、分組渺鹦、實(shí)現(xiàn)

MySQL分庫(kù)分表總結(jié)：

單庫(kù)單表：

單庫(kù)單表是最常見(jiàn)的數(shù)據(jù)庫(kù)設(shè)計(jì)，例如蛹含，有一張用戶(user)表放在數(shù)據(jù)庫(kù)db中毅厚，所有的用戶都可以在db庫(kù)中的user表中查到。

單庫(kù)多表：

隨著用戶數(shù)量的增加浦箱，user表的數(shù)據(jù)量會(huì)越來(lái)越大吸耿，當(dāng)數(shù)據(jù)量達(dá)到一定程度的時(shí)候?qū)ser表的查詢會(huì)漸漸的變慢，從而影響整個(gè)DB的性能酷窥。如果使用

mysql, 還有一個(gè)更嚴(yán)重的問(wèn)題是咽安，當(dāng)需要添加一列的時(shí)候，mysql會(huì)鎖表蓬推，期間所有的讀寫(xiě)操作只能等待妆棒。可以通過(guò)某種方式將user進(jìn)行水平的切分，產(chǎn)生兩個(gè)表結(jié)構(gòu)完全一樣的user_0000,user_0001等表沸伏，user_0000 + user_0001 + …的數(shù)據(jù)剛好是一份完整的數(shù)據(jù)糕珊。

多庫(kù)多表：

隨著數(shù)據(jù)量增加也許單臺(tái)DB的存儲(chǔ)空間不夠，隨著查詢量的增加單臺(tái)數(shù)據(jù)庫(kù)服務(wù)器已經(jīng)沒(méi)辦法支撐毅糟。這個(gè)時(shí)候可以再對(duì)數(shù)據(jù)庫(kù)進(jìn)行水平區(qū)分放接。

分庫(kù)分表規(guī)則：

     設(shè)計(jì)表的時(shí)候需要確定此表按照什么樣的規(guī)則進(jìn)行分庫(kù)分表。例如留特，當(dāng)有新用戶時(shí)，程序得確定將此用戶信息添加到哪個(gè)表中玛瘸；同理蜕青，當(dāng)?shù)卿浀臅r(shí)候我們得通過(guò)用戶的賬號(hào)找到數(shù)據(jù)庫(kù)中對(duì)應(yīng)的記錄，所有的這些都需要按照某一規(guī)則進(jìn)行糊渊。

路由
通過(guò)分庫(kù)分表規(guī)則查找到對(duì)應(yīng)的表和庫(kù)的過(guò)程右核。如分庫(kù)分表的規(guī)則是user_id mod 4的方式，當(dāng)用戶新注冊(cè)了一個(gè)賬號(hào)渺绒，賬號(hào)id的123,我們可以通

過(guò)id mod 4的方式確定此賬號(hào)應(yīng)該保存到User_0003表中贺喝。當(dāng)用戶123登錄的時(shí)候菱鸥，我們通過(guò)123 mod 4后確定記錄在User_0003中。

分庫(kù)分表產(chǎn)生的問(wèn)題躏鱼，及注意事項(xiàng)

分庫(kù)分表維度的問(wèn)題

假如用戶購(gòu)買(mǎi)了商品,需要將交易記錄保存取來(lái)氮采，如果按照用戶的緯度分表，則每個(gè)用戶的交易記錄都保存在同一表中染苛，所以很快很方便的查找到某用

戶的購(gòu)買(mǎi)情況鹊漠，但是某商品被購(gòu)買(mǎi)的情況則很有可能分布在多張表中，查找起來(lái)比較麻煩茶行。反之躯概，按照商品維度分表，可以很方便的查找到此商品的購(gòu)

買(mǎi)情況畔师，但要查找到買(mǎi)人的交易記錄比較麻煩娶靡。

所以常見(jiàn)的解決方式有：

 a.通過(guò)掃表的方式解決，此方法基本不可能看锉，效率太低了姿锭。 

 b.記錄兩份數(shù)據(jù)，一份按照用戶緯度分表度陆，一份按照商品維度分表艾凯。 

 c.通過(guò)搜索引擎解決，但如果實(shí)時(shí)性要求很高懂傀，又得關(guān)系到實(shí)時(shí)搜索趾诗。

聯(lián)合查詢的問(wèn)題

聯(lián)合查詢基本不可能，因?yàn)殛P(guān)聯(lián)的表有可能不在同一數(shù)據(jù)庫(kù)中蹬蚁。

避免跨庫(kù)事務(wù)

避免在一個(gè)事務(wù)中修改db0中的表的時(shí)候同時(shí)修改db1中的表恃泪，一個(gè)是操作起來(lái)更復(fù)雜，效率也會(huì)有一定影響犀斋。

盡量把同一組數(shù)據(jù)放到同一DB服務(wù)器上

例如將賣(mài)家a的商品和交易信息都放到db0中贝乎，當(dāng)db1掛了的時(shí)候，賣(mài)家a相關(guān)的東西可以正常使用叽粹。也就是說(shuō)避免數(shù)據(jù)庫(kù)中的數(shù)據(jù)依賴另一數(shù)據(jù)庫(kù)中的數(shù)據(jù)览效。

一主多備

在實(shí)際的應(yīng)用中，絕大部分情況都是讀遠(yuǎn)大于寫(xiě)虫几。Mysql提供了讀寫(xiě)分離的機(jī)制锤灿，所有的寫(xiě)操作都必須對(duì)應(yīng)到Master，讀操作可以在Master和Slave機(jī)器上進(jìn)行辆脸，Slave與Master的結(jié)構(gòu)完全一樣但校，一個(gè)Master可以有多個(gè)Slave,甚至Slave下還可以掛Slave,通過(guò)此方式可以有效的提高DB集群的QPS.

所有的寫(xiě)操作都是先在Master上操作，然后同步更新到Slave上啡氢，所以從Master同步到Slave機(jī)器有一定的延遲状囱，當(dāng)系統(tǒng)很繁忙的時(shí)候术裸，延遲問(wèn)題會(huì)更加嚴(yán)重，Slave機(jī)器數(shù)量的增加也會(huì)使這個(gè)問(wèn)題更加嚴(yán)重亭枷。

此外袭艺，可以看出Master是集群的瓶頸，當(dāng)寫(xiě)操作過(guò)多奶栖，會(huì)嚴(yán)重影響到Master的穩(wěn)定性匹表，如果Master掛掉，整個(gè)集群都將不能正常工作宣鄙。

所以袍镀，1. 當(dāng)讀壓力很大的時(shí)候，可以考慮添加Slave機(jī)器的分式解決冻晤，但是當(dāng)Slave機(jī)器達(dá)到一定的數(shù)量就得考慮分庫(kù)了苇羡。 2. 當(dāng)寫(xiě)壓力很大的時(shí)候，就必須得進(jìn)行分庫(kù)操作鼻弧。

MySQL使用為什么要分庫(kù)分表
可以用說(shuō)用到MySQL的地方,只要數(shù)據(jù)量一大, 馬上就會(huì)遇到一個(gè)問(wèn)題,要分庫(kù)分表.
這里引用一個(gè)問(wèn)題為什么要分庫(kù)分表呢?MySQL處理不了大的表嗎?
其實(shí)是可以處理的大表的.我所經(jīng)歷的項(xiàng)目中單表物理上文件大小在80G多,單表記錄數(shù)在5億以上,而且這個(gè)表
屬于一個(gè)非常核用的表:朋友關(guān)系表.

但這種方式可以說(shuō)不是一個(gè)最佳方式. 因?yàn)槊媾R文件系統(tǒng)如Ext3文件系統(tǒng)對(duì)大于大文件處理上也有許多問(wèn)題.
這個(gè)層面可以用xfs文件系統(tǒng)進(jìn)行替換.但MySQL單表太大后有一個(gè)問(wèn)題是不好解決: 表結(jié)構(gòu)調(diào)整相關(guān)的操作基
本不在可能.所以大項(xiàng)在使用中都會(huì)面監(jiān)著分庫(kù)分表的應(yīng)用.

從Innodb本身來(lái)講數(shù)據(jù)文件的Btree上只有兩個(gè)鎖, 葉子節(jié)點(diǎn)鎖和子節(jié)點(diǎn)鎖,可以想而知道,當(dāng)發(fā)生頁(yè)拆分或是添加
新葉時(shí)都會(huì)造成表里不能寫(xiě)入數(shù)據(jù).
所以分庫(kù)分表還就是一個(gè)比較好的選擇了.

那么分庫(kù)分表多少合適呢?
經(jīng)測(cè)試在單表1000萬(wàn)條記錄一下,寫(xiě)入讀取性能是比較好的. 這樣在留點(diǎn)buffer,那么單表全是數(shù)據(jù)字型的保持在
800萬(wàn)條記錄以下, 有字符型的單表保持在500萬(wàn)以下.

如果按 100庫(kù)100表來(lái)規(guī)劃,如用戶業(yè)務(wù):
500萬(wàn)100100 = 50000000萬(wàn) = 5000億記錄.

心里有一個(gè)數(shù)了,按業(yè)務(wù)做規(guī)劃還是比較容易的.

分布式數(shù)據(jù)庫(kù)架構(gòu)--排序设江、分頁(yè)、分組攘轩、實(shí)現(xiàn)

最近研究分布式數(shù)據(jù)庫(kù)架構(gòu)叉存，發(fā)現(xiàn)排序、分組及分頁(yè)讓著實(shí)人有點(diǎn)頭疼《劝铮現(xiàn)把問(wèn)題及解決思路整理如下歼捏。

一、多分片（水平切分）返回結(jié)果合并（排序）

      1笨篷、Select + None Aggregate Function的有序記錄合并排序 

       解決思路：對(duì)各分片返回的有序記錄瞳秽，進(jìn)行排序去重合并。此處主要是編寫(xiě)排序去重合

      并算法率翅。

      2练俐、Select + None Aggregate Function的無(wú)序記錄合并

       解決思路：對(duì)各分片返回的無(wú)序記錄，進(jìn)行去重合并。

       優(yōu)點(diǎn)：實(shí)現(xiàn)比較簡(jiǎn)單。

       缺點(diǎn)：數(shù)據(jù)量越大，字段越多，去重處理就會(huì)越耗時(shí)剧辐。

      3、Select + Aggregate Function的記錄合并（排序）

      Oracle常用聚合函數(shù)：Count、Max、Min、Avg连霉、Sum榴芳。

      AF：Max嗡靡、Min

      思路：通過(guò)算法對(duì)各分片返回結(jié)果再求max、min值窟感。

      AF：Avg讨彼、Sum、Count

      思路：分片間無(wú)重復(fù)記錄或字段時(shí)柿祈，通過(guò)算法對(duì)各分片返回結(jié)果再求avg哈误、sum、count值躏嚎。分片間有重復(fù)記錄或字段時(shí)蜜自，先對(duì)各分片記錄去重合并，再通過(guò)算法求avg卢佣、sum重荠、count值。

      比如：

      select count(*) from user

      select count(deptno) from user;

      select count(distinct deptno) from user;

二虚茶、多分片（水平切分）返回結(jié)果分頁(yè)

     解決思路：合并各分片返回結(jié)果戈鲁，邏輯分頁(yè)。

    優(yōu)點(diǎn)：  實(shí)現(xiàn)簡(jiǎn)單嘹叫。

    缺點(diǎn)：  數(shù)據(jù)量越大婆殿，緩存壓力就越大。

                 分片數(shù)據(jù)量越大罩扇，查詢也會(huì)越慢婆芦。

三、多分片（水平切分）查詢有分組語(yǔ)法的合并

     1暮蹂、Group By Having + None Aggregate Function時(shí)

     Select + None Aggregate Function

     比如：select job user group by job;

    思路：直接去重（排序）合并寞缝。

    Select + Aggregate Function

     比如：select max(sal),job user group by job;

     思路：同Select + Aggregate Function的記錄合并（排序）。

     2仰泻、Group By Having + Aggregate Function時(shí)

     解決思路：去掉having AF條件查詢各分片荆陆，然后把數(shù)據(jù)放到一張表里。再用group by having 聚合函數(shù)查詢集侯。

四被啼、分布式數(shù)據(jù)庫(kù)架構(gòu)--排序分組分頁(yè)參考解決方案

     解決方案1：Hadoop + Hive。

     思路：使用Hadoop HDFS來(lái)存儲(chǔ)數(shù)據(jù)棠枉，通過(guò)Hdoop MapReduce完成數(shù)據(jù)計(jì)算浓体，通過(guò)Hive HQL語(yǔ)言使用部分與RDBBS一樣的表格查詢特性和分布式存儲(chǔ)計(jì)算特性。

     優(yōu)點(diǎn)： 可以解決問(wèn)題

                   具有并發(fā)處理能力

                   可以離線處理

     缺點(diǎn)：  實(shí)時(shí)性不能保證

                   網(wǎng)絡(luò)延遲會(huì)增加

                   異常捕獲難度增加

                   Web應(yīng)用起來(lái)比較復(fù)雜

      解決方案2：總庫(kù)集中查詢辈讶。

      優(yōu)點(diǎn)： 可以解決問(wèn)題        

                   實(shí)現(xiàn)簡(jiǎn)單

      缺點(diǎn)： 總庫(kù)數(shù)據(jù)不能太大

                    并發(fā)壓力大

五命浴、小結(jié)

     對(duì) 于分布式數(shù)據(jù)庫(kù)架構(gòu)來(lái)說(shuō)，排序、分頁(yè)生闲、分組一直就是一個(gè)比較復(fù)雜的問(wèn)題媳溺。避免此問(wèn)題需要好好地設(shè)計(jì)分庫(kù)、分表策略碍讯。同時(shí)根據(jù)特定的場(chǎng)景來(lái)解決問(wèn)題悬蔽。也可以 充分利用[海量數(shù)據(jù)](https://www.baidu.com/s?wd=%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE&tn=24004469_oem_dg&rsv_dl=gh_pl_sl_csd)存儲(chǔ)（Hadoop-HDFS|Hive|HBse）、搜索引擎（Lucene|Solr）及分布式計(jì)算（MapReduce）等技術(shù)來(lái) 解決問(wèn)題捉兴。

別外蝎困，也可以用NoSQL技術(shù)替代關(guān)系性數(shù)據(jù)庫(kù)來(lái)解決問(wèn)題，比如MogonDB\redis倍啥。

原文出處：https://blog.csdn.net/carechere/article/details/51211236

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末禾乘，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子逗栽，更是在濱河造成了極大的恐慌盖袭，老刑警劉巖，帶你破解...
沈念sama閱讀 221,635評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件彼宠，死亡現(xiàn)場(chǎng)離奇詭異鳄虱，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)凭峡，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,543評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)拙已，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人摧冀，你說(shuō)我怎么就攤上這事倍踪。” “怎么了索昂？”我有些...
開(kāi)封第一講書(shū)人閱讀 168,083評(píng)論 0贊 360
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵建车，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我椒惨，道長(zhǎng)缤至，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 59,640評(píng)論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任康谆，我火速辦了婚禮领斥，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘沃暗。我一直安慰自己月洛，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,640評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布孽锥。她就那樣靜靜地躺著嚼黔，像睡著了一般细层。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上唬涧，一...
開(kāi)封第一講書(shū)人閱讀 52,262評(píng)論 1贊 308
城市分裂傳說(shuō)
那天今艺，我揣著相機(jī)與錄音，去河邊找鬼爵卒。笑死，一個(gè)胖子當(dāng)著我的面吹牛撵彻，可吹牛的內(nèi)容都是我干的钓株。我是一名探鬼主播，決...
沈念sama閱讀 40,833評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼陌僵，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼轴合！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起碗短，我...
開(kāi)封第一講書(shū)人閱讀 39,736評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤受葛，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后偎谁，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體总滩，經(jīng)...
沈念sama閱讀 46,280評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,369評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年巡雨，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了闰渔。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,503評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡铐望，死狀恐怖冈涧，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情正蛙，我是刑警寧澤督弓，帶...
沈念sama閱讀 36,185評(píng)論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站乒验，受9級(jí)特大地震影響愚隧，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜徊件，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,870評(píng)論 3贊 333
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一奸攻、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧虱痕，春花似錦睹耐、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,340評(píng)論 0贊 24
一樁弒父案硝训，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春窖梁，著一層夾襖步出監(jiān)牢的瞬間赘风，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,460評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工纵刘，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留邀窃，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,909評(píng)論 3贊 376
代替公主和親
正文我出身青樓假哎，卻偏偏與公主長(zhǎng)得像瞬捕，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子舵抹，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,512評(píng)論 2贊 359

分布式數(shù)據(jù)庫(kù)架構(gòu)--分庫(kù)圈暗、分表、排序裕膀、分頁(yè)员串、分組、實(shí)現(xiàn)

分布式數(shù)據(jù)庫(kù)架構(gòu)--分庫(kù)昼扛、分表寸齐、排序、分頁(yè)抄谐、分組渺鹦、實(shí)現(xiàn)

推薦閱讀更多精彩內(nèi)容