點(diǎn)關(guān)注柴淘,不迷路迫淹;持續(xù)更新Java架構(gòu)相關(guān)技術(shù)及資訊熱文!N稀敛熬!
概述
前段時(shí)間在跟其他公司DBA交流時(shí)談到了mysql跟PG之間在多表關(guān)聯(lián)查詢上的一些區(qū)別,相比之下mysql只有一種表連接類型:嵌套循環(huán)連接(nested-loop),不支持排序-合并連接(sort-merge join)與散列連接(hash join)第股,而PG是都支持的应民,而且mysql是往簡(jiǎn)單化方向去設(shè)計(jì)的,如果多個(gè)表關(guān)聯(lián)查詢(超過(guò)3張表)效率上是比不上PG的。
下面也對(duì)mysql多表關(guān)聯(lián)這個(gè)特性簡(jiǎn)單探討下~
MySQL多表關(guān)聯(lián)查詢效率高點(diǎn)還是多次單表查詢效率高瑞妇?
A,B兩個(gè)表數(shù)據(jù)規(guī)模十幾萬(wàn)稿静,數(shù)據(jù)規(guī)模都不大,單機(jī)MySQL夠用了辕狰,在單機(jī)的基礎(chǔ)上要關(guān)聯(lián)兩表的數(shù)據(jù)改备,先說(shuō)一個(gè)極端情況,A,B兩個(gè)表都沒(méi)有索引蔓倍,并且關(guān)聯(lián)是笛卡爾積悬钳,那關(guān)聯(lián)結(jié)果會(huì)爆炸式增長(zhǎng),可能到億級(jí)別偶翅,這個(gè)時(shí)候網(wǎng)絡(luò)IO成了瓶頸默勾,這個(gè)時(shí)候兩次十萬(wàn)行結(jié)果集的拉去可能遠(yuǎn)小于1次億級(jí)別的結(jié)果集的拉取,那么將關(guān)聯(lián)合并拉到service層做更快聚谁。
但實(shí)際業(yè)務(wù)中一般不會(huì)有這么蠢的行為母剥,一般關(guān)聯(lián)會(huì)有連接條件,并且連接條件上會(huì)有索引形导,一般是有一個(gè)結(jié)果集比較小环疼,拿到這個(gè)結(jié)果集去另一張表去關(guān)聯(lián)出其它信息,如果放到service層去做朵耕,最快的方式是炫隶,先查A表,得到一個(gè)小的結(jié)果集阎曹,一次rpc伪阶,再根據(jù)結(jié)果集,拼湊出B表的查詢條件处嫌,去B表查到一個(gè)結(jié)果集栅贴,再一次rpc,再把結(jié)果集拉回service層锰霜,再一次rpc筹误,然后service層做合并桐早,3次rpc癣缅,如果用數(shù)據(jù)庫(kù)的join,關(guān)聯(lián)結(jié)果拉回來(lái)哄酝,一次rpc友存,幫你省了兩次rpc,當(dāng)然數(shù)據(jù)庫(kù)上做關(guān)聯(lián)更快陶衅,對(duì)應(yīng)到數(shù)據(jù)庫(kù)就是一次blk nested loop join屡立,這是業(yè)務(wù)常用情況。
但是確實(shí)大多數(shù)業(yè)務(wù)都會(huì)考慮把這種合并操作放到service層搀军,一般是有以下幾方面考慮:
第一:?jiǎn)螜C(jī)數(shù)據(jù)庫(kù)計(jì)算資源很貴膨俐,數(shù)據(jù)庫(kù)同時(shí)要服務(wù)寫和讀勇皇,都需要消耗CPU,為了能讓數(shù)據(jù)庫(kù)的吞吐變得更高焚刺,而業(yè)務(wù)又不在乎那幾百微妙到毫秒級(jí)的延時(shí)差距敛摘,業(yè)務(wù)會(huì)把更多計(jì)算放到service層做,畢竟計(jì)算資源很好水平擴(kuò)展乳愉,數(shù)據(jù)庫(kù)很難啊兄淫,所以大多數(shù)業(yè)務(wù)會(huì)把純計(jì)算操作放到service層做,而將數(shù)據(jù)庫(kù)當(dāng)成一種帶事務(wù)能力的kv系統(tǒng)來(lái)使用蔓姚,這是一種重業(yè)務(wù)捕虽,輕DB的架構(gòu)思路
第二:很多復(fù)雜的業(yè)務(wù)可能會(huì)由于發(fā)展的歷史原因逼泣,一般不會(huì)只用一種數(shù)據(jù)庫(kù)揽祥,一般會(huì)在多個(gè)數(shù)據(jù)庫(kù)上加一層中間件,多個(gè)數(shù)據(jù)庫(kù)之間就沒(méi)辦法join了袜硫,自然業(yè)務(wù)會(huì)抽象出一個(gè)service層备闲,降低對(duì)數(shù)據(jù)庫(kù)的耦合挖滤。
第三:對(duì)于一些大型公司由于數(shù)據(jù)規(guī)模龐大,不得不對(duì)數(shù)據(jù)庫(kù)進(jìn)行分庫(kù)分表浅役,對(duì)于分庫(kù)分表的應(yīng)用斩松,使用join也受到了很多限制,除非業(yè)務(wù)能夠很好的根據(jù)sharding key明確要join的兩個(gè)表在同一個(gè)物理庫(kù)中觉既。而中間件一般對(duì)跨庫(kù)join都支持不好惧盹。
舉一個(gè)很常見(jiàn)的業(yè)務(wù)例子,在分庫(kù)分表中瞪讼,要同步更新兩個(gè)表钧椰,這兩個(gè)表位于不同的物理庫(kù)中,為了保證數(shù)據(jù)一致性符欠,一種做法是通過(guò)分布式事務(wù)中間件將兩個(gè)更新操作放到一個(gè)事務(wù)中嫡霞,但這樣的操作一般要加全局鎖,性能很捉急希柿,而有些業(yè)務(wù)能夠容忍短暫的數(shù)據(jù)不一致诊沪,怎么做?讓它們分別更新唄曾撤,但是會(huì)存在數(shù)據(jù)寫失敗的問(wèn)題端姚,那就起個(gè)定時(shí)任務(wù),掃描下A表有沒(méi)有失敗的行挤悉,然后看看B表是不是也沒(méi)寫成功渐裸,然后對(duì)這兩條關(guān)聯(lián)記錄做訂正,這個(gè)時(shí)候同樣沒(méi)法用join去實(shí)現(xiàn),只能將數(shù)據(jù)拉到service層應(yīng)用自己來(lái)合并了昏鹃。尚氛。。
到這里答案就很清楚了~
對(duì)關(guān)聯(lián)查詢進(jìn)行分解
很多高性能的應(yīng)用都會(huì)對(duì)關(guān)聯(lián)查詢進(jìn)行分解洞渤。
簡(jiǎn)單地怠褐,可以對(duì)每個(gè)表進(jìn)行一次單表查詢,然后將結(jié)果在應(yīng)用程序中進(jìn)行關(guān)聯(lián)您宪。例如奈懒,下面這個(gè)查詢:
select * from tag
join tag_post on tag_post.tag_id=tag.id
join post on tag_post.post_id=post.id
where tag.tag=’mysql’;
可以分解成下面這些查詢來(lái)代替:
Select * from tag where tag=’mysql’;
Select * from tag_post where tag_id=1234;
Select * from post where id in(123,456,567,9989,8909);
為什么會(huì)這樣做呢?原本一條查詢宪巨,這里卻變成了多條查詢磷杏,返回結(jié)果又是一模一樣。
事實(shí)上捏卓,用分解關(guān)聯(lián)查詢的方式重構(gòu)查詢具有如下優(yōu)勢(shì):
- 讓緩存的效率更高极祸。
許多應(yīng)用程序可以方便地緩存單表查詢對(duì)應(yīng)的結(jié)果對(duì)象。另外對(duì)于MySQL的查詢緩存來(lái)說(shuō)怠晴,如果關(guān)聯(lián)中的某個(gè)表發(fā)生了變化遥金,那么就無(wú)法使用查詢緩存了,而拆分后蒜田,如果某個(gè)表很少改變稿械,那么基于該表的查詢就可以重復(fù)利用查詢緩存結(jié)果了。 - 將查詢分解后冲粤,執(zhí)行單個(gè)查詢可以減少鎖的競(jìng)爭(zhēng)美莫。
- 在應(yīng)用層做關(guān)聯(lián),可以更容易對(duì)數(shù)據(jù)庫(kù)進(jìn)行拆分梯捕,更容易做到高性能和可擴(kuò)展厢呵。
- 查詢本身效率也可能會(huì)有所提升
- 可以減少冗余記錄的查詢。
- 更進(jìn)一步傀顾,這樣做相當(dāng)于在應(yīng)用中實(shí)現(xiàn)了哈希關(guān)聯(lián)襟铭,而不是使用MySQL的嵌套環(huán)關(guān)聯(lián),某些場(chǎng)景哈希關(guān)聯(lián)的效率更高很多短曾。
寫在最后
免費(fèi)Java高級(jí)資料需要自己領(lǐng)群:涵蓋了高可用,高并發(fā),高性能及分布式,JVM性能調(diào)優(yōu),MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個(gè)知識(shí)點(diǎn)的架構(gòu)資料。
傳送門:https://shimo.im/docs/f2ajdNJBQJItSobT/
比你優(yōu)秀的對(duì)手在學(xué)習(xí)错英,你的仇人在磨刀入撒,你的閨蜜在減肥隆豹,隔壁老王在練腰椭岩, 我們必須不斷學(xué)習(xí),否則我們將被學(xué)習(xí)者超越!
趁年輕判哥,使勁拼献雅,給未來(lái)的自己一個(gè)交代!