【原創(chuàng)】JOIN 詳述（中）

JOIN 的執(zhí)行流程

建表

create table test8 (id int(11) PRIMARY key,a int(11) not null, b int(11) not null,key a(`a`))

delimiter ;;
CREATE PROCEDURE idata()
BEGIN
    DECLARE i int;
    set i = 1;
    WHILE i < 1000 DO
        INSERT into test8 values(i,i,i);
        SET i = i + 1;
    END WHILE;
END;;
delimiter ;
CALL idata();

CREATE table test9 like test8;

INSERT into test9 (select * FROM test8 WHERE id <= 100)

Index Nested-Loop Join

對(duì)于如下 SQL 語(yǔ)句:

select * FROM test9 STRAIGHT_JOIN test8 on test9.a = test8.a;

NOTE:
STRAIGHT_JOIN 可以手動(dòng)指定驅(qū)動(dòng)表和被驅(qū)動(dòng)表赴邻，而不要經(jīng)過(guò)優(yōu)化器的判斷赏壹，有時(shí)候可以用來(lái)優(yōu)化 JOIN 查詢每界，但最好不要那么做制圈，因?yàn)楝F(xiàn)在的優(yōu)化器會(huì)做出合理的判斷剂府。上述 SQL 只是為了便于分析竖慧！

上述SQL的執(zhí)行計(jì)劃如下：

執(zhí)行計(jì)劃1.png

由于被驅(qū)動(dòng)表 test8 的字段 a 上有索引疲吸，join 過(guò)程用上了該索引，所以上述 SQL 的執(zhí)行流程如下：

從表 test9 取出一行 D
取出D行中的 a 的值到表 test8 中去查找
取出 test8 中滿足條件的行狮惜，和 R 組成一行奸远，作為結(jié)果集的一部分
重復(fù)執(zhí)行步驟 1 到步驟 2 既棺，直到取到表 test9 的最后一行

上述流程稱之為 "Index Nested-Loop Join"讽挟，簡(jiǎn)稱 NIJ
在這個(gè)流程中懒叛，對(duì)表 test9 做全表掃描，需要掃描 100 行耽梅，對(duì)于每一行 D薛窥，根據(jù) a 字段去表 test8 查找，由于走的是樹(shù)的搜索過(guò)程眼姐，因此每次搜索都只掃描一行诅迷，也是總共掃描 100 行，所以整個(gè)流程一共掃描 200 行众旗。

假設(shè)驅(qū)動(dòng)表的行數(shù)是 N罢杉，被驅(qū)動(dòng)表的行數(shù) 是 M，那整個(gè)過(guò)程的復(fù)雜度近似是 N + 2 * N * log₂M贡歧，顯然 N 的值對(duì)掃描行數(shù)更大些滩租，所以應(yīng)該用小表做驅(qū)動(dòng)表

Simple Nested-Loop Join

對(duì)于如下 SQL 語(yǔ)句

select * FROM test9 STRAIGHT_JOIN test8 on test9.b = test8.b;

NOTE：
b 字段沒(méi)有建立索引

如果繼續(xù)使用上述的流程，那么這個(gè) SQL 得掃描 100 * 1000 = 10萬(wàn) 行數(shù)據(jù)利朵，如果兩個(gè)表的行數(shù)都比價(jià)大律想，那么這樣速度會(huì)很慢，好在 MySQL 沒(méi)有使用這個(gè)绍弟，而是使用了一個(gè)叫 "Block Nested-Loop Join"
的算法技即，簡(jiǎn)稱 BNL。

Block Nested-Loop Join

被驅(qū)動(dòng)表上沒(méi)有索引樟遣，則執(zhí)行的流程是：

把表 test9(驅(qū)動(dòng)表) 的數(shù)據(jù)讀入線程內(nèi)存 join_buffer 而叼，由于是 select * ，因此是把整個(gè)表 test9 放入內(nèi)存中
2.掃描表 test8(被驅(qū)動(dòng)表) 豹悬，把 test8 中的每一行和 join_buffer 中的數(shù)據(jù)做對(duì)比葵陵，滿足 join 條件的作為結(jié)果集的一部分返回。

其執(zhí)行計(jì)劃如下：

image.png

雖然也是掃描了 100 * 1000 = 10 萬(wàn) 行屿衅，但是這十萬(wàn)次判斷是在內(nèi)存中進(jìn)行埃难，速度上會(huì)快很多，性能也會(huì)更好涤久。
在這種情況下涡尘，應(yīng)該選擇哪個(gè)表作為驅(qū)動(dòng)表？
假設(shè)小表的行數(shù)是 N响迂，大表的行數(shù)是 M考抄，那么在這個(gè)算法中：
1.兩個(gè)表都要做一次全表掃描，掃描行數(shù)是 M + N
2.在內(nèi)存中判斷次數(shù)是 M * N
因此不論誰(shuí)做驅(qū)動(dòng)表都是一樣的

如果 join_buffer 一次放不下驅(qū)動(dòng)表的數(shù)據(jù)蔗彤，則需要驅(qū)動(dòng)表的數(shù)據(jù)分段放進(jìn) join_buffer 川梅，則流程是：
1.取驅(qū)動(dòng)表的一部分?jǐn)?shù)據(jù)放入 join_buffer疯兼，直至 join_buffer 放不了
2.掃描被驅(qū)動(dòng)表的每一行數(shù)據(jù)，跟 join_buffer 中的數(shù)據(jù)做對(duì)比贫途，滿足
join 條件的數(shù)據(jù)作為結(jié)果集的一部分返回
3.清空 join_buffer
4.繼續(xù)讀取驅(qū)動(dòng)表剩下的數(shù)據(jù)吧彪，重復(fù)步驟 1 到步驟 3，一直驅(qū)動(dòng)表的數(shù)據(jù)被掃描完
若驅(qū)動(dòng)表的行數(shù)是 N丢早，需要分 K 段才能掃描完姨裸，被驅(qū)動(dòng)表的行數(shù)是 M
則掃描的行數(shù)是 N + K * M （N 越大，K 越大） ==> N + λ * N * M( 0 < λ < 1 )
內(nèi)存判斷次數(shù)還是 N + M
由此可見(jiàn)在 M 怨酝，N 大小固定的情況下傀缩，N越小，其掃描行數(shù)越小农猬。

綜上所述赡艰，
1.如果是 NLJ 算法，應(yīng)該選擇小表做驅(qū)動(dòng)
2.如果是 BNL 算法

如果 join_buffer 足夠大斤葱，是一樣的
如果 join_buffer 不是足夠大慷垮，應(yīng)該選擇小表做驅(qū)動(dòng)表

所以不管如何，都應(yīng)該選擇小表作為驅(qū)動(dòng)表

[備注] 參考了極客時(shí)間的 MySQL實(shí)戰(zhàn)45講苦掘。鏈接如下：
https://time.geekbang.org/column/article/79700

最后編輯于：2019.03.04 22:30:04

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末换帜，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子鹤啡，更是在濱河造成了極大的恐慌惯驼，老刑警劉巖，帶你破解...
沈念sama閱讀 218,682評(píng)論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件递瑰，死亡現(xiàn)場(chǎng)離奇詭異祟牲，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)抖部，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,277評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門说贝，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人慎颗，你說(shuō)我怎么就攤上這事乡恕。” “怎么了俯萎？”我有些...
開(kāi)封第一講書人閱讀 165,083評(píng)論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵傲宜，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我夫啊，道長(zhǎng)函卒，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書人閱讀 58,763評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任撇眯，我火速辦了婚禮报嵌，結(jié)果婚禮上虱咧，老公的妹妹穿的比我還像新娘。我一直安慰自己锚国，他們只是感情好腕巡，可當(dāng)我...
茶點(diǎn)故事閱讀 67,785評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著跷叉，像睡著了一般逸雹。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上云挟，一...
開(kāi)封第一講書人閱讀 51,624評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音转质，去河邊找鬼园欣。笑死，一個(gè)胖子當(dāng)著我的面吹牛休蟹，可吹牛的內(nèi)容都是我干的沸枯。我是一名探鬼主播，決...
沈念sama閱讀 40,358評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼赂弓，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼绑榴！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起盈魁，我...
開(kāi)封第一講書人閱讀 39,261評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤翔怎，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后杨耙，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體赤套，經(jīng)...
沈念sama閱讀 45,722評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,900評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年珊膜，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了容握。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,030評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡车柠，死狀恐怖剔氏，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情竹祷，我是刑警寧澤谈跛，帶...
沈念sama閱讀 35,737評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站溶褪，受9級(jí)特大地震影響币旧，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜猿妈，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,360評(píng)論 3贊 330
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一吹菱、第九天我趴在偏房一處隱蔽的房頂上張望巍虫。院中可真熱鬧，春花似錦鳍刷、人聲如沸占遥。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 31,941評(píng)論 0贊 22
一樁弒父案输瓜，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)瓦胎。三九已至，卻和暖如春尤揣，著一層夾襖步出監(jiān)牢的瞬間搔啊，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書人閱讀 33,057評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工北戏，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留负芋，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,237評(píng)論 3贊 371
代替公主和親
正文我出身青樓嗜愈，卻偏偏與公主長(zhǎng)得像旧蛾，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子蠕嫁，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,976評(píng)論 2贊 355

【原創(chuàng)】JOIN 詳述（中）

JOIN 的執(zhí)行流程

建表

Index Nested-Loop Join

Simple Nested-Loop Join

Block Nested-Loop Join

推薦閱讀更多精彩內(nèi)容