【原創(chuàng)】JOIN 詳述(中)

JOIN 的執(zhí)行流程
建表
create table test8 (id int(11) PRIMARY key,a int(11) not null, b int(11) not null,key a(`a`))

delimiter ;;
CREATE PROCEDURE idata()
BEGIN
    DECLARE i int;
    set i = 1;
    WHILE i < 1000 DO
        INSERT into test8 values(i,i,i);
        SET i = i + 1;
    END WHILE;
END;;
delimiter ;
CALL idata();

CREATE table test9 like test8;

INSERT into test9 (select * FROM test8 WHERE id <= 100)
Index Nested-Loop Join

對(duì)于如下 SQL 語(yǔ)句:

select * FROM test9 STRAIGHT_JOIN test8 on test9.a = test8.a;

NOTE:
STRAIGHT_JOIN 可以手動(dòng)指定驅(qū)動(dòng)表和被驅(qū)動(dòng)表赴邻,而不要經(jīng)過(guò)優(yōu)化器的判斷赏壹,有時(shí)候可以用來(lái)優(yōu)化 JOIN 查詢每界,但最好不要那么做制圈,因?yàn)楝F(xiàn)在的優(yōu)化器會(huì)做出合理的判斷剂府。上述 SQL 只是為了便于分析竖慧!

上述SQL的執(zhí)行計(jì)劃如下:


執(zhí)行計(jì)劃1.png

由于被驅(qū)動(dòng)表 test8 的字段 a 上有索引疲吸,join 過(guò)程用上了該索引,所以上述 SQL 的執(zhí)行流程如下:

  1. 從表 test9 取出一行 D
  2. 取出D行中的 a 的值到表 test8 中去查找
  3. 取出 test8 中滿足條件的行狮惜,和 R 組成一行奸远,作為結(jié)果集的一部分
  4. 重復(fù)執(zhí)行 步驟 1 到步驟 2 既棺,直到取到表 test9 的最后一行

上述流程稱之為 "Index Nested-Loop Join"讽挟,簡(jiǎn)稱 NIJ
在這個(gè)流程中懒叛,對(duì)表 test9 做全表掃描,需要掃描 100 行耽梅,對(duì)于每一行 D薛窥,根據(jù) a 字段去表 test8 查找,由于走的是樹(shù)的搜索過(guò)程眼姐,因此每次搜索都只掃描一行诅迷,也是總共掃描 100 行,所以整個(gè)流程一共掃描 200 行众旗。

假設(shè)驅(qū)動(dòng)表的行數(shù)是 N罢杉,被驅(qū)動(dòng)表的行數(shù) 是 M,那整個(gè)過(guò)程的復(fù)雜度近似是 N + 2 * N * log2M贡歧,顯然 N 的值對(duì)掃描行數(shù)更大些滩租,所以應(yīng)該用小表做驅(qū)動(dòng)表

Simple Nested-Loop Join

對(duì)于如下 SQL 語(yǔ)句

select * FROM test9 STRAIGHT_JOIN test8 on test9.b = test8.b;

NOTE:
b 字段沒(méi)有建立索引

如果繼續(xù)使用 上述的流程,那么這個(gè) SQL 得掃描 100 * 1000 = 10萬(wàn) 行數(shù)據(jù)利朵,如果兩個(gè)表的行數(shù)都比價(jià)大律想,那么這樣速度會(huì)很慢,好在 MySQL 沒(méi)有使用這個(gè)绍弟,而是使用了一個(gè)叫 "Block Nested-Loop Join"
的算法技即,簡(jiǎn)稱 BNL。

Block Nested-Loop Join

被驅(qū)動(dòng)表上沒(méi)有索引樟遣,則執(zhí)行的流程是:

  1. 把表 test9(驅(qū)動(dòng)表) 的數(shù)據(jù)讀入線程內(nèi)存 join_buffer 而叼,由于是 select * ,因此是把整個(gè)表 test9 放入內(nèi)存中
    2.掃描表 test8(被驅(qū)動(dòng)表) 豹悬,把 test8 中的每一行和 join_buffer 中的數(shù)據(jù)做對(duì)比葵陵,滿足 join 條件的作為結(jié)果集的一部分返回。

其執(zhí)行計(jì)劃如下:


image.png

雖然也是掃描了 100 * 1000 = 10 萬(wàn) 行屿衅,但是這十萬(wàn)次判斷是在內(nèi)存中進(jìn)行埃难,速度上會(huì)快很多,性能也會(huì)更好涤久。
在這種情況下涡尘,應(yīng)該選擇哪個(gè)表作為驅(qū)動(dòng)表?
假設(shè)小表的行數(shù)是 N响迂,大表的行數(shù)是 M考抄,那么在這個(gè)算法中:
1.兩個(gè)表都要做一次全表掃描,掃描行數(shù)是 M + N
2.在內(nèi)存中判斷次數(shù)是 M * N
因此不論誰(shuí)做驅(qū)動(dòng)表都是一樣的

如果 join_buffer 一次放不下驅(qū)動(dòng)表的數(shù)據(jù)蔗彤,則需要驅(qū)動(dòng)表的數(shù)據(jù)分段放進(jìn) join_buffer 川梅,則流程是:
1.取驅(qū)動(dòng)表的一部分?jǐn)?shù)據(jù)放入 join_buffer疯兼,直至 join_buffer 放不了
2.掃描被驅(qū)動(dòng)表的每一行數(shù)據(jù),跟 join_buffer 中的數(shù)據(jù)做對(duì)比贫途,滿足
join 條件的數(shù)據(jù)作為結(jié)果集的一部分返回
3.清空 join_buffer
4.繼續(xù)讀取驅(qū)動(dòng)表剩下的數(shù)據(jù)吧彪,重復(fù)步驟 1 到步驟 3,一直驅(qū)動(dòng)表的數(shù)據(jù)被掃描完
若驅(qū)動(dòng)表的行數(shù)是 N丢早,需要分 K 段才能掃描完姨裸,被驅(qū)動(dòng)表的行數(shù)是 M
則掃描的行數(shù)是 N + K * M (N 越大,K 越大) ==> N + λ * N * M( 0 < λ < 1 )
內(nèi)存判斷次數(shù)還是 N + M
由此可見(jiàn)在 M 怨酝,N 大小固定的情況下傀缩,N越小,其掃描行數(shù)越小农猬。

綜上所述赡艰,
1.如果是 NLJ 算法,應(yīng)該選擇小表做驅(qū)動(dòng)
2.如果是 BNL 算法

  • 如果 join_buffer 足夠大斤葱,是一樣的
  • 如果 join_buffer 不是足夠大慷垮,應(yīng)該選擇小表做驅(qū)動(dòng)表

所以不管如何,都應(yīng)該選擇小表作為驅(qū)動(dòng)表

[備注] 參考了 極客時(shí)間 的 MySQL實(shí)戰(zhàn)45講苦掘。鏈接如下:
https://time.geekbang.org/column/article/79700

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末换帜,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子鹤啡,更是在濱河造成了極大的恐慌惯驼,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件递瑰,死亡現(xiàn)場(chǎng)離奇詭異祟牲,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)抖部,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門说贝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人慎颗,你說(shuō)我怎么就攤上這事乡恕。” “怎么了俯萎?”我有些...
    開(kāi)封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵傲宜,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我夫啊,道長(zhǎng)函卒,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任撇眯,我火速辦了婚禮报嵌,結(jié)果婚禮上虱咧,老公的妹妹穿的比我還像新娘。我一直安慰自己锚国,他們只是感情好腕巡,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著跷叉,像睡著了一般逸雹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上云挟,一...
    開(kāi)封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音转质,去河邊找鬼园欣。 笑死,一個(gè)胖子當(dāng)著我的面吹牛休蟹,可吹牛的內(nèi)容都是我干的沸枯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼赂弓,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼绑榴!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起盈魁,我...
    開(kāi)封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤翔怎,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后杨耙,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體赤套,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年珊膜,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了容握。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡车柠,死狀恐怖剔氏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情竹祷,我是刑警寧澤谈跛,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站溶褪,受9級(jí)特大地震影響币旧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜猿妈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一吹菱、第九天 我趴在偏房一處隱蔽的房頂上張望巍虫。 院中可真熱鬧,春花似錦鳍刷、人聲如沸占遥。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)瓦胎。三九已至,卻和暖如春尤揣,著一層夾襖步出監(jiān)牢的瞬間搔啊,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工北戏, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留负芋,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓嗜愈,卻偏偏與公主長(zhǎng)得像旧蛾,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蠕嫁,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容