首先直接結(jié)論:
1. 如果對 group by 語句的結(jié)果沒有排序要求,要在語句后面加 order by null;
2.?盡量讓 group by 過程用上表的索引届搁,確認(rèn)方法是 explain 結(jié)果里沒有 Using
temporary 和 Using filesort;
3. 如果 group by 需要統(tǒng)計的數(shù)據(jù)量不大模燥,盡量只使用內(nèi)存臨時表;也可以通過適當(dāng)調(diào)大
tmp_table_size 參數(shù)缆镣,來避免用到磁盤臨時表搓茬;
4.?如果數(shù)據(jù)量實在太大犹赖,使用 SQL_BIG_RESULT 這個提示,來告訴優(yōu)化器直接使用排序
算法得到 group by 的結(jié)果卷仑。
group by 執(zhí)行流程:
select id%10 as m, count(*) as c from t1 group by m;?
上面sql語句的執(zhí)行流程如下:
1. 創(chuàng)建內(nèi)存臨時表峻村,表里有兩個字段 m 和 c,主鍵是 m锡凝;
2.?掃描表 t1 的索引 a粘昨,依次取出葉子節(jié)點上的 id 值,計算 id%10 的結(jié)果窜锯,記為 x张肾;
? ??如果臨時表中沒有主鍵為 x 的行,就插入一個記錄 (x,1);
? ??如果表中有主鍵為 x 的行锚扎,就將 x 這一行的 c 值加 1吞瞪;
3.?遍歷完成后,再根據(jù)字段 m 做排序驾孔,得到結(jié)果集返回給客戶端芍秆。(為什么有的個結(jié)論的目的)。
SQL 語句末尾增加 order by null翠勉,這樣就跳過了最后排序的階段妖啥,直接從臨時表中取數(shù)據(jù)返回。
參數(shù) tmp_table_size 就是控制這個內(nèi)存臨時表大小的对碌,默認(rèn)是 16M荆虱。
如果執(zhí)行中存放的數(shù)據(jù)超過內(nèi)存臨時表的上限,這個時候就會把內(nèi)存臨時表轉(zhuǎn)為磁盤臨時表。
group by 優(yōu)化方法 -- 索引
不論是使用內(nèi)存臨時表還是磁盤臨時表怀读,group by 邏輯都需要構(gòu)造一個帶唯
一索引的表酥郭,執(zhí)行代價都是比較高的。我們有什么優(yōu)化的方法呢愿吹?
group by field? ? //給field加索引
group by 優(yōu)化方法 -- 直接排序
在 group by 語句中加入 SQL_BIG_RESULT 這個提示(hint),就可以告訴優(yōu)化器:這個
語句涉及的數(shù)據(jù)量很大惜姐,請直接用磁盤臨時表犁跪。
MySQL 的優(yōu)化器一看,磁盤臨時表是 B+ 樹存儲歹袁,存儲效率不如數(shù)組來得高坷衍。所以,既
然你告訴我數(shù)據(jù)量很大条舔,那從磁盤空間考慮枫耳,還是直接用數(shù)組來存吧。
select SQL_BIG_RESULT id%100 as m, count(*) as c from t1 group by m;
這個語句的執(zhí)行沒有再使用臨時表孟抗,而是直接用了排序算法迁杨。
注意:union 跟 union all的一個性能區(qū)別是:union涉及到去重,所以凄硼,用到了臨時表铅协。