相信大家都有聽過,MyISAM 計算count值是非常快的局劲,甚至有很多文章說MyISAM count值的計算快于InnoDb。因為MyISAM會存儲count值奶赠。
的確是的鱼填,不過要注意的是,MyISAM存儲的是行數(shù)而不是列數(shù)【且是無條件下】毅戈,這個有什么區(qū)別呢苹丸。
看語句:
select count(*) from xxx;
select count(columnName) from xxx;
相對于這2個sql塑猖,對于MyISAM
和InnoDb
都是第一個相對較快,MyISAM 快的原因是存儲了總行數(shù)谈跛,
2個引擎索引列的總數(shù)時,要考慮一個重要的因素便是把該列為null
的排除掉塑陵,換言之感憾,總行數(shù)100,假如count某列時令花,設置該列可為空阻桅,正好有1行的該列沒有值,為null兼都,那么該列的count值就是100- count(colunName==null))
嫂沉。這就是創(chuàng)建表結(jié)構(gòu)時,把列基本都設置成not null
的原因之一了扮碧。
所以不管是MyISAM
和InnoDb
,在不要求極力求算某列count值趟章,或者可以保證該列為not null
時都可以直接計算count(*)
,MyISAM存儲了總行數(shù),而InnoDb不需要再次判斷該列是否為空的的問題了慎王。 so 小 count 大學問蚓土。
那么問題來了,假如說count的列帶有索引赖淤,且該列not null
蜀漆,對于InnoDb而言是不是count列就更快了呢。
實踐得出真實咱旱,來實驗下吧确丢。
explain SELECT count(*) from users;
explain SELECT count(name) from users;
這2個執(zhí)行計劃,其實執(zhí)行計劃都是一模一樣的吐限,(其實從簡單的執(zhí)行計劃上來看是看不出什么問題的鲜侥。)
+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
| 1 | SIMPLE | users | NULL | index | NULL | idx_name | 767 | NULL | 2892750 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
1 row in set, 1 warning (0.03 sec)
這是為什么呢?
簡單從執(zhí)行計劃上看是行不通的毯盈,因為InnoDB
在查詢count值時剃毒,一般會經(jīng)歷這幾個步驟【可以看下查詢語句的執(zhí)行過程:一條查詢SQL如何執(zhí)行都不知道,你和咸魚有什么區(qū)別】
下面將只討論InnoDB
引擎。
首先計算count(*)
值時搂赋,選擇最小索引數(shù)進行計算赘阀,一般都是最小二級索引【索引key最小的那棵樹】,二級索引保存的數(shù)據(jù)是主鍵脑奠,而主鍵一般不為空基公,所以count(*) 和 count(1) ,count(id)并沒有所謂的快慢區(qū)分宋欺,都表示返回滿足條件的結(jié)果集的總行數(shù)轰豆。
不過有必要在說下count的底層說明
1.count(1) :InnoDB 引擎遍歷整張表胰伍,但不取值。server 層對于返回的每一行酸休,放一個數(shù)字“1”進去骂租,判斷是不可能為空的,按行累加斑司。
InnoDB handles SELECT COUNT( * ) and SELECT COUNT(1) operations in the same way. There is no performance difference.
--來源MySQL文檔:https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count
----------------------華麗分割線-----------------
大意便是innodb以相同的方式處理count(*)和count(1),沒有性能差異渗饮。
2.count(*):返回獲取的行數(shù)的計數(shù),無論它們是否包含 NULL值宿刮。
在MySQL 5.7.18之前互站,InnoDB通過掃描聚集索引來處理 SELECT COUNT( * )語句。從MySQL 5.7.18開始僵缺, 除非有索引或優(yōu)化器提示指示優(yōu)化器使用其他索引胡桃,否則InnoDB通過遍歷最小的可用二級索引來處理SELECT COUNT(*)語句。如果不存在二級索引磕潮,則將掃描聚集索引翠胰。
----mysql 文檔:https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count
3.count(id):,InnoDB 引擎會遍歷整張表揉抵,把每一行的 id 值都取出來亡容,返回給 server 層。server 層拿到 id 后冤今,判斷是不可能為空的闺兢,就按行累加。不過count(id)相比于前2個還是稍微慢點的戏罢。但是程度是肉眼無法感知的屋谭。
4.count(columnName): 這個是最慢的,來看看計算這個值時龟糕,InnoDB都做了些什么吧桐磁。
第一種情況:在該字段定義為not null
情況下,一行行地從記錄里面讀出這個字段讲岁,判斷不能為 null我擂,按行累加;
第二種情況:允許為null
缓艳,那么在執(zhí)行時校摩,判斷到可能為null
,那么需要做的就是把該值取出來阶淘,判斷是否為null,不為null衙吩,進行累加。
看到了吧溪窒,如果不定義字段為not null
是會進行賦值判斷的坤塞,是個非常糟糕的情況冯勉。
所以在使用InnoDB
時,計算count值時優(yōu)先順序為:
5.7 版本:count(*) = count(1) > count(id) > count(columnName)
5.7以下版本:count(*) ≈ count(1) > count(id) > count(columnName)