mysql之count問題

相信大家都有聽過，MyISAM 計算count值是非常快的局劲，甚至有很多文章說MyISAM count值的計算快于InnoDb。因為MyISAM會存儲count值奶赠。
的確是的鱼填，不過要注意的是，MyISAM存儲的是行數(shù)而不是列數(shù)【且是無條件下】毅戈，這個有什么區(qū)別呢苹丸。
看語句：

select count(*)  from xxx;
select count(columnName) from xxx;

相對于這2個sql塑猖，對于MyISAM和InnoDb 都是第一個相對較快，MyISAM 快的原因是存儲了總行數(shù)谈跛，
2個引擎索引列的總數(shù)時，要考慮一個重要的因素便是把該列為null的排除掉塑陵，換言之感憾，總行數(shù)100，假如count某列時令花，設置該列可為空阻桅，正好有1行的該列沒有值，為null兼都，那么該列的count值就是100- count(colunName==null))嫂沉。這就是創(chuàng)建表結(jié)構(gòu)時，把列基本都設置成not null的原因之一了扮碧。

所以不管是MyISAM和InnoDb,在不要求極力求算某列count值趟章，或者可以保證該列為not null時都可以直接計算count(*),MyISAM存儲了總行數(shù)，而InnoDb不需要再次判斷該列是否為空的的問題了慎王。 so 小 count 大學問蚓土。

那么問題來了，假如說count的列帶有索引赖淤，且該列not null蜀漆，對于InnoDb而言是不是count列就更快了呢。
實踐得出真實咱旱，來實驗下吧确丢。

explain SELECT count(*) from users;
explain SELECT count(name) from users;

這2個執(zhí)行計劃，其實執(zhí)行計劃都是一模一樣的吐限，（其實從簡單的執(zhí)行計劃上來看是看不出什么問題的鲜侥。）

+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
| id | select_type | table | partitions | type  | possible_keys | key      | key_len | ref  | rows    | filtered | Extra       |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
|  1 | SIMPLE      | users | NULL       | index | NULL          | idx_name | 767     | NULL | 2892750 |   100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+---------+----------+-------------+
1 row in set, 1 warning (0.03 sec)

這是為什么呢？

簡單從執(zhí)行計劃上看是行不通的毯盈，因為InnoDB 在查詢count值時剃毒，一般會經(jīng)歷這幾個步驟【可以看下查詢語句的執(zhí)行過程：一條查詢SQL如何執(zhí)行都不知道,你和咸魚有什么區(qū)別】
下面將只討論InnoDB引擎。
首先計算count(*)值時搂赋，選擇最小索引數(shù)進行計算赘阀，一般都是最小二級索引【索引key最小的那棵樹】，二級索引保存的數(shù)據(jù)是主鍵脑奠，而主鍵一般不為空基公，所以count(*) 和 count(1) ，count(id)并沒有所謂的快慢區(qū)分宋欺，都表示返回滿足條件的結(jié)果集的總行數(shù)轰豆。
不過有必要在說下count的底層說明
1.count(1) :InnoDB 引擎遍歷整張表胰伍，但不取值。server 層對于返回的每一行酸休，放一個數(shù)字“1”進去骂租，判斷是不可能為空的，按行累加斑司。

InnoDB handles SELECT COUNT( * ) and SELECT COUNT(1) operations in the same way. There is no performance difference.
--來源MySQL文檔：https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count
----------------------華麗分割線-----------------
大意便是innodb以相同的方式處理count(*)和count(1),沒有性能差異渗饮。

2.count(*):返回獲取的行數(shù)的計數(shù)，無論它們是否包含 NULL值宿刮。

在MySQL 5.7.18之前互站，InnoDB通過掃描聚集索引來處理 SELECT COUNT( * )語句。從MySQL 5.7.18開始僵缺，除非有索引或優(yōu)化器提示指示優(yōu)化器使用其他索引胡桃，否則InnoDB通過遍歷最小的可用二級索引來處理SELECT COUNT(*)語句。如果不存在二級索引磕潮，則將掃描聚集索引翠胰。
----mysql 文檔：https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count

3.count(id):，InnoDB 引擎會遍歷整張表揉抵，把每一行的 id 值都取出來亡容，返回給 server 層。server 層拿到 id 后冤今，判斷是不可能為空的闺兢，就按行累加。不過count(id)相比于前2個還是稍微慢點的戏罢。但是程度是肉眼無法感知的屋谭。

4.count(columnName): 這個是最慢的，來看看計算這個值時龟糕，InnoDB都做了些什么吧桐磁。
第一種情況：在該字段定義為not null情況下，一行行地從記錄里面讀出這個字段讲岁，判斷不能為 null我擂，按行累加；
第二種情況：允許為null缓艳，那么在執(zhí)行時校摩，判斷到可能為null，那么需要做的就是把該值取出來阶淘，判斷是否為null,不為null衙吩，進行累加。
看到了吧溪窒，如果不定義字段為not null是會進行賦值判斷的坤塞，是個非常糟糕的情況冯勉。

所以在使用InnoDB時，計算count值時優(yōu)先順序為：
5.7 版本：count(*) = count(1) > count(id) > count(columnName)
5.7以下版本：count(*) ≈ count(1) > count(id) > count(columnName)