大家好福稳,我是程序員啊粥涎拉。
相信在大家的工作中,有很多的功能都需要用到 count(*) 來(lái)統(tǒng)計(jì)表中的數(shù)據(jù)行數(shù)。同時(shí)曼库,對(duì)于一些大數(shù)據(jù)的表区岗,用 count 都是瑟瑟發(fā)抖略板,往往會(huì)結(jié)合緩存等進(jìn)行處理毁枯。
那么,我們今天就來(lái)分析一下叮称,在 InnoDB 中种玛,關(guān)于 count 的一些處理措施和優(yōu)化。
常見(jiàn)的 count 使用方式有三種
- count(*)
- count(主鍵 Id)/count(某個(gè)字段)
- count(1)
首先 count(*)瓤檐、count(主鍵 Id)/count(某個(gè)字段) 和 count(1) 都表示返回滿(mǎn)足條件的結(jié)果集的總行數(shù)赂韵。
他們的差異在于:count(字段)表示返回滿(mǎn)足條件的數(shù)據(jù)行里面,參數(shù)“字段”不為 NULL 的總條數(shù)挠蛉,而 count(1) 會(huì)統(tǒng)計(jì)表中的所有的記錄數(shù)祭示,包含字段為 NULL 的記錄,但它是用 1 代替了所有列谴古,不在關(guān)注表中具體列的情況质涛,count(*) 包括了所有的列,相當(dāng)于行數(shù)掰担,在統(tǒng)計(jì)結(jié)果的時(shí)候汇陆,它同樣不會(huì)忽略為 NULL 的值。
接下來(lái)带饱,我們就一個(gè)個(gè)地來(lái)看看毡代。
對(duì)于 count(主鍵 id) 來(lái)說(shuō),InnoDB 引擎會(huì)遍歷整張表勺疼,把每一行的 id 值都取出來(lái)教寂,返回給 server 層。server 層拿到 id 后执庐,判斷是不可能為空的孝宗,就按行累加。
對(duì)于 count(1) 來(lái)說(shuō)耕肩,InnoDB 引擎遍歷整張表因妇,但不取值。server 層對(duì)于返回的每一行猿诸,放一個(gè)數(shù)字“1”進(jìn)去婚被,判斷是不可能為空的,按行累加梳虽。
單看這兩個(gè)用法的差別的話(huà)址芯,相信你能對(duì)比出來(lái),count(1) 執(zhí)行得要比 count(主鍵 id) 快。因?yàn)閺囊娣祷?id 會(huì)涉及到解析數(shù)據(jù)行谷炸,以及拷貝字段值的操作北专,少一步操作就能少一些時(shí)間。
同時(shí)對(duì)于 count(字段) 來(lái)說(shuō):如果這個(gè)“字段”是定義為 Not Null 的話(huà)旬陡,一行行地從記錄里面讀出這個(gè)字段拓颓,判斷發(fā)現(xiàn)這個(gè)字段不能為 Null,那么直接按行累加描孟;但是如果這個(gè)“字段”定義允許為 Null 的話(huà)驶睦,那么執(zhí)行的時(shí)候,還要把具體的字段值取出來(lái)再判斷一下匿醒,不是 Null 才能進(jìn)行累加场航。
但是 count(*) 是例外,MySQL 專(zhuān)門(mén)對(duì)其做出了優(yōu)化廉羔,MySQL 每發(fā)布一個(gè)新版本溉痢,都會(huì)放出相應(yīng)的 Release Notes,我們注意到 5.7.2 版本的發(fā)布說(shuō)明中提到:
InnoDB: SELECT COUNT() FROM t statements now invoke a single handler call to the storage engine to scan the clustered index and return the row count to the Optimizer. Previously, a row count was typically performed by traversing a smaller secondary index and invoking a handler call for each record. A single handler call to the storage engine to count rows in the clustered index generally improves SELECT COUNT() FROM t performance. However, in the case of a large clustered index and a significantly smaller secondary index, performance degradation is possible compared to performance using the previous, non-optimized implementation. For more information, see Limits on InnoDB Tables.
簡(jiǎn)單地說(shuō)就是:COUNT(*)會(huì)選擇聚集索引憋他,進(jìn)行一次內(nèi)部 handler 函數(shù)調(diào)用孩饼,即可快速獲得該表行數(shù)
所以,它也不存在需要取值判斷是否為 Null 的計(jì)算操作举瑰,可以說(shuō)效率有很大的提高捣辆。
所以結(jié)論是:按照效率排序的話(huà),count(字段)<count(主鍵 id)<count(1)≈count()此迅,所以我建議你汽畴,盡量使用 count()。
而不是受我們慣性思維的影響耸序,覺(jué)得 count(*) 可能和 select() 一樣忍些,效率會(huì)很低,反之坎怪,這是效率最高的罢坝。
當(dāng)然,你如果實(shí)際中遇到了大數(shù)據(jù)量的表搅窿,可能把具體的行數(shù)緩存下來(lái)嘁酿,或者專(zhuān)門(mén)建立一張表來(lái)存儲(chǔ)這個(gè) count() 值,而不是每次都去表里掃描一次男应。
好了闹司,今天的內(nèi)容到此就結(jié)束了,關(guān)于 count() 的用法沐飘,你用對(duì)了嘛游桩?
評(píng)論區(qū)留言我們一起討論哇牲迫!