在數(shù)據(jù)庫的增刪改查操作中,使用最頻繁的就是查詢操作冒版。
而在所有查詢操作中隘马,統(tǒng)計數(shù)量操作更是經(jīng)常被用到。
關(guān)于數(shù)據(jù)庫中行數(shù)統(tǒng)計扫步,無論是MySQL還是Oracle亦或者是SqlServer魔策,都有一個函數(shù)可以使用,那就是COUNT锌妻。
而對于COUNT代乃,有幾個問題很值得去思考:
1、COUNT有幾種用法仿粹?
2、COUNT(字段名)和COUNT()的查詢結(jié)果有什么不同原茅?
3吭历、COUNT(1)和COUNT()之間有什么不同?
4擂橘、COUNT(1)和COUNT()之間的效率哪個更高晌区?
5、為什么《阿里巴巴Java開發(fā)手冊》建議使用COUNT()
6通贞、MySQL的MyISAM引擎對COUNT()做了哪些優(yōu)化朗若?
7、MySQL的InnoDB引擎對COUNT()做了哪些優(yōu)化昌罩?
8哭懈、上面提到的MySQL對COUNT()做的優(yōu)化,有一個關(guān)鍵的前提是什么茎用?
9遣总、SELECT COUNT() 的時候,加不加where條件有差別嗎轨功?
10旭斥、COUNT()、COUNT(1)和COUNT(字段名)的執(zhí)行過程是怎樣的古涧?
如果以上10道題垂券,全部準確無誤的回答的話,那說明你真的很了解COUNT函數(shù)了羡滑,如果有哪些知識點是不了解的菇爪,那么本文正好可以重新幫你認識一下Count算芯,也為數(shù)據(jù)庫優(yōu)化做一些思考。
認識COUNT
關(guān)于COUNT函數(shù)的介紹:
1娄帖、COUNT(expr) 也祠,返回SELECT語句檢索的行中expr的值不為NULL的數(shù)量。結(jié)果是一個BIGINT值近速。
2诈嘿、如果查詢結(jié)果沒有命中任何記錄,則返回0
3削葱、但是奖亚,值得注意的是,COUNT() 的統(tǒng)計結(jié)果中析砸,會包含值為NULL的行數(shù)昔字。
例:
create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)
使用語句count(),count(id),count(id2)查詢結(jié)果如下:
select count(),count(id),count(id2)
from #bla
results 7 3 2
除了COUNT(id)和COUNT()以外,還可以使用COUNT(常量)(如COUNT(1))來統(tǒng)計行數(shù)首繁,那么這三條SQL語句有什么區(qū)別呢作郭?
到底哪種效率更高呢?
為什么《阿里巴巴Java開發(fā)手冊》中強制要求不讓使用 COUNT(列名)或 COUNT(常量)來替代COUNT()呢弦疮?
COUNT(列名)夹攒、COUNT(常量)和COUNT()之間的區(qū)別
前面我們提到過COUNT(expr)用于做行數(shù)統(tǒng)計,統(tǒng)計的是expr不為NULL的行數(shù)胁塞,那么COUNT(列名)咏尝、 COUNT(常量) 和 COUNT()這三種語法中,expr分別是列名啸罢、 常量 和 编检。
那么列名、 常量 和 這三個條件中扰才,常量是一個固定值允懂,肯定不為NULL。
可以理解為查詢整行训桶,所以肯定也不為NULL累驮,那么就只有列名的查詢結(jié)果有可能是NULL了。
所以舵揭, COUNT(常量) 和 COUNT()表示的是直接查詢符合條件的數(shù)據(jù)庫表的行數(shù)谤专。
而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數(shù)。
除了查詢得到結(jié)果集有區(qū)別之外午绳,COUNT()相比COUNT(常量) 和 COUNT(列名)來講置侍,COUNT()是SQL92定義的標準統(tǒng)計行數(shù)的語法,因為他是標準語法,所以MySQL數(shù)據(jù)庫對他進行過很多優(yōu)化蜡坊。
SQL92杠输,是數(shù)據(jù)庫的一個ANSI/ISO標準。
它定義了一種語言(SQL)以及數(shù)據(jù)庫的行為(事務(wù)秕衙、隔離級別等)蠢甲。
COUNT()的優(yōu)化
前面提到了COUNT()是SQL92定義的標準統(tǒng)計行數(shù)的語法,所以MySQL數(shù)據(jù)庫對他進行過很多優(yōu)化据忘。
那么鹦牛,具體都做過哪些事情呢?
這里的介紹要區(qū)分不同的執(zhí)行引擎勇吊。
MySQL中比較常用的執(zhí)行引擎就是InnoDB和MyISAM曼追。MyISAM和InnoDB有很多區(qū)別,其中有一個關(guān)鍵的區(qū)別和我們接下來要介紹的COUNT()有關(guān)汉规,那就是MyISAM不支持事務(wù)礼殊,MyISAM中的鎖是表級鎖;
而InnoDB支持事務(wù)针史,并且支持行級鎖晶伦。
因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串行進行啄枕,所以坝辫,MyISAM做了一個簡單的優(yōu)化,那就是它可以把表的總行數(shù)單獨記錄下來射亏,如果從一張表中使用COUNT()進行查詢的時候,可以直接返回這個記錄下來的數(shù)值就可以了竭业,當然智润,前提是不能有where條件。
MyISAM之所以可以把表中的總行數(shù)記錄下來供COUNT()查詢使用未辆,那是因為MyISAM數(shù)據(jù)庫是表級鎖窟绷,不會有并發(fā)的數(shù)據(jù)庫行數(shù)修改,所以查詢得到的行數(shù)是準確的咐柜。
但是兼蜈,對于InnoDB來說,就不能做這種緩存操作了拙友,因為InnoDB支持事務(wù)为狸,其中大部分操作都是行級鎖,所以可能表的行數(shù)可能會被并發(fā)修改遗契,那么緩存記錄下來的總行數(shù)就不準確了辐棒。
但是,InnoDB還是針對COUNT()語句做了些優(yōu)化的。
在InnoDB中漾根,使用COUNT()查詢行數(shù)的時候泰涂,不可避免的要進行掃表了,那么辐怕,就可以在掃表過程中下功夫來優(yōu)化效率了逼蒙。
從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT() FROM tblname語句寄疏,確實在掃表的過程中做了一些優(yōu)化是牢。
前提是查詢語句中不包含WHERE或GROUP BY等條件。
我們知道赁还,COUNT()的目的只是為了統(tǒng)計總行數(shù)妖泄,所以,他根本不關(guān)心自己查到的具體值艘策,他如果能夠在掃表的過程中蹈胡,選擇一個成本較低的索引進行的話,那就可以大大節(jié)省時間朋蔫。
我們知道罚渐,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節(jié)點中保存的是整行記錄驯妄,而非聚簇索引的葉子節(jié)點中保存的是該行記錄的主鍵的值荷并。
所以,相比之下青扔,非聚簇索引要比聚簇索引小很多源织,所以MySQL會優(yōu)先選擇最小的非聚簇索引來掃表。
當我們建表的時候微猖,除了主鍵索引以外谈息,創(chuàng)建一個非主鍵索引還是有必要的。
至此凛剥,我們介紹完了MySQL數(shù)據(jù)庫對于COUNT()的優(yōu)化侠仇,這些優(yōu)化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。
COUNT()和COUNT(1)
介紹完了COUNT()犁珠,接下來看看COUNT(1)逻炊,對于,這二者到底有沒有區(qū)別犁享,網(wǎng)上的說法眾說紛紜余素。
有的說COUNT()執(zhí)行時會轉(zhuǎn)換成COUNT(1),所以COUNT(1)少了轉(zhuǎn)換步驟饼疙,所以更快溺森。
還有的說慕爬,因為MySQL針對COUNT()做了特殊優(yōu)化,所以COUNT()更快屏积。
那么医窿,到底哪種說法是對的呢?
看下MySQL官方文檔是怎么說的:
InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference.
畫重點:
same way , no performance difference炊林。
所以姥卢,對于COUNT(1)和COUNT(),MySQL的優(yōu)化是完全一樣的渣聚,根本不存在誰比誰快独榴!
那既然COUNT()和COUNT(1)一樣,建議用哪個呢奕枝?
建議使用COUNT()棺榔!
因為這個是SQL92定義的標準統(tǒng)計行數(shù)的語法,而且本文只是基于MySQL做了分析隘道,關(guān)于Oracle中的這個問題症歇,也是眾說紛紜的呢。
COUNT(字段)
最后谭梗,就是我們一直還沒提到的COUNT(字段)忘晤,他的查詢就比較簡單粗暴了,就是進行全表掃描激捏,然后判斷指定字段的值是不是為NULL设塔,不為NULL則累加。相比COUNT()远舅,COUNT(字段)多了一個步驟就是判斷所查詢的字段是否為NULL闰蛔,所以他的性能要比COUNT()慢。
總結(jié)
本文介紹了COUNT函數(shù)的用法图柏,主要用于統(tǒng)計表行數(shù)钞护。
主要用法有COUNT()、COUNT(字段)和COUNT(1)爆办。
因為COUNT()是SQL92定義的標準統(tǒng)計行數(shù)的語法,所以MySQL對他進行了很多優(yōu)化课梳,MyISAM中會直接把表的總行數(shù)單獨記錄下來供COUNT()查詢距辆,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然暮刃,這些優(yōu)化的前提都是沒有進行where和group的條件查詢跨算。
在InnoDB中COUNT()和COUNT(1)實現(xiàn)上沒有區(qū)別,而且效率一樣椭懊,但是COUNT(字段)需要進行字段的非NULL判斷诸蚕,所以效率會低一些。
因為COUNT()是SQL92定義的標準統(tǒng)計行數(shù)的語法,并且效率高背犯,所以請直接使用COUNT()查詢表的行數(shù)坏瘩!*