MySQL查詢(xún)優(yōu)化(七):MySQL 的 count (*)真的很低效?

優(yōu)化COUNT函數(shù)的查詢(xún)?cè)?MySQL 中最容易被誤解的話題中能夠排進(jìn)前10名,我們可以在網(wǎng)上搜索了解更多關(guān)于 COUNT 優(yōu)化的誤解信息急迂。在進(jìn)行優(yōu)化前,理解 COUNT 到底做了什么很重要蹦肴。

COUNT 函數(shù)做什么用僚碎?

COUNT 是一個(gè)專(zhuān)用的函數(shù),通常有兩種不同的方式:計(jì)算值和數(shù)據(jù)行冗尤。值指的是非空(Non-NULL)表達(dá)式(NULL表示值缺失)听盖。如果我們?cè)?COUNT的參數(shù)中指定了列名或其他表達(dá)式,則 COUNT 函數(shù)是計(jì)算該表達(dá)式擁有值的次數(shù)裂七。這讓很多人困惑皆看,相當(dāng)一部分的原因是值和 NULL 的概念是模糊的。

另一種 COUNT 的形式是簡(jiǎn)單地計(jì)算結(jié)果集的數(shù)據(jù)行數(shù)背零。這是在 MySQL 知道 COUNT 函數(shù)參數(shù)的表達(dá)式不可能為 NULL 時(shí)的計(jì)算方式腰吟。最為典型的例子是 COUNT(),你也許會(huì)以為這是展開(kāi)數(shù)據(jù)表的全部列的一種替代形式徙瓶。事實(shí)上毛雇,它會(huì)忽略了全部列而僅僅對(duì)數(shù)據(jù)行數(shù)進(jìn)行記數(shù)*。

一個(gè)經(jīng)常犯的錯(cuò)誤是我們?cè)?COUNT 的參數(shù)里指定了列名然后以為是對(duì)數(shù)據(jù)行進(jìn)行計(jì)數(shù)侦镇。如果你是想獲取結(jié)果中的行數(shù)灵疮,你應(yīng)該一直使用 COUNT(*),這會(huì)使得你的查詢(xún)語(yǔ)句意圖更明確并且可以避免性能問(wèn)題壳繁。

MyISAM 的“神奇”之處

一個(gè)常見(jiàn)的誤解是 MyISAM 對(duì)于 COUNT 查詢(xún)來(lái)說(shuō)會(huì)非痴鸬罚快。MyISAM 的 COUNT 查詢(xún)確實(shí)快闹炉,但這種快的場(chǎng)景十分有限:COUNT()查詢(xún)并且沒(méi)有 WHERE 條件時(shí)才能達(dá)到這樣的效果蒿赢,而實(shí)際這種場(chǎng)景很少見(jiàn)。MySQL 能夠?qū)@個(gè)語(yǔ)句進(jìn)行優(yōu)化的原因是存儲(chǔ)引擎總是知道數(shù)據(jù)表的準(zhǔn)確行數(shù)渣触。如果 MySQL 知道一個(gè)列col不可能為 NULL羡棵,它也會(huì)將 COUNT(col) 轉(zhuǎn)換為 COUNT()來(lái)進(jìn)行優(yōu)化。

MyISAM在 COUNT 查詢(xún)中有 WHERE條件嗅钻、或其他對(duì)值進(jìn)行計(jì)數(shù)時(shí) 并沒(méi)有“神奇”之處皂冰。相比其他存儲(chǔ)引擎可能快也可能慢,這取決于很多其他因素啊犬。

簡(jiǎn)單的COUNT優(yōu)化

當(dāng)你想要對(duì)數(shù)據(jù)行的索引覆蓋不高的情況灼擂,又需要統(tǒng)計(jì)所有行數(shù)量時(shí)可以采用 MyISAM 引擎的 COUNT(*)來(lái)進(jìn)行優(yōu)化。下面的例子使用了標(biāo)準(zhǔn)的世界數(shù)據(jù)庫(kù)去展示查找 ID 大于5的城市數(shù)量時(shí)的優(yōu)化力度觉至,你寫(xiě)出的SQL 語(yǔ)句可能如下所示:

SELECT COUNT(*) FROM world.City WHERE ID > 5;

如果使用 SHOW STATUS 檢查查詢(xún)的話會(huì)發(fā)現(xiàn)掃描了4079行剔应。而如果是采用負(fù)向條件查詢(xún),并且減去那些 ID 小于等于5的城市數(shù)量的話,你會(huì)發(fā)現(xiàn)可以將掃描結(jié)果減少到5行峻贮。

SELECT (SELECT COUNT(*) FROM world.City) - COUNT(*) FROM world.City WHERE ID <= 5;

這個(gè)查詢(xún)會(huì)讀取更少的行是因?yàn)樵诓樵?xún)優(yōu)化階段將查詢(xún)轉(zhuǎn)換為了常量席怪,使用 EXPLAIN 可以看到:

id select_type table rows Extra
1 PRIMARY City 6 Using where; Using index
2 SUBQUERY NULL NULL Select tables optimized way

一個(gè)常見(jiàn)的問(wèn)題是如何在一個(gè)查詢(xún)語(yǔ)句中完成對(duì)同一列的不同值的數(shù)量的查詢(xún)。例如纤控,你想通過(guò)一條查詢(xún)語(yǔ)句查出不同顏色對(duì)應(yīng)的數(shù)量挂捻。你不能使用諸如 SELECT COUNT(color = 'blue' OR color='red') FROM items來(lái)完成查詢(xún),因?yàn)檫@樣不會(huì)區(qū)分出不同顏色相應(yīng)的數(shù)量船万。而你也不能將顏色放入 WHERE 條件中刻撒,例如 SELECT COUNT(*) FROM items WHERE color = 'blue' AND color = 'red'由于顏色本身是互斥的,因此可以用下面的方法解決這一問(wèn)題:

SELECT SUM(IF(color = 'blue', 1, 0)) AS blue, 
SUM(IF(color = 'red', 1, 0)) as red FROM items;

還有一種變通的形式是不是要 SUM耿导,而是 COUNT声怔,只是保證了沒(méi)有值的表達(dá)式的判決表達(dá)式是 false:

SELECT COUNT(color = 'blue' OR NULL) as blue,
COUNT(color = 'red' OR NULL) as red FROM items;

使用近似值

有時(shí)候并不需要精確的數(shù)量,這個(gè)時(shí)候就可以使用近似值舱呻。在 EXPLAIN優(yōu)化器中給出的估計(jì)行數(shù)通炒谆穑可以滿(mǎn)足這種場(chǎng)景,此時(shí)可以使用 EXPLAIN 來(lái)替代真實(shí)的查詢(xún)箱吕。

在很多情況下芥驳,一個(gè)準(zhǔn)確的數(shù)量與近似值相比低效很多。一個(gè)客戶(hù)曾經(jīng)要求統(tǒng)計(jì)他們網(wǎng)站的活躍用戶(hù)數(shù)量茬高。用戶(hù)數(shù)量被緩存并每隔30分鐘更新一次兆旬。這本身就不準(zhǔn)確,因此使用估計(jì)值是可以接受的怎栽。這個(gè)查詢(xún)使用了多個(gè) WHERE 條件去保證不會(huì)統(tǒng)計(jì)非活躍用戶(hù)或默認(rèn)用戶(hù)(擁有特殊的 ID)爵憎。移除這些條件,并稍微修改一下 count 操作就可以變得更高效婚瓜。一個(gè)更進(jìn)一步的優(yōu)化是移除不必要的 DISTINCT 操作,從而移除掉一次 filesort 操作刑棵。優(yōu)化后的查詢(xún)速度更快巴刻,且返回了幾乎準(zhǔn)確的結(jié)果。

更復(fù)雜的優(yōu)化

通常來(lái)說(shuō)蛉签,COUNT查詢(xún)很難優(yōu)化胡陪,這是因?yàn)樗ǔP枰y(tǒng)計(jì)很多行(訪問(wèn)很多數(shù)據(jù)),在 MySQL 中其他可選的辦法是使用覆蓋索引碍舍。如果那還不夠的話柠座,可能需要對(duì)整個(gè)系統(tǒng)應(yīng)用架構(gòu)進(jìn)行調(diào)整了。例如考慮統(tǒng)計(jì)數(shù)據(jù)表片橡,或者使用外部的緩存系統(tǒng)(如 Memcached)妈经。我們往往會(huì)面臨一個(gè)類(lèi)似的兩難問(wèn)題:快速、準(zhǔn)確和簡(jiǎn)單——你只能從中選擇兩項(xiàng)!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末吹泡,一起剝皮案震驚了整個(gè)濱河市骤星,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌爆哑,老刑警劉巖洞难,帶你破解...
    沈念sama閱讀 216,919評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異揭朝,居然都是意外死亡队贱,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,567評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)潭袱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)柱嫌,“玉大人,你說(shuō)我怎么就攤上這事敌卓∩魇剑” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,316評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵趟径,是天一觀的道長(zhǎng)瘪吏。 經(jīng)常有香客問(wèn)我,道長(zhǎng)蜗巧,這世上最難降的妖魔是什么掌眠? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,294評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮幕屹,結(jié)果婚禮上蓝丙,老公的妹妹穿的比我還像新娘。我一直安慰自己望拖,他們只是感情好渺尘,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,318評(píng)論 6 390
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著说敏,像睡著了一般鸥跟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上盔沫,一...
    開(kāi)封第一講書(shū)人閱讀 51,245評(píng)論 1 299
  • 那天医咨,我揣著相機(jī)與錄音,去河邊找鬼架诞。 笑死拟淮,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的谴忧。 我是一名探鬼主播很泊,決...
    沈念sama閱讀 40,120評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼角虫,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了撑蚌?” 一聲冷哼從身側(cè)響起上遥,我...
    開(kāi)封第一講書(shū)人閱讀 38,964評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎争涌,沒(méi)想到半個(gè)月后粉楚,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,376評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡亮垫,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,592評(píng)論 2 333
  • 正文 我和宋清朗相戀三年模软,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片饮潦。...
    茶點(diǎn)故事閱讀 39,764評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡燃异,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出继蜡,到底是詐尸還是另有隱情回俐,我是刑警寧澤,帶...
    沈念sama閱讀 35,460評(píng)論 5 344
  • 正文 年R本政府宣布稀并,位于F島的核電站仅颇,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏碘举。R本人自食惡果不足惜忘瓦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,070評(píng)論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望引颈。 院中可真熱鬧耕皮,春花似錦、人聲如沸蝙场。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,697評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)售滤。三九已至苦锨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間趴泌,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,846評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工拉庶, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嗜憔,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,819評(píng)論 2 370
  • 正文 我出身青樓氏仗,卻偏偏與公主長(zhǎng)得像吉捶,于是被迫代替她去往敵國(guó)和親夺鲜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,665評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容