1 概念
MySQL的慢查詢,全名是慢查詢?nèi)罩韭叶梗荕ySQL提供的一種日志記錄奖恰,用來記錄在MySQL中響應時間超過閥值的語句。
具體環(huán)境中宛裕,運行時間超過long_query_time值的SQL語句瑟啃,則會被記錄到慢查詢?nèi)罩局小?/p>
long_query_time的默認值為10,意思是記錄運行10秒以上的語句揩尸。
默認情況下蛹屿,MySQL數(shù)據(jù)庫并不啟動慢查詢?nèi)罩荆枰謩觼碓O(shè)置這個參數(shù)岩榆。
當然错负,如果不是調(diào)優(yōu)需要的話坟瓢,一般不建議啟動該參數(shù),因為開啟慢查詢?nèi)罩緯蚨嗷蛏賻硪欢ǖ男阅苡绊憽?/p>
慢查詢?nèi)罩局С謱⑷罩居涗泴懭胛募蛿?shù)據(jù)庫表犹撒。
1.1 數(shù)據(jù)庫中設(shè)置SQL慢查詢
1.1.1 第一步.開啟mysql慢查詢
- 方式一:
修改配置文件 在 my.ini 增加幾行: 主要是慢查詢的定義時間(超過2秒就是慢查詢)折联,以及慢查詢log日志記錄( slow_query_log)
-
方法二:通過MySQL數(shù)據(jù)庫開啟慢查詢:
1.2 分析慢查詢?nèi)罩?/h4>
直接分析mysql慢查詢?nèi)罩?,利用explain關(guān)鍵字可以模擬優(yōu)化器執(zhí)行SQL查詢語句,來分析sql慢查詢語句
例如:執(zhí)行EXPLAIN SELECT * FROM app_mobile_device ORDER BYmodifiedtime LIMIT 0,1000
得到如下結(jié)果: 顯示結(jié)果分析:
1.3 常見的慢查詢優(yōu)化
1.3.1 索引沒起作用的情況
- 使用LIKE關(guān)鍵字的查詢語句
在使用LIKE關(guān)鍵字進行查詢的查詢語句中识颊,如果匹配字符串的第一個字符為“%”诚镰,索引不會起作用。只有“%”不在第一個位置索引才會起作用祥款。
- 使用多列索引的查詢語句
MySQL可以為多個字段創(chuàng)建索引清笨。一個索引最多可以包括16個字段。對于多列索引刃跛,只有查詢條件使用了這些字段中的第一個字段時函筋,索引才會被使用。
1.3.2 優(yōu)化數(shù)據(jù)庫結(jié)構(gòu)
合理的數(shù)據(jù)庫結(jié)構(gòu)不僅可以使數(shù)據(jù)庫占用更小的磁盤空間奠伪,而且能夠使查詢速度更快。數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計首懈,需要考慮數(shù)據(jù)冗余绊率、查詢和更新的速度、字段的數(shù)據(jù)類型是否合理等多方面的內(nèi)容究履。
- 將字段很多的表分解成多個表
對于字段比較多的表滤否,如果有些字段的使用頻率很低,可以將這些字段分離出來形成新表最仑。因為當一個表的數(shù)據(jù)量很大時藐俺,會由于使用頻率低的字段的存在而變慢。
- 增加中間表
對于需要經(jīng)常聯(lián)合查詢的表泥彤,可以建立中間表以提高查詢效率欲芹。通過建立中間表,把需要經(jīng)常聯(lián)合查詢的數(shù)據(jù)插入到中間表中吟吝,然后將原來的聯(lián)合查詢改為對中間表的查詢菱父,以此來提高查詢效率。
1.3.3 分解關(guān)聯(lián)查詢
將一個大的查詢分解為多個小查詢是很有必要的剑逃。
很多高性能的應用都會對關(guān)聯(lián)查詢進行分解浙宜,就是可以對每一個表進行一次單表查詢,然后將查詢結(jié)果在應用程序中進行關(guān)聯(lián)蛹磺,很多場景下這樣會更高效粟瞬,例如:
SELECT * FROM tag
JOIN tag_post ON tag_id = tag.id
JOIN post ON tag_post.post_id = post.id
WHERE tag.tag = 'mysql';
分解為:
SELECT * FROM tag WHERE tag = 'mysql';
SELECT * FROM tag_post WHERE tag_id = 1234;
SELECT * FROM post WHERE post.id in (123,456,567);
1.3.4 優(yōu)化LIMIT分頁
在系統(tǒng)中需要分頁的操作通常會使用limit加上偏移量的方法實現(xiàn),同時加上合適的order by 子句萤捆。如果有對應的索引裙品,通常效率會不錯俗批,否則MySQL需要做大量的文件排序操作。
一個非常令人頭疼問題就是當偏移量非常大的時候清酥,例如可能是limit 10000,20這樣的查詢扶镀,這是mysql需要查詢10020條然后只返回最后20條,前面的10000條記錄都將被舍棄焰轻,這樣的代價很高臭觉。
優(yōu)化此類查詢的一個最簡單的方法是盡可能的使用索引覆蓋掃描,而不是查詢所有的列辱志。然后根據(jù)需要做一次關(guān)聯(lián)操作再返回所需的列蝠筑。對于偏移量很大的時候這樣做的效率會得到很大提升。
對于下面的查詢:
select id,title from collect limit 90000,10;
該語句存在的最大問題在于limit M,N中偏移量M太大(我們暫不考慮篩選字段上要不要添加索引的影響)揩懒,導致每次查詢都要先從整個表中找到滿足條件 的前M條記錄什乙,之后舍棄這M條記錄并從第M+1條記錄開始再依次找到N條滿足條件的記錄。如果表非常大已球,且篩選字段沒有合適的索引臣镣,且M特別大那么這樣的代價是非常高的。 試想智亮,如我們下一次的查詢能從前一次查詢結(jié)束后標記的位置開始查找忆某,找到滿足條件的100條記錄,并記下下一次查詢應該開始的位置阔蛉,以便于下一次查詢能直接從該位置 開始弃舒,這樣就不必每次查詢都先從整個表中先找到滿足條件的前M條記錄,舍棄状原,在從M+1開始再找到100條滿足條件的記錄了聋呢。
方法一:慮篩選字段(title)上加索引
title字段加索引 (此效率如何未加驗證)
方法二:先查詢出主鍵id值
select id,title from collect where id>=(select id from collect order by id limit 90000,1) limit 10;
原理:先查詢出90000條數(shù)據(jù)對應的主鍵id的值,然后直接通過該id的值直接查詢該id后面的數(shù)據(jù)颠区。
方法三:“關(guān)延遲聯(lián)”
如果這個表非常大削锰,那么這個查詢可以改寫成如下的方式:
Select news.id, news.description from news inner join (select id from news order by title limit 50000,5) as myNew using(id);
這里的“關(guān)延遲聯(lián)”將大大提升查詢的效率,它讓MySQL掃描盡可能少的頁面毕莱,獲取需要的記錄后再根據(jù)關(guān)聯(lián)列回原表查詢需要的所有列喂窟。這個技術(shù)也可以用在優(yōu)化關(guān)聯(lián)查詢中的limit。
方法四:建立復合索引 acct_id和create_time
select * from acct_trans_log WHERE acct_id = 3095 order by create_time desc limit 0,10
注意sql查詢慢的原因都是:引起filesort
1.3.5 分析具體的SQL語句
** 1央串、兩個表選哪個為驅(qū)動表磨澡,表面是可以以數(shù)據(jù)量的大小作為依據(jù),但是實際經(jīng)驗最好交給mysql查詢優(yōu)化器自己去判斷质和。**
例如: select * from a where id in (select id from b );
對于這條sql語句它的執(zhí)行計劃其實并不是先查詢出b表的所有id,然后再與a表的id進行比較稳摄。
mysql會把in子查詢轉(zhuǎn)換成exists相關(guān)子查詢,所以它實際等同于這條sql語句:select * from a where exists(select * from b where b.id=a.id );
而exists相關(guān)子查詢的執(zhí)行原理是: 循環(huán)取出a表的每一條記錄與b表進行比較饲宿,比較的條件是a.id=b.id . 看a表的每條記錄的id是否在b表存在厦酬,如果存在就行返回a表的這條記錄胆描。
exists查詢有什么弊端?
由exists執(zhí)行原理可知仗阅,a表(外表)使用不了索引昌讲,必須全表掃描,因為是拿a表的數(shù)據(jù)到b表查减噪。而且必須得使用a表的數(shù)據(jù)到b表中查(外表到里表中)短绸,順序是固定死的。
如何優(yōu)化筹裕?
建索引醋闭。但是由上面分析可知,要建索引只能在b表的id字段建朝卒,不能在a表的id上证逻,mysql利用不上。
這樣優(yōu)化夠了嗎?還差一些。
由于exists查詢它的執(zhí)行計劃只能拿著a表的數(shù)據(jù)到b表查(外表到里表中)吗讶,雖然可以在b表的id字段建索引來提高查詢效率。
但是并不能反過來拿著b表的數(shù)據(jù)到a表查洞拨,exists子查詢的查詢順序是固定死的。
為什么要反過來负拟?
因為首先可以肯定的是反過來的結(jié)果也是一樣的。這樣就又引出了一個更細致的疑問:在雙方兩個表的id字段上都建有索引時歹河,到底是a表查b表的效率高掩浙,還是b表查a表的效率高?
該如何進一步優(yōu)化秸歧?
把查詢修改成inner join連接查詢:select * from a inner join b on a.id=b.id; (但是僅此還不夠厨姚,接著往下看)
為什么不用left join 和 right join?
這時候表之間的連接的順序就被固定住了键菱,比如左連接就是必須先查左表全表掃描谬墙,然后一條一條的到另外表去查詢,右連接同理经备。仍然不是最好的選擇拭抬。
為什么使用inner join就可以?
inner join中的兩張表侵蒙,如: a inner join b造虎,但實際執(zhí)行的順序是跟寫法的順序沒有半毛錢關(guān)系的,最終執(zhí)行也可能會是b連接a纷闺,順序不是固定死的算凿。如果on條件字段有索引的情況下份蝴,同樣可以使用上索引。
那我們又怎么能知道a和b什么樣的執(zhí)行順序效率更高氓轰?
你不知道婚夫,我也不知道。誰知道署鸡?mysql自己知道案糙。讓mysql自己去判斷(查詢優(yōu)化器)。具體表的連接順序和使用索引情況储玫,mysql查詢優(yōu)化器會對每種情況做出成本評估侍筛,最終選擇最優(yōu)的那個做為執(zhí)行計劃。
在inner join的連接中,mysql會自己評估使用a表查b表的效率高還是b表查a表高撒穷,如果兩個表都建有索引的情況下匣椰,mysql同樣會評估使用a表條件字段上的索引效率高還是b表的。
利用explain字段查看執(zhí)行時運用到的key(索引)
而我們要做的就是:把兩個表的連接條件的兩個字段都各自建立上索引端礼,然后explain 一下禽笑,查看執(zhí)行計劃,看mysql到底利用了哪個索引蛤奥,最后再把沒有使用索引的表的字段索引給去掉就行了佳镜。
2 參數(shù)詳情
MySQL 慢查詢的相關(guān)參數(shù)解釋:
slow_query_log:是否開啟慢查詢?nèi)罩荆?表示開啟,0表示關(guān)閉凡桥。
log-slow-queries :舊版(5.6以下版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂襟吧臁?梢圆辉O(shè)置該參數(shù)缅刽,系統(tǒng)則會默認給一個缺省的文件host_name-slow.log
slow-query-log-file:新版(5.6及以上版本)MySQL數(shù)據(jù)庫慢查詢?nèi)罩敬鎯β窂桨√汀?梢圆辉O(shè)置該參數(shù)衰猛,系統(tǒng)則會默認給一個缺省的文件host_name-slow.log
long_query_time:慢查詢閾值迟蜜,當查詢時間多于設(shè)定的閾值時,記錄日志啡省。
log_queries_not_using_indexes:未使用索引的查詢也被記錄到慢查詢?nèi)罩局校蛇x項)娜睛。
log_output:日志存儲方式。log_output='FILE'表示將日志存入文件卦睹,默認值是'FILE'畦戒。log_output='TABLE'表示將日志存入數(shù)據(jù)庫。
3 配置詳情
3.1 slow_query_log
默認情況下slow_query_log的值為OFF结序,表示慢查詢?nèi)罩臼墙玫木そ唬梢酝ㄟ^設(shè)置slow_query_log的值來開啟,如下所示:
mysql> show variables like '%slow_query_log%';
+---------------------+-----------------------------------------------+
| Variable_name | Value |
+---------------------+-----------------------------------------------+
| slow_query_log | OFF |
| slow_query_log_file | /home/WDPM/MysqlData/mysql/DB-Server-slow.log |
+---------------------+-----------------------------------------------+
2 rows in set (0.00 sec)
mysql> set global slow_query_log=1;
Query OK, 0 rows affected (0.09 sec)
使用set global slow_query_log=1開啟了慢查詢?nèi)罩局粚Ξ斍皵?shù)據(jù)庫生效笼痹,MySQL重啟后則會失效配喳。
如果要永久生效酪穿,就必須修改配置文件my.cnf(其它系統(tǒng)變量也是如此)。
my.cnf要增加或修改參數(shù)slow_query_log 和slow_query_log_file晴裹,如下所示
slow_query_log = 1
slow_query_log_file = /tmp/mysql_slow.log
然后重啟MySQL服務器被济。
3.2 slow_query_log_file
這個參數(shù)用于指定慢查詢?nèi)罩镜拇娣怕窂剑笔∏闆r是host_name-slow.log文件涧团,
mysql> show variables like 'slow_query_log_file';
+---------------------+-----------------------------------------------+
| Variable_name | Value |
+---------------------+-----------------------------------------------+
| slow_query_log_file | /home/WDPM/MysqlData/mysql/DB-Server-slow.log |
+---------------------+-----------------------------------------------+
1 row in set (0.00 sec)
3.3 long_query_time
開啟了慢查詢?nèi)罩竞笾涣祝裁礃拥腟QL才會記錄到慢查詢?nèi)罩纠锩婺兀?/p>
這個是由參數(shù)long_query_time控制,默認情況下long_query_time的值為10秒泌绣,可以使用命令修改钮追,也可以在my.cnf參數(shù)里面修改。
關(guān)于運行時間正好等于long_query_time的情況阿迈,并不會被記錄下來元媚。
也就是說,在mysql源碼里是判斷大于long_query_time苗沧,而非大于等于刊棕。
從MySQL 5.1開始,long_query_time開始以微秒記錄SQL語句運行時間待逞,之前僅用秒為單位記錄甥角。
如果記錄到表里面,只會記錄整數(shù)部分识樱,不會記錄微秒部分嗤无。
mysql> show variables like 'long_query_time%';
+-----------------+-----------+
| Variable_name | Value |
+-----------------+-----------+
| long_query_time | 10.000000 |
+-----------------+-----------+
1 row in set (0.00 sec)
mysql> set global long_query_time=4;
Query OK, 0 rows affected (0.00 sec)
mysql> show variables like 'long_query_time';
+-----------------+-----------+
| Variable_name | Value |
+-----------------+-----------+
| long_query_time | 10.000000 |
+-----------------+-----------+
1 row in set (0.00 sec)
如上所示,我修改了變量long_query_time怜庸,但是查詢變量long_query_time的值還是10当犯,難道沒有修改到呢?
注意:使用命令 set global long_query_time=4修改后休雌,需要重新連接或新開一個會話才能看到修改值。
用show variables like 'long_query_time'查看是當前會話的變量值肝断。
也可以不用重新連接會話杈曲,而是用show global variables like 'long_query_time';。
3.4 log_output
log_output參數(shù)指定日志的存儲方式胸懈。
log_output='FILE'表示將日志存入文件担扑,默認值也是'FILE'。
log_output='TABLE'表示將日志存入數(shù)據(jù)庫趣钱,這樣日志信息就會被寫入到mysql.slow_log表中涌献。
同時也支持兩種日志存儲方式,配置的時候以逗號隔開即可首有,如:log_output='FILE,TABLE'燕垃。
日志記錄到系統(tǒng)的專用日志表中枢劝,要比記錄到文件耗費更多的系統(tǒng)資源。
因此對于需要啟用慢查詢?nèi)罩静泛荆中枰軌颢@得更高的系統(tǒng)性能您旁,那么建議優(yōu)先記錄到文件。
mysql> show variables like '%log_output%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_output | FILE |
+---------------+-------+
1 row in set (0.00 sec)
mysql> set global log_output='TABLE';
Query OK, 0 rows affected (0.00 sec)
mysql> show variables like '%log_output%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_output | TABLE |
+---------------+-------+
1 row in set (0.00 sec)
mysql> select sleep(5) ;
+----------+
| sleep(5) |
+----------+
| 0 |
+----------+
1 row in set (5.00 sec)
mysql>
mysql> select * from mysql.slow_log;
+---------------------+---------------------------+------------+-----------+-----------+---------------+----+----------------+-----------+-----------+-----------------+-----------+
| start_time | user_host | query_time | lock_time | rows_sent | rows_examined | db | last_insert_id | insert_id | server_id | sql_text | thread_id |
+---------------------+---------------------------+------------+-----------+-----------+---------------+----+----------------+-----------+-----------+-----------------+-----------+
| 2016-06-16 17:37:53 | root[root] @ localhost [] | 00:00:03 | 00:00:00 | 1 | 0 | | 0 | 0 | 1 | select sleep(3) | 5 |
| 2016-06-16 21:45:23 | root[root] @ localhost [] | 00:00:05 | 00:00:00 | 1 | 0 | | 0 | 0 | 1 | select sleep(5) | 2 |
+---------------------+---------------------------+------------+-----------+-----------+---------------+----+----------------+-----------+-----------+-----------------+-----------+
2 rows in set (0.00 sec)
3.5 log-queries-not-using-indexes
該系統(tǒng)變量指定未使用索引的查詢也被記錄到慢查詢?nèi)罩局校蛇x項)轴捎。
如果調(diào)優(yōu)的話鹤盒,建議開啟這個選項。
另外侦副,開啟了這個參數(shù)侦锯,其實使用full index scan的SQL也會被記錄到慢查詢?nèi)罩尽?/p>
mysql> show variables like 'log_queries_not_using_indexes';
+-------------------------------+-------+
| Variable_name | Value |
+-------------------------------+-------+
| log_queries_not_using_indexes | OFF |
+-------------------------------+-------+
1 row in set (0.00 sec)
mysql> set global log_queries_not_using_indexes=1;
Query OK, 0 rows affected (0.00 sec)
mysql> show variables like 'log_queries_not_using_indexes';
+-------------------------------+-------+
| Variable_name | Value |
+-------------------------------+-------+
| log_queries_not_using_indexes | ON |
+-------------------------------+-------+
1 row in set (0.00 sec)
3.6 log_slow_admin_statements
這個系統(tǒng)變量表示,是否將慢管理語句例如ANALYZE TABLE和ALTER TABLE等記入慢查詢?nèi)罩尽?/p>
mysql> show variables like 'log_slow_admin_statements';
+---------------------------+-------+
| Variable_name | Value |
+---------------------------+-------+
| log_slow_admin_statements | OFF |
+---------------------------+-------+
1 row in set (0.00 sec)
3.7 Slow_queries
如果你想查詢有多少條慢查詢記錄秦驯,可以使用Slow_queries系統(tǒng)變量尺碰。
mysql> show global status like '%Slow_queries%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Slow_queries | 2104 |
+---------------+-------+
1 row in set (0.00 sec)
另外,還有l(wèi)og_slow_slave_statements 和 --log-short-format 參數(shù)汇竭,可到MySQL網(wǎng)站了解葱蝗。
4 mysqldumpslow工具
在生產(chǎn)環(huán)境中,如果要手工分析日志细燎,查找两曼、分析SQL,顯然是個體力活玻驻。
MySQL提供了日志分析工具mysqldumpslow
查看mysqldumpslow的幫助信息:
[root@DB-Server ~]# mysqldumpslow --help
Usage: mysqldumpslow [ OPTS... ] [ LOGS... ]
Parse and summarize the MySQL slow query log. Options are
--verbose verbose
--debug debug
--help write this text to standard output
-v verbose
-d debug
-s ORDER what to sort by (al, at, ar, c, l, r, t), 'at' is default(排序方式)
al: average lock time(平均鎖定時間)
ar: average rows sent(平均返回記錄數(shù))
at: average query time(平均查詢時間)
c: count(訪問計數(shù))
l: lock time(鎖定時間)
r: rows sent(返回記錄)
t: query time(查詢時間)
-r reverse the sort order (largest last instead of first)
-t NUM just show the top n queries(返回前面n條數(shù)據(jù))
-a don't abstract all numbers to N and strings to 'S'
-n NUM abstract numbers with at least n digits within names
-g PATTERN grep: only consider stmts that include this string(正則匹配模式悼凑,大小寫不敏感)
-h HOSTNAME hostname of db server for *-slow.log filename (can be wildcard),
default is '*', i.e. match all
-i NAME name of server instance (if using mysql.server startup script)
-l don't subtract lock time from total time
比如,得到返回記錄集最多的10個SQL璧瞬。
mysqldumpslow -s r -t 10 /database/mysql/mysql06_slow.log
得到訪問次數(shù)最多的10個SQL
mysqldumpslow -s c -t 10 /database/mysql/mysql06_slow.log
得到按照時間排序的前10條里面含有左連接的查詢語句户辫。
mysqldumpslow -s t -t 10 -g “l(fā)eft join” /database/mysql/mysql06_slow.log
另外建議在使用這些命令時結(jié)合 | 和more 使用 ,否則有可能出現(xiàn)刷屏的情況嗤锉。
mysqldumpslow -s r -t 20 /mysqldata/mysql/mysql06-slow.log | more