一、短連接風(fēng)暴:
1豆混、短連接風(fēng)暴概念:
??正常的短連接模式就是連接到數(shù)據(jù)庫(kù)后篓像,執(zhí)行很少的SQL語(yǔ)句就斷開(kāi),下次需要的時(shí)候再重連皿伺。如果使用的是短連接遗淳,在業(yè)務(wù)高峰期的時(shí)候,就可能出現(xiàn)連接數(shù)突然暴漲的情況心傀。而max_connections參數(shù)屈暗,用來(lái)控制一個(gè)MySQL實(shí)例同時(shí)存在的連接數(shù)的上限,超過(guò)這個(gè)值脂男,系統(tǒng)就會(huì)拒絕接下來(lái)的連接請(qǐng)求养叛,并報(bào)錯(cuò)提示“Too many connections”。對(duì)于被拒絕連接的請(qǐng)求來(lái)說(shuō)宰翅,從業(yè)務(wù)角度看就是數(shù)據(jù)庫(kù)不可用弃甥。
2、解決方法(都是有損的):
<1>汁讼、調(diào)高max_connections的值淆攻。
??這樣做是有風(fēng)險(xiǎn)的。因?yàn)樵O(shè)計(jì)max_connections這個(gè)參數(shù)的目的是想保護(hù)MySQL嘿架,如果把它改得太大瓶珊,讓更多的連接都可以進(jìn)來(lái),那么系統(tǒng)的負(fù)載可能會(huì)進(jìn)一步加大耸彪,大量的資源耗費(fèi)在權(quán)限驗(yàn)證等邏輯上伞芹,結(jié)果可能是適得其反,已經(jīng)連接的線程拿不到CPU資源去執(zhí)行業(yè)務(wù)的SQL請(qǐng)求蝉娜。
<2>唱较、先處理掉那些占著連接但是不工作的線程。
?(1)召川、原理:
??max_connections的計(jì)算南缓,不是看誰(shuí)在running,是只要連著就占用一個(gè)計(jì)數(shù)位置荧呐。對(duì)于那些不需要保持的連接汉形,可以通過(guò)kill connection主動(dòng)踢掉。這個(gè)行為跟事先設(shè)置wait_timeout的效果是一樣的坛增。設(shè)置wait_timeout參數(shù)表示的是获雕,一個(gè)線程空閑wait_timeout這么多秒之后,就會(huì)被MySQL直接斷開(kāi)連接收捣。但是需要注意届案,在show processlist的結(jié)果里,踢掉顯示為sleep的線程罢艾,可能是有損的楣颠。如果按照優(yōu)先級(jí)來(lái)說(shuō)尽纽,應(yīng)該優(yōu)先斷開(kāi)事務(wù)外空閑的連接。
?(2)童漩、事務(wù)外空閑的連接判斷方法:
??首先執(zhí)行show processlist弄贿,找出sleep的連接,然后看事務(wù)具體狀態(tài)矫膨,查詢information_schema庫(kù)的innodb_trx表差凹。這個(gè)結(jié)果里的trx_mysql_thread_id=x,表示id=x的線程還處在事務(wù)中侧馅。不能kill危尿,而不在其中的就可以kill。
<3>馁痴、減少連接過(guò)程的消耗谊娇。
??讓數(shù)據(jù)庫(kù)跳過(guò)權(quán)限驗(yàn)證階段。跳過(guò)權(quán)限驗(yàn)證的方法是:重啟數(shù)據(jù)庫(kù)罗晕,并使用–skip-grant-tables參數(shù)啟動(dòng)济欢。這樣,整個(gè)MySQL會(huì)跳過(guò)所有的權(quán)限驗(yàn)證階段小渊,包括連接過(guò)程和語(yǔ)句執(zhí)行過(guò)程在內(nèi)法褥。但是,這種方法風(fēng)險(xiǎn)極高粤铭。在MySQL 8.0版本里挖胃,如果啟用–skip-grant-tables參數(shù)杂靶,MySQL會(huì)默認(rèn)把 --skip-networking參數(shù)打開(kāi)梆惯,表示這時(shí)候數(shù)據(jù)庫(kù)只能被本地的客戶端連接。
二吗垮、查詢問(wèn)題:
1垛吗、慢查詢性能問(wèn)題:
?<1>、引發(fā)慢查詢的原因:
??①烁登、索引沒(méi)有設(shè)計(jì)好怯屉;
??②、SQL語(yǔ)句沒(méi)寫(xiě)好饵沧;
??③锨络、MySQL選錯(cuò)了索引;
?<2>狼牺、索引沒(méi)有寫(xiě)好:
??一般就是通過(guò)緊急創(chuàng)建索引來(lái)解決羡儿。MySQL 5.6版本以后,創(chuàng)建索引都支持Online DDL了是钥,對(duì)于那種高峰期數(shù)據(jù)庫(kù)已經(jīng)被這個(gè)語(yǔ)句打掛了的情況掠归,最高效的做法就是直接執(zhí)行alter table 語(yǔ)句缅叠。
?<3>、SQL語(yǔ)句沒(méi)寫(xiě)好:
??由于SQL語(yǔ)句沒(méi)寫(xiě)好虏冻,導(dǎo)致語(yǔ)句沒(méi)有使用上索引肤粱。這時(shí),可以通過(guò)改寫(xiě)SQL語(yǔ)句來(lái)處理厨相。MySQL 5.7提供了query_rewrite功能领曼,可以把輸入的一種語(yǔ)句改寫(xiě)成另外一種模式。
?<4>蛮穿、MySQL選錯(cuò)了索引:
??應(yīng)急方案就是給這個(gè)語(yǔ)句加上force index悯森。同樣地,使用查詢重寫(xiě)功能绪撵,給原來(lái)的語(yǔ)句加上force index瓢姻,也可以解決這個(gè)問(wèn)題。
?<5>音诈、“索引沒(méi)設(shè)計(jì)好”和“語(yǔ)句沒(méi)寫(xiě)好”這兩種情況的避免方法:
??①幻碱、上線前,在測(cè)試環(huán)境细溅,把慢查詢?nèi)罩荆╯low log)打開(kāi)褥傍,并且把long_query_time設(shè)置成0,確保每個(gè)語(yǔ)句都會(huì)被記錄入慢查詢?nèi)罩荆?br>
??②喇聊、在測(cè)試表里插入模擬線上的數(shù)據(jù)恍风,做一遍回歸測(cè)試;
??③誓篱、觀察慢查詢?nèi)罩纠锩款愓Z(yǔ)句的輸出朋贬,特別留意Rows_examined字段是否與預(yù)期一致。
2窜骄、QPS(每秒查詢數(shù))突增問(wèn)題:
?<1>锦募、不同背景的不同處理方法:
??①、一種是由全新業(yè)務(wù)的bug導(dǎo)致的邻遏。假設(shè)白名單是一個(gè)個(gè)加的糠亩。這種情況下,如果能夠確定業(yè)務(wù)方會(huì)下掉這個(gè)功能准验,只是時(shí)間上沒(méi)那么快赎线,那么就可以從數(shù)據(jù)庫(kù)端直接把白名單去掉。
??②糊饱、如果這個(gè)新功能使用的是單獨(dú)的數(shù)據(jù)庫(kù)用戶垂寥,可以用管理員賬號(hào)把這個(gè)用戶刪掉,然后斷開(kāi)現(xiàn)有連接。這樣矫废,這個(gè)新功能的連接不成功盏缤,由它引發(fā)的QPS就會(huì)變成0。
??③蓖扑、如果這個(gè)新增的功能跟主體功能是部署在一起的唉铜,那么只能通過(guò)處理語(yǔ)句來(lái)限制。這時(shí)律杠,可以使用查詢重寫(xiě)功能潭流,把壓力最大的SQL語(yǔ)句直接重寫(xiě)成"select 1"返回。
?<2>柜去、可能存在的副作用:
??①灰嫉、如果別的功能里面也用到了這個(gè)SQL語(yǔ)句模板,會(huì)有誤傷嗓奢;
??②讼撒、很多業(yè)務(wù)并不是靠這一個(gè)語(yǔ)句就能完成邏輯的,所以如果單獨(dú)把這一個(gè)語(yǔ)句以select 1的結(jié)果返回的話股耽,可能會(huì)導(dǎo)致后面的業(yè)務(wù)邏輯一起失敗根盒。