實(shí)戰(zhàn)！聊聊如何解決MySQL深分頁問題

我們?nèi)粘Ｗ龇猪撔枨髸r(shí)爷光，一般會用limit實(shí)現(xiàn)蛀序，但是當(dāng)偏移量特別大的時(shí)候徐裸，查詢效率就變得低下。本文將分四個(gè)方案骑祟，討論如何優(yōu)化MySQL百萬數(shù)據(jù)的深分頁問題曾我，并附上最近優(yōu)化生產(chǎn)慢SQL的實(shí)戰(zhàn)案例。

limit深分頁為什么會變慢？

先看下表結(jié)構(gòu)哈：

CREATE TABLE account (
  id int(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵Id',
  name varchar(255) DEFAULT NULL COMMENT '賬戶名',
  balance int(11) DEFAULT NULL COMMENT '余額',
  create_time datetime NOT NULL COMMENT '創(chuàng)建時(shí)間',
  update_time datetime NOT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '更新時(shí)間',
  PRIMARY KEY (id),
  KEY idx_name (name),
  KEY idx_update_time (update_time) //索引
) ENGINE=InnoDB AUTO_INCREMENT=1570068 DEFAULT CHARSET=utf8 ROW_FORMAT=REDUNDANT COMMENT='賬戶表';

假設(shè)深分頁的執(zhí)行SQL如下：

select id,name,balance from account where update_time> '2020-09-19' limit 100000,10;

這個(gè)SQL的執(zhí)行時(shí)間如下：

執(zhí)行完需要0.742秒稚晚，深分頁為什么會變慢呢客燕？如果換成 limit 0,10也搓，只需要0.006秒哦

我們先來看下這個(gè)SQL的執(zhí)行流程：

通過普通二級索引樹idx_update_time傍妒，過濾update_time條件摸柄，找到滿足條件的記錄ID驱负。
通過ID跃脊，回到主鍵索引樹，找到滿足記錄的行捞稿，然后取出展示的列（回表）
掃描滿足條件的100010行碗殷，然后扔掉前100000行继阻，返回抹缕。

執(zhí)行計(jì)劃如下：

SQL變慢原因有兩個(gè)：

limit語句會先掃描offset+n行睹簇，然后再丟棄掉前offset行磨淌，返回后n行數(shù)據(jù)。也就是說limit 100000,10搪锣，就會掃描100010行，而limit 0,10，只掃描10行抡谐。
limit 100000,10 掃描更多的行數(shù)，也意味著回表更多的次數(shù)。

通過子查詢優(yōu)化

因?yàn)橐陨系腟QL羔沙，回表了100010次坚嗜，實(shí)際上，我們只需要10條數(shù)據(jù)碟绑，也就是我們只需要10次回表其實(shí)就夠了蜈敢。因此抓狭，我們可以通過減少回表次數(shù)來優(yōu)化造烁。

回顧B+ 樹結(jié)構(gòu)

那么惭蟋，如何減少回表次數(shù)呢告组？我們先來復(fù)習(xí)下B+樹索引結(jié)構(gòu)哈~

InnoDB中木缝，索引分主鍵索引（聚簇索引）和二級索引

主鍵索引，葉子節(jié)點(diǎn)存放的是整行數(shù)據(jù)
二級索引放案，葉子節(jié)點(diǎn)存放的是主鍵的值吱殉。

把條件轉(zhuǎn)移到主鍵索引樹

如果我們把查詢條件，轉(zhuǎn)移回到主鍵索引樹铅匹，那就可以減少回表次數(shù)啦伊群。轉(zhuǎn)移到主鍵索引樹查詢的話舰始，查詢條件得改為主鍵id了丸卷，之前SQL的update_time這些條件咋辦呢？抽到子查詢那里嘛~

子查詢那里怎么抽的呢萎坷？因?yàn)槎壦饕~子節(jié)點(diǎn)是有主鍵ID的哆档，所以我們直接根據(jù)update_time來查主鍵ID即可瓜浸，同時(shí)我們把 limit 100000的條件插佛，也轉(zhuǎn)移到子查詢雇寇，完整SQL如下：

select id,name,balance FROM account where id >= (select a.id from account a where a.update_time >= '2020-09-19' limit 100000, 1) LIMIT 10;寫漏了蚌铜，可以補(bǔ)下時(shí)間條件在外面

查詢效果一樣的厘线，執(zhí)行時(shí)間只需要0.038秒造壮！

我們來看下執(zhí)行計(jì)劃

由執(zhí)行計(jì)劃得知成箫，子查詢 table a查詢是用到了idx_update_time索引蹬昌。首先在索引上拿到了聚集索引的主鍵ID,省去了回表操作攀隔，然后第二查詢直接根據(jù)第一個(gè)查詢的 ID往后再去查10個(gè)就可以了!

因此，這個(gè)方案是可以的~

INNER JOIN 延遲關(guān)聯(lián)

延遲關(guān)聯(lián)的優(yōu)化思路明刷，跟子查詢的優(yōu)化思路其實(shí)是一樣的：都是把條件轉(zhuǎn)移到主鍵索引樹婴栽，然后減少回表。不同點(diǎn)是辈末，延遲關(guān)聯(lián)使用了inner join代替子查詢愚争。

優(yōu)化后的SQL如下：

SELECT  acct1.id,acct1.name,acct1.balance FROM account acct1 INNER JOIN (SELECT a.id FROM account a WHERE a.update_time >= '2020-09-19' ORDER BY a.update_time LIMIT 100000, 10) AS  acct2 on acct1.id= acct2.id;

查詢效果也是杠桿的，只需要0.034秒

執(zhí)行計(jì)劃如下：

查詢思路就是挤聘，先通過idx_update_time二級索引樹查詢到滿足條件的主鍵ID轰枝，再與原表通過主鍵ID內(nèi)連接，這樣后面直接走了主鍵索引了组去，同時(shí)也減少了回表。

標(biāo)簽記錄法

limit 深分頁問題的本質(zhì)原因就是：偏移量（offset）越大添怔，mysql就會掃描越多的行湾戳，然后再拋棄掉。這樣就導(dǎo)致查詢性能的下降广料。

其實(shí)我們可以采用標(biāo)簽記錄法砾脑，就是標(biāo)記一下上次查詢到哪一條了，下次再來查的時(shí)候艾杏，從該條開始往下掃描韧衣。就好像看書一樣，上次看到哪里了购桑，你就折疊一下或者夾個(gè)書簽畅铭，下次來看的時(shí)候，直接就翻到啦勃蜘。

假設(shè)上一次記錄到100000硕噩，則SQL可以修改為：

select  id,name,balance FROM account where id > 100000 order by id limit 10;

這樣的話，后面無論翻多少頁缭贡，性能都會不錯(cuò)的炉擅，因?yàn)槊辛?code>id索引。但是這種方式有局限性：需要一種類似連續(xù)自增的字段阳惹。

使用between...and...

很多時(shí)候谍失，可以將limit查詢轉(zhuǎn)換為已知位置的查詢，這樣MySQL通過范圍掃描between...and莹汤，就能獲得到對應(yīng)的結(jié)果快鱼。

如果知道邊界值為100000，100010后，就可以這樣優(yōu)化：

select  id,name,balance FROM account where id between 100000 and 100010 order by id;

手把手實(shí)戰(zhàn)案例

我們一起來看一個(gè)實(shí)戰(zhàn)案例哈抹竹。假設(shè)現(xiàn)在有表結(jié)構(gòu)如下线罕，并且有200萬數(shù)據(jù).

CREATE TABLE account (
 id varchar(32) COLLATE utf8_bin NOT NULL COMMENT '主鍵',
 account_no varchar(64) COLLATE utf8_bin NOT NULL DEFAULT '' COMMENT '賬號'
 amount decimal(20,2) DEFAULT NULL COMMENT '金額'
 type varchar(10) COLLATE utf8_bin DEFAULT NULL COMMENT '類型A，B'
 create_time datetime DEFAULT NULL COMMENT '創(chuàng)建時(shí)間',
 update_time datetime DEFAULT NULL COMMENT '更新時(shí)間',
 PRIMARY KEY (id),
 KEY `idx_account_no` (account_no),
 KEY `idx_create_time` (create_time)
 ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='賬戶表'

業(yè)務(wù)需求是這樣：獲取最2021年的A類型賬戶數(shù)據(jù)柒莉，上報(bào)到大數(shù)據(jù)平臺闻坚。

一般思路的實(shí)現(xiàn)方式

很多伙伴接到這么一個(gè)需求，會直接這么實(shí)現(xiàn)了：

//查詢上報(bào)總數(shù)量
Integer total = accountDAO.countAccount();

//查詢上報(bào)總數(shù)量對應(yīng)的SQL
<select id ='countAccount' resultType="java.lang.Integer">
  seelct count(1) 
  from account
  where create_time >='2021-01-01 00:00:00'
  and  type ='A'
</select>

//計(jì)算頁數(shù)
int pageNo = total % pageSize == 0 ? total / pageSize : (total / pageSize + 1);

//分頁查詢兢孝，上報(bào)
for(int i = 0; i < pageNo; i++){
 List<AcctountPO> list = accountDAO.listAccountByPage(startRow,pageSize);
 startRow = (pageNo-1)*pageSize;
 //上報(bào)大數(shù)據(jù)
 postBigData(list);
}

//分頁查詢SQL（可能存在limit深分頁問題，因?yàn)閍ccount表數(shù)據(jù)量幾百萬）
<select id ='listAccountByPage' >
  seelct * 
  from account
  where create_time >='2021-01-01 00:00:00'
  and  type ='A'
  limit #{startRow},#{pageSize}
</select>

實(shí)戰(zhàn)優(yōu)化方案

以上的實(shí)現(xiàn)方案仅偎，會存在limit深分頁問題跨蟹，因?yàn)閍ccount表數(shù)據(jù)量幾百萬。那怎么優(yōu)化呢橘沥？

其實(shí)可以使用標(biāo)簽記錄法窗轩，有些伙伴可能會有疑惑，id主鍵不是連續(xù)的呀座咆，真的可以使用標(biāo)簽記錄痢艺？

當(dāng)然可以，id不是連續(xù)介陶，我們可以通過order by讓它連續(xù)嘛堤舒。優(yōu)化方案如下：

//查詢最小ID
String  lastId = accountDAO.queryMinId();

//查詢最小ID對應(yīng)的SQL
<select id="queryMinId" returnType=“java.lang.String”>
select MIN(id) 
from account
where create_time >='2021-01-01 00:00:00'
and type ='A'
</select>

//一頁的條數(shù)
Integer pageSize = 100;

List<AcctountPO> list ;
do{
   list = listAccountByPage(lastId,pageSize);
   //標(biāo)簽記錄法，記錄上次查詢過的Id
   lastId = list.get(list,size()-1).getId();
    //上報(bào)大數(shù)據(jù)
    postBigData(list);
}while(CollectionUtils.isNotEmpty(list));

<select id ="listAccountByPage">
  select * 
  from account 
  where create_time >='2021-01-01 00:00:00'
  and id > #{lastId}
  and type ='A'
  order by id asc  
  limit #{pageSize}
</select>

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末哺呜，一起剝皮案震驚了整個(gè)濱河市舌缤，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌某残，老刑警劉巖国撵，帶你破解...
沈念sama閱讀 216,919評論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異玻墅，居然都是意外死亡介牙，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,567評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門澳厢，熙熙樓的掌柜王于貴愁眉苦臉地迎上來环础，“玉大人，你說我怎么就攤上這事赏酥≡” “怎么了？”我有些...
開封第一講書人閱讀 163,316評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵裸扶，是天一觀的道長框都。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么魏保？我笑而不...
開封第一講書人閱讀 58,294評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任熬尺，我火速辦了婚禮，結(jié)果婚禮上谓罗，老公的妹妹穿的比我還像新娘粱哼。我一直安慰自己，他們只是感情好檩咱，可當(dāng)我...
茶點(diǎn)故事閱讀 67,318評論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布揭措。她就那樣靜靜地躺著，像睡著了一般刻蚯。火紅的嫁衣襯著肌膚如雪绊含。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,245評論 1贊 299
城市分裂傳說
那天炊汹，我揣著相機(jī)與錄音躬充，去河邊找鬼。笑死讨便，一個(gè)胖子當(dāng)著我的面吹牛充甚，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播霸褒，決...
沈念sama閱讀 40,120評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼伴找，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了傲霸？” 一聲冷哼從身側(cè)響起疆瑰，我...
開封第一講書人閱讀 38,964評論 0贊 275
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎昙啄，沒想到半個(gè)月后穆役，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,376評論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡梳凛，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,592評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年耿币，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片韧拒。...
茶點(diǎn)故事閱讀 39,764評論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡淹接，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出叛溢，到底是詐尸還是另有隱情塑悼，我是刑警寧澤，帶...
沈念sama閱讀 35,460評論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布楷掉，位于F島的核電站厢蒜，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜斑鸦，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,070評論 3贊 327
男人毒藥：我在死后第九天來索命
文/蒙蒙一愕贡、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧巷屿，春花似錦固以、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,697評論 0贊 22
一樁弒父案憨琳，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至浓冒，卻和暖如春栽渴，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背稳懒。一陣腳步聲響...
開封第一講書人閱讀 32,846評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留慢味，地道東北人场梆。一個(gè)月前我還...
沈念sama閱讀 47,819評論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像纯路，于是被迫代替她去往敵國和親或油。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,665評論 2贊 354

實(shí)戰(zhàn)嫉入！聊聊如何解決MySQL深分頁問題