面渣逆襲：MySQL六十六問(wèn)，兩萬(wàn)字+五十圖詳解茶宵！有點(diǎn)六

不知不覺(jué)危纫，面渣逆襲系列已經(jīng)肝了差不多十篇，每一篇都是上萬(wàn)字乌庶，幾十圖种蝶，基本上涵蓋了面試的主要知識(shí)點(diǎn)，這期MySQL結(jié)束之后瞒大，這個(gè)系列可能會(huì)暫時(shí)告一段落螃征，作為面渣逆襲系列第一階段的收官之作，大家多多點(diǎn)贊透敌、收藏哦盯滚！

image.png

基礎(chǔ)

image.png

MySQ Logo

作為SQL Boy，基礎(chǔ)部分不會(huì)有人不會(huì)吧酗电？面試也不怎么問(wèn)魄藕，基礎(chǔ)掌握不錯(cuò)的小伙伴可以跳過(guò)這一部分。當(dāng)然撵术，可能會(huì)現(xiàn)場(chǎng)寫(xiě)一些SQL語(yǔ)句背率，SQ語(yǔ)句可以通過(guò)牛客嫩与、LeetCode寝姿、LintCode之類(lèi)的網(wǎng)站來(lái)練習(xí)。

1. 什么是內(nèi)連接蕴纳、外連接会油、交叉連接个粱、笛卡爾積呢古毛？

內(nèi)連接（inner join）：取得兩張表中滿足存在連接匹配關(guān)系的記錄。
外連接（outer join）：不只取得兩張表中滿足存在連接匹配關(guān)系的記錄都许，還包括某張表（或兩張表）中不滿足匹配關(guān)系的記錄稻薇。
交叉連接（cross join）：顯示兩張表所有記錄一一對(duì)應(yīng)，沒(méi)有匹配關(guān)系進(jìn)行篩選胶征，它是笛卡爾積在SQL中的實(shí)現(xiàn)塞椎，如果A表有m行，B表有n行睛低，那么A和B交叉連接的結(jié)果就有m*n行案狠。
笛卡爾積：是數(shù)學(xué)中的一個(gè)概念服傍，例如集合A={a,b}，集合B={1,2,3}骂铁，那么A??B={<a,o>,<a,1>,<a,2>,<b,0>,<b,1>,<b,2>,}吹零。

2. 那MySQL 的內(nèi)連接、左連接拉庵、右連接有有什么區(qū)別灿椅？

MySQL的連接主要分為內(nèi)連接和外連接，外連接常用的有左連接钞支、右連接茫蛹。

image.png

MySQL-joins-來(lái)源菜鳥(niǎo)教程

inner join 內(nèi)連接，在兩張表進(jìn)行連接查詢時(shí)烁挟，只保留兩張表中完全匹配的結(jié)果集
left join 在兩張表進(jìn)行連接查詢時(shí)婴洼，會(huì)返回左表所有的行，即使在右表中沒(méi)有匹配的記錄撼嗓。
right join 在兩張表進(jìn)行連接查詢時(shí)窃蹋，會(huì)返回右表所有的行，即使在左表中沒(méi)有匹配的記錄静稻。

3.說(shuō)一下數(shù)據(jù)庫(kù)的三大范式警没？

image.png

數(shù)據(jù)庫(kù)三范式

第一范式：數(shù)據(jù)表中的每一列（每個(gè)字段）都不可以再拆分。例如用戶表振湾，用戶地址還可以拆分成國(guó)家杀迹、省份、市押搪，這樣才是符合第一范式的树酪。
第二范式：在第一范式的基礎(chǔ)上，非主鍵列完全依賴于主鍵大州，而不能是依賴于主鍵的一部分续语。例如訂單表里，存儲(chǔ)了商品信息（商品價(jià)格厦画、商品類(lèi)型）疮茄，那就需要把商品ID和訂單ID作為聯(lián)合主鍵，才滿足第二范式根暑。
第三范式：在滿足第二范式的基礎(chǔ)上力试，表中的非主鍵只依賴于主鍵，而不依賴于其他非主鍵排嫌。例如訂單表畸裳，就不能存儲(chǔ)用戶信息（姓名、地址）淳地。

image.png

你設(shè)計(jì)遵守范式嗎怖糊？

三大范式的作用是為了控制數(shù)據(jù)庫(kù)的冗余帅容，是對(duì)空間的節(jié)省，實(shí)際上伍伤，一般互聯(lián)網(wǎng)公司的設(shè)計(jì)都是反范式的丰嘉，通過(guò)冗余一些數(shù)據(jù)，避免跨表跨庫(kù)嚷缭，利用空間換時(shí)間饮亏，提高性能。

4.varchar與char的區(qū)別阅爽？

image.png

varchar

char：

char表示定長(zhǎng)字符串路幸，長(zhǎng)度是固定的；
如果插入數(shù)據(jù)的長(zhǎng)度小于char的固定長(zhǎng)度時(shí)付翁，則用空格填充简肴；
因?yàn)殚L(zhǎng)度固定，所以存取速度要比varchar快很多百侧，甚至能快50%砰识，但正因?yàn)槠溟L(zhǎng)度固定，所以會(huì)占據(jù)多余的空間佣渴，是空間換時(shí)間的做法辫狼；
對(duì)于char來(lái)說(shuō)，最多能存放的字符個(gè)數(shù)為255辛润，和編碼無(wú)關(guān)

varchar：

varchar表示可變長(zhǎng)字符串膨处，長(zhǎng)度是可變的；
插入的數(shù)據(jù)是多長(zhǎng)砂竖，就按照多長(zhǎng)來(lái)存儲(chǔ)真椿；
varchar在存取方面與char相反，它存取慢乎澄，因?yàn)殚L(zhǎng)度不固定突硝，但正因如此，不占據(jù)多余的空間置济，是時(shí)間換空間的做法解恰；
對(duì)于varchar來(lái)說(shuō)，最多能存放的字符個(gè)數(shù)為65532

日常的設(shè)計(jì)舟肉，對(duì)于長(zhǎng)度相對(duì)固定的字符串修噪，可以使用char，對(duì)于長(zhǎng)度不確定的路媚，使用varchar更合適一些。

5.blob和text有什么區(qū)別樊销？

blob用于存儲(chǔ)二進(jìn)制數(shù)據(jù)整慎，而text用于存儲(chǔ)大字符串脏款。
blob沒(méi)有字符集，text有一個(gè)字符集裤园，并且根據(jù)字符集的校對(duì)規(guī)則對(duì)值進(jìn)行排序和比較

6.DATETIME和TIMESTAMP的異同撤师？

相同點(diǎn)：

兩個(gè)數(shù)據(jù)類(lèi)型存儲(chǔ)時(shí)間的表現(xiàn)格式一致。均為 YYYY-MM-DD HH:MM:SS
兩個(gè)數(shù)據(jù)類(lèi)型都包含「日期」和「時(shí)間」部分拧揽。
兩個(gè)數(shù)據(jù)類(lèi)型都可以存儲(chǔ)微秒的小數(shù)秒（秒后6位小數(shù)秒）

區(qū)別：

image.png

DATETIME和TIMESTAMP的區(qū)別

日期范圍：DATETIME 的日期范圍是 1000-01-01 00:00:00.000000 到 9999-12-31 23:59:59.999999剃盾；TIMESTAMP 的時(shí)間范圍是1970-01-01 00:00:01.000000 UTC 到 ``2038-01-09 03:14:07.999999 UTC
存儲(chǔ)空間：DATETIME 的存儲(chǔ)空間為 8 字節(jié)；TIMESTAMP 的存儲(chǔ)空間為 4 字節(jié)
時(shí)區(qū)相關(guān)：DATETIME 存儲(chǔ)時(shí)間與時(shí)區(qū)無(wú)關(guān)淤袜；TIMESTAMP 存儲(chǔ)時(shí)間與時(shí)區(qū)有關(guān)痒谴，顯示的值也依賴于時(shí)區(qū)
默認(rèn)值：DATETIME 的默認(rèn)值為 null；TIMESTAMP 的字段默認(rèn)不為空(not null)铡羡，默認(rèn)值為當(dāng)前時(shí)間(CURRENT_TIMESTAMP)

7.MySQL中 in 和 exists 的區(qū)別积蔚？

MySQL中的in語(yǔ)句是把外表和內(nèi)表作hash 連接，而exists語(yǔ)句是對(duì)外表作loop循環(huán)烦周，每次loop循環(huán)再對(duì)內(nèi)表進(jìn)行查詢尽爆。我們可能認(rèn)為exists比in語(yǔ)句的效率要高，這種說(shuō)法其實(shí)是不準(zhǔn)確的读慎，要區(qū)分情景：

如果查詢的兩個(gè)表大小相當(dāng)莺债，那么用in和exists差別不大。
如果兩個(gè)表中一個(gè)較小宰衙，一個(gè)是大表椒楣，則子查詢表大的用exists，子查詢表小的用in闰靴。
not in 和not exists：如果查詢語(yǔ)句使用了not in彪笼，那么內(nèi)外表都進(jìn)行全表掃描，沒(méi)有用到索引蚂且；而not extsts的子查詢依然能用到表上的索引配猫。所以無(wú)論那個(gè)表大，用not exists都比not in要快杏死。

8.MySQL里記錄貨幣用什么字段類(lèi)型比較好泵肄？

貨幣在數(shù)據(jù)庫(kù)中MySQL常用Decimal和Numric類(lèi)型表示，這兩種類(lèi)型被MySQL實(shí)現(xiàn)為同樣的類(lèi)型淑翼。他們被用于保存與貨幣有關(guān)的數(shù)據(jù)腐巢。

例如salary DECIMAL(9,2)，9(precision)代表將被用于存儲(chǔ)值的總的小數(shù)位數(shù)玄括，而2(scale)代表將被用于存儲(chǔ)小數(shù)點(diǎn)后的位數(shù)冯丙。存儲(chǔ)在salary列中的值的范圍是從-9999999.99到9999999.99。

DECIMAL和NUMERIC值作為字符串存儲(chǔ)遭京，而不是作為二進(jìn)制浮點(diǎn)數(shù)胃惜，以便保存那些值的小數(shù)精度泞莉。

之所以不使用float或者double的原因：因?yàn)閒loat和double是以二進(jìn)制存儲(chǔ)的，所以有一定的誤差船殉。

9.MySQL怎么存儲(chǔ)emoji?

MySQL可以直接使用字符串存儲(chǔ)emoji鲫趁。

但是需要注意的，utf8 編碼是不行的利虫，MySQL中的utf8是閹割版的 utf8挨厚，它最多只用 3 個(gè)字節(jié)存儲(chǔ)字符，所以存儲(chǔ)不了表情糠惫。那該怎么辦疫剃？

需要使用utf8mb4編碼。

alter table blogs modify content text CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci not null;

10.drop寞钥、delete與truncate的區(qū)別慌申？

三者都表示刪除，但是三者有一些差別：

deletetruncatedrop類(lèi)型屬于DML屬于DDL屬于DDL回滾可回滾不可回滾不可回滾刪除內(nèi)容表結(jié)構(gòu)還在理郑，刪除表的全部或者一部分?jǐn)?shù)據(jù)行表結(jié)構(gòu)還在蹄溉，刪除表中的所有數(shù)據(jù)從數(shù)據(jù)庫(kù)中刪除表，所有數(shù)據(jù)行您炉，索引和權(quán)限也會(huì)被刪除刪除速度刪除速度慢柒爵，需要逐行刪除刪除速度快刪除速度最快

因此，在不再需要一張表的時(shí)候赚爵，用drop棉胀；在想刪除部分?jǐn)?shù)據(jù)行時(shí)候，用delete冀膝；在保留表而刪除所有數(shù)據(jù)的時(shí)候用truncate唁奢。

11.UNION與UNION ALL的區(qū)別？

如果使用UNION ALL窝剖，不會(huì)合并重復(fù)的記錄行
效率 UNION 高于 UNION ALL

12.count(1)麻掸、count(*) 與 count(列名) 的區(qū)別？

image.png

三種計(jì)數(shù)方式

執(zhí)行效果：

count(*)包括了所有的列赐纱，相當(dāng)于行數(shù)脊奋，在統(tǒng)計(jì)結(jié)果的時(shí)候，不會(huì)忽略列值為NULL
count(1)包括了忽略所有列疙描，用1代表代碼行诚隙，在統(tǒng)計(jì)結(jié)果的時(shí)候，不會(huì)忽略列值為NULL
count(列名)只包括列名那一列起胰，在統(tǒng)計(jì)結(jié)果的時(shí)候久又，會(huì)忽略列值為空（這里的空不是只空字符串或者0，而是表示null）的計(jì)數(shù)，即某個(gè)字段值為NULL時(shí)籽孙，不統(tǒng)計(jì)烈评。

執(zhí)行速度：

列名為主鍵火俄，count(列名)會(huì)比count(1)快
列名不為主鍵犯建，count(1)會(huì)比count(列名)快
如果表多個(gè)列并且沒(méi)有主鍵，則 count（1）的執(zhí)行效率優(yōu)于 count（*）
如果有主鍵瓜客，則 select count（主鍵）的執(zhí)行效率是最優(yōu)的
如果表只有一個(gè)字段适瓦，則 select count（*）最優(yōu)。

13.一條SQL查詢語(yǔ)句的執(zhí)行順序谱仪？

image.png

查詢語(yǔ)句執(zhí)行順序

FROM：對(duì)FROM子句中的左表<left_table>和右表<right_table>執(zhí)行笛卡兒積（Cartesianproduct）玻熙，產(chǎn)生虛擬表VT1
ON：對(duì)虛擬表VT1應(yīng)用ON篩選，只有那些符合<join_condition>的行才被插入虛擬表VT2中
JOIN：如果指定了OUTER JOIN（如LEFT OUTER JOIN疯攒、RIGHT OUTER JOIN）嗦随，那么保留表中未匹配的行作為外部行添加到虛擬表VT2中，產(chǎn)生虛擬表VT3敬尺。如果FROM子句包含兩個(gè)以上表枚尼，則對(duì)上一個(gè)連接生成的結(jié)果表VT3和下一個(gè)表重復(fù)執(zhí)行步驟1）～步驟3），直到處理完所有的表為止
WHERE：對(duì)虛擬表VT3應(yīng)用WHERE過(guò)濾條件砂吞，只有符合<where_condition>的記錄才被插入虛擬表VT4中
GROUP BY：根據(jù)GROUP BY子句中的列署恍，對(duì)VT4中的記錄進(jìn)行分組操作，產(chǎn)生VT5
CUBE|ROLLUP：對(duì)表VT5進(jìn)行CUBE或ROLLUP操作蜻直，產(chǎn)生表VT6
HAVING：對(duì)虛擬表VT6應(yīng)用HAVING過(guò)濾器盯质，只有符合<having_condition>的記錄才被插入虛擬表VT7中。
SELECT：第二次執(zhí)行SELECT操作概而，選擇指定的列呼巷，插入到虛擬表VT8中
DISTINCT：去除重復(fù)數(shù)據(jù)，產(chǎn)生虛擬表VT9
ORDER BY：將虛擬表VT9中的記錄按照<order_by_list>進(jìn)行排序操作赎瑰，產(chǎn)生虛擬表VT10王悍。11）
LIMIT：取出指定行的記錄，產(chǎn)生虛擬表VT11乡范，并返回給查詢用戶

數(shù)據(jù)庫(kù)架構(gòu)

14.說(shuō)說(shuō) MySQL 的基礎(chǔ)架構(gòu)?

image.png

在這里插入圖片描述

MySQL邏輯架構(gòu)圖主要分三層：

客戶端：最上層的服務(wù)并不是MySQL所獨(dú)有的配名，大多數(shù)基于網(wǎng)絡(luò)的客戶端/服務(wù)器的工具或者服務(wù)都有類(lèi)似的架構(gòu)。比如連接處理晋辆、授權(quán)認(rèn)證渠脉、安全等等。
Server層：大多數(shù)MySQL的核心服務(wù)功能都在這一層瓶佳，包括查詢解析芋膘、分析、優(yōu)化、緩存以及所有的內(nèi)置函數(shù)（例如为朋，日期臂拓、時(shí)間、數(shù)學(xué)和加密函數(shù)）习寸，所有跨存儲(chǔ)引擎的功能都在這一層實(shí)現(xiàn)：存儲(chǔ)過(guò)程胶惰、觸發(fā)器、視圖等霞溪。
存儲(chǔ)引擎層：第三層包含了存儲(chǔ)引擎孵滞。存儲(chǔ)引擎負(fù)責(zé)MySQL中數(shù)據(jù)的存儲(chǔ)和提取。Server層通過(guò)API與存儲(chǔ)引擎進(jìn)行通信鸯匹。這些接口屏蔽了不同存儲(chǔ)引擎之間的差異坊饶，使得這些差異對(duì)上層的查詢過(guò)程透明。

15.一條 SQL 查詢語(yǔ)句在 MySQL 中如何執(zhí)行的殴蓬？

先檢查該語(yǔ)句是否有權(quán)限匿级，如果沒(méi)有權(quán)限，直接返回錯(cuò)誤信息染厅，如果有權(quán)限會(huì)先查詢緩存 (MySQL8.0 版本以前)痘绎。
如果沒(méi)有緩存，分析器進(jìn)行語(yǔ)法分析简逮，提取 sql 語(yǔ)句中 select 等關(guān)鍵元素，然后判斷 sql 語(yǔ)句是否有語(yǔ)法錯(cuò)誤尿赚，比如關(guān)鍵詞是否正確等等散庶。
語(yǔ)法解析之后，MySQL的服務(wù)器會(huì)對(duì)查詢的語(yǔ)句進(jìn)行優(yōu)化凌净，確定執(zhí)行的方案悲龟。
完成查詢優(yōu)化后，按照生成的執(zhí)行計(jì)劃調(diào)用數(shù)據(jù)庫(kù)引擎接口冰寻，返回執(zhí)行結(jié)果须教。

存儲(chǔ)引擎

16.MySQL有哪些常見(jiàn)存儲(chǔ)引擎？

image.png

主要存儲(chǔ)引擎

主要存儲(chǔ)引擎以及功能如下：

功能MylSAMMEMORYInnoDB存儲(chǔ)限制256TBRAM64TB支持事務(wù)NoNoYes支持全文索引YesNoYes支持樹(shù)索引YesYesYes支持哈希索引NoYesYes支持?jǐn)?shù)據(jù)緩存NoN/AYes支持外鍵NoNoYes

MySQL5.5之前斩芭，默認(rèn)存儲(chǔ)引擎是MylSAM轻腺，5.5之后變成了InnoDB。

InnoDB支持的哈希索引是自適應(yīng)的划乖，InnoDB會(huì)根據(jù)表的使用情況自動(dòng)為表生成哈希索引贬养，不能人為干預(yù)是否在一張表中生成哈希索引。

MySQL 5.6開(kāi)始InnoDB支持全文索引琴庵。

17.那存儲(chǔ)引擎應(yīng)該怎么選擇误算？

大致上可以這么選擇：

大多數(shù)情況下仰美，使用默認(rèn)的InnoDB就夠了。如果要提供提交儿礼、回滾和恢復(fù)的事務(wù)安全（ACID 兼容）能力咖杂，并要求實(shí)現(xiàn)并發(fā)控制，InnoDB 就是比較靠前的選擇了蚊夫。
如果數(shù)據(jù)表主要用來(lái)插入和查詢記錄诉字，則 MyISAM 引擎提供較高的處理效率。
如果只是臨時(shí)存放數(shù)據(jù)这橙，數(shù)據(jù)量不大奏窑，并且不需要較高的數(shù)據(jù)安全性导披，可以選擇將數(shù)據(jù)保存在內(nèi)存的 MEMORY 引擎中屈扎，MySQL 中使用該引擎作為臨時(shí)表，存放查詢的中間結(jié)果撩匕。

使用哪一種引擎可以根據(jù)需要靈活選擇鹰晨，因?yàn)榇鎯?chǔ)引擎是基于表的，所以一個(gè)數(shù)據(jù)庫(kù)中多個(gè)表可以使用不同的引擎以滿足各種性能和實(shí)際需求止毕。使用合適的存儲(chǔ)引擎將會(huì)提高整個(gè)數(shù)據(jù)庫(kù)的性能模蜡。

18.InnoDB和MylSAM主要有什么區(qū)別？

PS:MySQL8.0都開(kāi)始慢慢流行了扁凛，如果不是面試忍疾，MylSAM其實(shí)可以不用怎么了解。

image.png

InnoDB和MylSAM主要有什么區(qū)別

1. 存儲(chǔ)結(jié)構(gòu)：每個(gè)MyISAM在磁盤(pán)上存儲(chǔ)成三個(gè)文件谨朝；InnoDB所有的表都保存在同一個(gè)數(shù)據(jù)文件中（也可能是多個(gè)文件卤妒，或者是獨(dú)立的表空間文件），InnoDB表的大小只受限于操作系統(tǒng)文件的大小字币，一般為2GB则披。

2. 事務(wù)支持：MyISAM不提供事務(wù)支持；InnoDB提供事務(wù)支持事務(wù)洗出，具有事務(wù)(commit)士复、回滾(rollback)和崩潰修復(fù)能力(crash recovery capabilities)的事務(wù)安全特性。

3 最小鎖粒度：MyISAM只支持表級(jí)鎖翩活，更新時(shí)會(huì)鎖住整張表阱洪，導(dǎo)致其它查詢和更新都會(huì)被阻塞InnoDB支持行級(jí)鎖。

4. 索引類(lèi)型：MyISAM的索引為聚簇索引菠镇，數(shù)據(jù)結(jié)構(gòu)是B樹(shù)冗荸；InnoDB的索引是非聚簇索引，數(shù)據(jù)結(jié)構(gòu)是B+樹(shù)辟犀。

5. 主鍵必需：MyISAM允許沒(méi)有任何索引和主鍵的表存在俏竞；InnoDB如果沒(méi)有設(shè)定主鍵或者非空唯一索引绸硕，就會(huì)自動(dòng)生成一個(gè)6字節(jié)的主鍵(用戶不可見(jiàn))，數(shù)據(jù)是主索引的一部分魂毁，附加索引保存的是主索引的值玻佩。

6. 表的具體行數(shù)：MyISAM保存了表的總行數(shù)，如果select count() from table;會(huì)直接取出出該值; InnoDB沒(méi)有保存表的總行數(shù)席楚，如果使用select count() from table咬崔；就會(huì)遍歷整個(gè)表;但是在加了wehre條件后，MyISAM和InnoDB處理的方式都一樣烦秩。

7. 外鍵支持：MyISAM不支持外鍵垮斯；InnoDB支持外鍵。

日志

19.MySQL日志文件有哪些只祠？分別介紹下作用兜蠕？

image.png

MySQL主要日志

MySQL日志文件有很多，包括：

錯(cuò)誤日志（error log）：錯(cuò)誤日志文件對(duì)MySQL的啟動(dòng)抛寝、運(yùn)行熊杨、關(guān)閉過(guò)程進(jìn)行了記錄，能幫助定位MySQL問(wèn)題盗舰。
慢查詢?nèi)罩?/strong>（slow query log）：慢查詢?nèi)罩臼怯脕?lái)記錄執(zhí)行時(shí)間超過(guò) long_query_time 這個(gè)變量定義的時(shí)長(zhǎng)的查詢語(yǔ)句晶府。通過(guò)慢查詢?nèi)罩荆梢圆檎页瞿男┎樵冋Z(yǔ)句的執(zhí)行效率很低钻趋，以便進(jìn)行優(yōu)化川陆。

一般查詢?nèi)罩?/strong>（general log）：一般查詢?nèi)罩居涗浟怂袑?duì)MySQL數(shù)據(jù)庫(kù)請(qǐng)求的信息，無(wú)論請(qǐng)求是否正確執(zhí)行蛮位。

二進(jìn)制日志（bin log）：關(guān)于二進(jìn)制日志较沪，它記錄了數(shù)據(jù)庫(kù)所有執(zhí)行的DDL和DML語(yǔ)句（除了數(shù)據(jù)查詢語(yǔ)句select、show等）土至，以事件形式記錄并保存在二進(jìn)制文件中购对。

還有兩個(gè)InnoDB存儲(chǔ)引擎特有的日志文件：

重做日志（redo log）：重做日志至關(guān)重要，因?yàn)樗鼈冇涗浟藢?duì)于InnoDB存儲(chǔ)引擎的事務(wù)日志陶因。

回滾日志（undo log）：回滾日志同樣也是InnoDB引擎提供的日志骡苞，顧名思義，回滾日志的作用就是對(duì)數(shù)據(jù)進(jìn)行回滾楷扬。當(dāng)事務(wù)對(duì)數(shù)據(jù)庫(kù)進(jìn)行修改解幽，InnoDB引擎不僅會(huì)記錄redo log，還會(huì)生成對(duì)應(yīng)的undo log日志烘苹；如果事務(wù)執(zhí)行失敗或調(diào)用了rollback躲株，導(dǎo)致事務(wù)需要回滾，就可以利用undo log中的信息將數(shù)據(jù)回滾到修改之前的樣子镣衡。

20.binlog和redo log有什么區(qū)別霜定？

bin log會(huì)記錄所有與數(shù)據(jù)庫(kù)有關(guān)的日志記錄档悠，包括InnoDB、MyISAM等存儲(chǔ)引擎的日志，而redo log只記InnoDB存儲(chǔ)引擎的日志。

記錄的內(nèi)容不同吨瞎，bin log記錄的是關(guān)于一個(gè)事務(wù)的具體操作內(nèi)容彤路，即該日志是邏輯日志瑰妄。而redo log記錄的是關(guān)于每個(gè)頁(yè)（Page）的更改的物理情況。

寫(xiě)入的時(shí)間不同，bin log僅在事務(wù)提交前進(jìn)行提交，也就是只寫(xiě)磁盤(pán)一次酥宴。而在事務(wù)進(jìn)行的過(guò)程中，卻不斷有redo ertry被寫(xiě)入redo log中您觉。

寫(xiě)入的方式也不相同拙寡，redo log是循環(huán)寫(xiě)入和擦除，bin log是追加寫(xiě)入顾犹，不會(huì)覆蓋已經(jīng)寫(xiě)的文件倒庵。

21.一條更新語(yǔ)句怎么執(zhí)行的了解嗎？

更新語(yǔ)句的執(zhí)行是Server層和引擎層配合完成炫刷，數(shù)據(jù)除了要寫(xiě)入表中，還要記錄相應(yīng)的日志郁妈。

image.png

update執(zhí)行

執(zhí)行器先找引擎獲取ID=2這一行浑玛。ID是主鍵，存儲(chǔ)引擎檢索數(shù)據(jù)噩咪，找到這一行顾彰。如果ID=2這一行所在的數(shù)據(jù)頁(yè)本來(lái)就在內(nèi)存中，就直接返回給執(zhí)行器胃碾；否則涨享，需要先從磁盤(pán)讀入內(nèi)存，然后再返回仆百。

執(zhí)行器拿到引擎給的行數(shù)據(jù)厕隧，把這個(gè)值加上1，比如原來(lái)是N俄周，現(xiàn)在就是N+1吁讨，得到新的一行數(shù)據(jù)，再調(diào)用引擎接口寫(xiě)入這行新數(shù)據(jù)峦朗。

引擎將這行新數(shù)據(jù)更新到內(nèi)存中建丧，同時(shí)將這個(gè)更新操作記錄到redo log里面，此時(shí)redo log處于prepare狀態(tài)波势。然后告知執(zhí)行器執(zhí)行完成了翎朱，隨時(shí)可以提交事務(wù)橄维。

執(zhí)行器生成這個(gè)操作的binlog，并把binlog寫(xiě)入磁盤(pán)拴曲。

執(zhí)行器調(diào)用引擎的提交事務(wù)接口挣郭，引擎把剛剛寫(xiě)入的redo log改成提交（commit）狀態(tài)，更新完成疗韵。

從上圖可以看出兑障，MySQL在執(zhí)行更新語(yǔ)句的時(shí)候，在服務(wù)層進(jìn)行語(yǔ)句的解析和執(zhí)行蕉汪，在引擎層進(jìn)行數(shù)據(jù)的提取和存儲(chǔ)流译；同時(shí)在服務(wù)層對(duì)binlog進(jìn)行寫(xiě)入，在InnoDB內(nèi)進(jìn)行redo log的寫(xiě)入者疤。

不僅如此福澡，在對(duì)redo log寫(xiě)入時(shí)有兩個(gè)階段的提交，一是binlog寫(xiě)入之前prepare狀態(tài)的寫(xiě)入驹马，二是binlog寫(xiě)入之后commit狀態(tài)的寫(xiě)入革砸。

22.那為什么要兩階段提交呢？

為什么要兩階段提交呢糯累？直接提交不行嗎算利？

我們可以假設(shè)不采用兩階段提交的方式，而是采用“單階段”進(jìn)行提交泳姐，即要么先寫(xiě)入redo log效拭，后寫(xiě)入binlog；要么先寫(xiě)入binlog胖秒，后寫(xiě)入redo log缎患。這兩種方式的提交都會(huì)導(dǎo)致原先數(shù)據(jù)庫(kù)的狀態(tài)和被恢復(fù)后的數(shù)據(jù)庫(kù)的狀態(tài)不一致。

先寫(xiě)入redo log阎肝，后寫(xiě)入binlog：

在寫(xiě)完redo log之后挤渔，數(shù)據(jù)此時(shí)具有crash-safe能力，因此系統(tǒng)崩潰风题，數(shù)據(jù)會(huì)恢復(fù)成事務(wù)開(kāi)始之前的狀態(tài)判导。但是，若在redo log寫(xiě)完時(shí)候俯邓，binlog寫(xiě)入之前骡楼，系統(tǒng)發(fā)生了宕機(jī)。此時(shí)binlog沒(méi)有對(duì)上面的更新語(yǔ)句進(jìn)行保存稽鞭，導(dǎo)致當(dāng)使用binlog進(jìn)行數(shù)據(jù)庫(kù)的備份或者恢復(fù)時(shí)鸟整，就少了上述的更新語(yǔ)句。從而使得id=2這一行的數(shù)據(jù)沒(méi)有被更新朦蕴。

image.png

先寫(xiě)redo log篮条，后寫(xiě)bin log的問(wèn)題

先寫(xiě)入binlog弟头，后寫(xiě)入redo log：

寫(xiě)完binlog之后，所有的語(yǔ)句都被保存涉茧，所以通過(guò)binlog復(fù)制或恢復(fù)出來(lái)的數(shù)據(jù)庫(kù)中id=2這一行的數(shù)據(jù)會(huì)被更新為a=1赴恨。但是如果在redo log寫(xiě)入之前，系統(tǒng)崩潰伴栓，那么redo log中記錄的這個(gè)事務(wù)會(huì)無(wú)效伦连，導(dǎo)致實(shí)際數(shù)據(jù)庫(kù)中id=2這一行的數(shù)據(jù)并沒(méi)有更新。

image.png

先寫(xiě)bin log钳垮，后寫(xiě)redo log的問(wèn)題

簡(jiǎn)單說(shuō)惑淳，redo log和binlog都可以用于表示事務(wù)的提交狀態(tài)，而兩階段提交就是讓這兩個(gè)狀態(tài)保持邏輯上的一致饺窿。

23.redo log怎么刷入磁盤(pán)的知道嗎歧焦？

redo log的寫(xiě)入不是直接落到磁盤(pán)，而是在內(nèi)存中設(shè)置了一片稱之為redo log buffer的連續(xù)內(nèi)存空間肚医，也就是redo 日志緩沖區(qū)绢馍。

image.png

redo log緩沖

什么時(shí)候會(huì)刷入磁盤(pán)？

在如下的一些情況中肠套，log buffer的數(shù)據(jù)會(huì)刷入磁盤(pán)：

log buffer 空間不足時(shí)

log buffer 的大小是有限的舰涌，如果不停的往這個(gè)有限大小的 log buffer 里塞入日志，很快它就會(huì)被填滿糠排。如果當(dāng)前寫(xiě)入 log buffer 的redo 日志量已經(jīng)占滿了 log buffer 總?cè)萘康拇蠹s一半左右舵稠，就需要把這些日志刷新到磁盤(pán)上。

事務(wù)提交時(shí)

在事務(wù)提交時(shí)入宦，為了保證持久性，會(huì)把log buffer中的日志全部刷到磁盤(pán)室琢。注意乾闰，這時(shí)候，除了本事務(wù)的盈滴，可能還會(huì)刷入其它事務(wù)的日志涯肩。

后臺(tái)線程輸入

有一個(gè)后臺(tái)線程，大約每秒都會(huì)刷新一次log buffer中的redo log到磁盤(pán)巢钓。

正常關(guān)閉服務(wù)器時(shí)

觸發(fā)checkpoint規(guī)則

重做日志緩存病苗、重做日志文件都是以塊（block）的方式進(jìn)行保存的，稱之為重做日志塊（redo log block）,塊的大小是固定的512字節(jié)症汹。我們的redo log它是固定大小的硫朦，可以看作是一個(gè)邏輯上的 log group，由一定數(shù)量的log block 組成背镇。

image.png

redo log分塊和寫(xiě)入

它的寫(xiě)入方式是從頭到尾開(kāi)始寫(xiě)咬展，寫(xiě)到末尾又回到開(kāi)頭循環(huán)寫(xiě)泽裳。

其中有兩個(gè)標(biāo)記位置：

write pos是當(dāng)前記錄的位置，一邊寫(xiě)一邊后移破婆，寫(xiě)到第3號(hào)文件末尾后就回到0號(hào)文件開(kāi)頭涮总。checkpoint是當(dāng)前要擦除的位置，也是往后推移并且循環(huán)的祷舀，擦除記錄前要把記錄更新到磁盤(pán)瀑梗。

image.png

write pos和checkpoint

當(dāng)write_pos追上checkpoint時(shí)，表示redo log日志已經(jīng)寫(xiě)滿裳扯。這時(shí)候就不能接著往里寫(xiě)數(shù)據(jù)了抛丽，需要執(zhí)行checkpoint規(guī)則騰出可寫(xiě)空間。

所謂的checkpoint規(guī)則嚎朽，就是checkpoint觸發(fā)后铺纽，將buffer中日志頁(yè)都刷到磁盤(pán)。

SQL 優(yōu)化

24.慢SQL如何定位呢哟忍？

慢SQL的監(jiān)控主要通過(guò)兩個(gè)途徑：

image.png

發(fā)現(xiàn)慢SQL

慢查詢?nèi)罩?/strong>：開(kāi)啟MySQL的慢查詢?nèi)罩窘泼牛偻ㄟ^(guò)一些工具比如mysqldumpslow去分析對(duì)應(yīng)的慢查詢?nèi)罩荆?dāng)然現(xiàn)在一般的云廠商都提供了可視化的平臺(tái)锅很。

服務(wù)監(jiān)控：可以在業(yè)務(wù)的基建中加入對(duì)慢SQL的監(jiān)控其馏，常見(jiàn)的方案有字節(jié)碼插樁、連接池?cái)U(kuò)展爆安、ORM框架過(guò)程叛复，對(duì)服務(wù)運(yùn)行中的慢SQL進(jìn)行監(jiān)控和告警。

25.有哪些方式優(yōu)化慢SQL扔仓？

慢SQL的優(yōu)化褐奥，主要從兩個(gè)方面考慮，SQL語(yǔ)句本身的優(yōu)化翘簇，以及數(shù)據(jù)庫(kù)設(shè)計(jì)的優(yōu)化撬码。

image.png

SQL優(yōu)化

避免不必要的列

這個(gè)是老生常談，但還是經(jīng)常會(huì)出的情況版保，SQL查詢的時(shí)候呜笑，應(yīng)該只查詢需要的列，而不要包含額外的列彻犁，像slect * 這種寫(xiě)法應(yīng)該盡量避免叫胁。

分頁(yè)優(yōu)化

在數(shù)據(jù)量比較大，分頁(yè)比較深的情況下汞幢，需要考慮分頁(yè)的優(yōu)化驼鹅。

例如：

select * from table where type = 2 and level = 9 order by id asc limit 190289,10;

優(yōu)化方案：

延遲關(guān)聯(lián)先通過(guò)where條件提取出主鍵，在將該表與原數(shù)據(jù)表關(guān)聯(lián)，通過(guò)主鍵id提取數(shù)據(jù)行谤民，而不是通過(guò)原來(lái)的二級(jí)索引提取數(shù)據(jù)行例如：select a.* from table a,
(select id from table where type = 2 and level = 9 order by id asc limit 190289,10 ) b
where a.id = b.id

書(shū)簽方式書(shū)簽方式就是找到limit第一個(gè)參數(shù)對(duì)應(yīng)的主鍵值堰酿，根據(jù)這個(gè)主鍵值再去過(guò)濾并limit例如：

select * from table where id > (select * from table where type = 2 and level = 9 order by id asc limit 190

索引優(yōu)化

合理地設(shè)計(jì)和使用索引，是優(yōu)化慢SQL的利器张足。

利用覆蓋索引

InnoDB使用非主鍵索引查詢數(shù)據(jù)時(shí)會(huì)回表触创，但是如果索引的葉節(jié)點(diǎn)中已經(jīng)包含要查詢的字段，那它沒(méi)有必要再回表查詢了为牍，這就叫覆蓋索引

例如對(duì)于如下查詢：

select name from test where city='上海'

我們將被查詢的字段建立到聯(lián)合索引中哼绑，這樣查詢結(jié)果就可以直接從索引中獲取

alter table test add index idx_city_name (city, name);

低版本避免使用or查詢

在 MySQL 5.0 之前的版本要盡量避免使用 or 查詢，可以使用 union 或者子查詢來(lái)替代碉咆，因?yàn)樵缙诘?MySQL 版本使用 or 查詢可能會(huì)導(dǎo)致索引失效抖韩，高版本引入了索引合并，解決了這個(gè)問(wèn)題疫铜。

避免使用 != 或者 <> 操作符

SQL中茂浮，不等于操作符會(huì)導(dǎo)致查詢引擎放棄查詢索引，引起全表掃描壳咕，即使比較的字段上有索引

解決方法：通過(guò)把不等于操作符改成or席揽，可以使用索引，避免全表掃描

例如谓厘，把column<>’aaa’幌羞，改成column>’aaa’ or column<’aaa’，就可以使用索引了

適當(dāng)使用前綴索引

適當(dāng)?shù)厥褂们熬Y所云竟稳，可以降低索引的空間占用属桦，提高索引的查詢效率。

比如他爸，郵箱的后綴都是固定的“@xxx.com”聂宾，那么類(lèi)似這種后面幾位為固定值的字段就非常適合定義為前綴索引

alter table test add index index2(email(6));

PS:需要注意的是，前綴索引也存在缺點(diǎn)诊笤，MySQL無(wú)法利用前綴索引做order by和group by 操作亏吝，也無(wú)法作為覆蓋索引

避免列上函數(shù)運(yùn)算

要避免在列字段上進(jìn)行算術(shù)運(yùn)算或其他表達(dá)式運(yùn)算，否則可能會(huì)導(dǎo)致存儲(chǔ)引擎無(wú)法正確使用索引盏混，從而影響了查詢的效率

select * from test where id + 1 = 50; select * from test where month(updateTime) = 7;

正確使用聯(lián)合索引

使用聯(lián)合索引的時(shí)候，注意最左匹配原則惜论。

JOIN優(yōu)化

優(yōu)化子查詢

盡量使用 Join 語(yǔ)句來(lái)替代子查詢许赃，因?yàn)樽硬樵兪乔短撞樵儯短撞樵儠?huì)新創(chuàng)建一張臨時(shí)表馆类，而臨時(shí)表的創(chuàng)建與銷(xiāo)毀會(huì)占用一定的系統(tǒng)資源以及花費(fèi)一定的時(shí)間混聊，同時(shí)對(duì)于返回結(jié)果集比較大的子查詢，其對(duì)查詢性能的影響更大

小表驅(qū)動(dòng)大表

關(guān)聯(lián)查詢的時(shí)候要拿小表去驅(qū)動(dòng)大表乾巧，因?yàn)殛P(guān)聯(lián)的時(shí)候句喜，MySQL內(nèi)部會(huì)遍歷驅(qū)動(dòng)表预愤，再去連接被驅(qū)動(dòng)表。

比如left join咳胃，左表就是驅(qū)動(dòng)表植康，A表小于B表，建立連接的次數(shù)就少展懈，查詢速度就被加快了销睁。

select name from A left join B ;

適當(dāng)增加冗余字段

增加冗余字段可以減少大量的連表查詢，因?yàn)槎鄰埍淼倪B表查詢性能很低存崖，所有可以適當(dāng)?shù)脑黾尤哂嘧侄味臣牵詼p少多張表的關(guān)聯(lián)查詢，這是以空間換時(shí)間的優(yōu)化策略

避免使用JOIN關(guān)聯(lián)太多的表

《阿里巴巴Java開(kāi)發(fā)手冊(cè)》規(guī)定不要join超過(guò)三張表来惧，第一join太多降低查詢的速度冗栗，第二join的buffer會(huì)占用更多的內(nèi)存。

如果不可避免要join多張表供搀，可以考慮使用數(shù)據(jù)異構(gòu)的方式異構(gòu)到ES中查詢隅居。

排序優(yōu)化

利用索引掃描做排序

MySQL有兩種方式生成有序結(jié)果：其一是對(duì)結(jié)果集進(jìn)行排序的操作，其二是按照索引順序掃描得出的結(jié)果自然是有序的

但是如果索引不能覆蓋查詢所需列趁曼，就不得不每掃描一條記錄回表查詢一次军浆，這個(gè)讀操作是隨機(jī)IO，通常會(huì)比順序全表掃描還慢

因此挡闰，在設(shè)計(jì)索引時(shí)乒融，盡可能使用同一個(gè)索引既滿足排序又用于查找行

例如：

--建立索引（date,staff_id,customer_id） select staff_id, customer_id from test where date = '2010-01-01' order by staff_id,customer_id;

只有當(dāng)索引的列順序和ORDER BY子句的順序完全一致，并且所有列的排序方向都一樣時(shí)摄悯，才能夠使用索引來(lái)對(duì)結(jié)果做排序

UNION優(yōu)化

條件下推

MySQL處理union的策略是先創(chuàng)建臨時(shí)表赞季，然后將各個(gè)查詢結(jié)果填充到臨時(shí)表中最后再來(lái)做查詢，很多優(yōu)化策略在union查詢中都會(huì)失效奢驯，因?yàn)樗鼰o(wú)法利用索引

最好手工將where申钩、limit等子句下推到union的各個(gè)子查詢中，以便優(yōu)化器可以充分利用這些條件進(jìn)行優(yōu)化

此外瘪阁，除非確實(shí)需要服務(wù)器去重撒遣，一定要使用union all，如果不加all關(guān)鍵字管跺，MySQL會(huì)給臨時(shí)表加上distinct選項(xiàng)义黎，這會(huì)導(dǎo)致對(duì)整個(gè)臨時(shí)表做唯一性檢查，代價(jià)很高豁跑。

26.怎么看執(zhí)行計(jì)劃（explain）廉涕，如何理解其中各個(gè)字段的含義？

explain是sql優(yōu)化的利器，除了優(yōu)化慢sql狐蜕，平時(shí)的sql編寫(xiě)南蓬，也應(yīng)該先explain白对，查看一下執(zhí)行計(jì)劃衬浑，看看是否還有優(yōu)化的空間笑陈。

直接在 select 語(yǔ)句之前增加explain 關(guān)鍵字，就會(huì)返回執(zhí)行計(jì)劃的信息湃累。

image.png

explain

image.png

explain

id 列：MySQL會(huì)為每個(gè)select語(yǔ)句分配一個(gè)唯一的id值

select_type 列勃救，查詢的類(lèi)型，根據(jù)關(guān)聯(lián)治力、union蒙秒、子查詢等等分類(lèi)，常見(jiàn)的查詢類(lèi)型有SIMPLE宵统、PRIMARY晕讲。

table 列：表示 explain 的一行正在訪問(wèn)哪個(gè)表。

type 列：最重要的列之一马澈。表示關(guān)聯(lián)類(lèi)型或訪問(wèn)類(lèi)型瓢省，即 MySQL 決定如何查找表中的行。性能從最優(yōu)到最差分別為：system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

systemsystem：當(dāng)表僅有一行記錄時(shí)(系統(tǒng)表)痊班，數(shù)據(jù)量很少勤婚，往往不需要進(jìn)行磁盤(pán)IO，速度非车臃ィ快

constconst：表示查詢時(shí)命中 primary key 主鍵或者 unique 唯一索引馒胆，或者被連接的部分是一個(gè)常量(const)值。這類(lèi)掃描效率極高凝果，返回?cái)?shù)據(jù)量少祝迂，速度非常快器净。

eq_refeq_ref：查詢時(shí)命中主鍵primary key 或者 unique key索引型雳， type 就是 eq_ref。

ref_or_nullref_or_null：這種連接類(lèi)型類(lèi)似于 ref山害，區(qū)別在于 MySQL會(huì)額外搜索包含NULL值的行纠俭。

index_mergeindex_merge：使用了索引合并優(yōu)化方法，查詢使用了兩個(gè)以上的索引浪慌。

unique_subqueryunique_subquery：替換下面的 IN子查詢柑晒，子查詢返回不重復(fù)的集合。

index_subqueryindex_subquery：區(qū)別于unique_subquery眷射，用于非唯一索引，可以返回重復(fù)值。

rangerange：使用索引選擇行妖碉，僅檢索給定范圍內(nèi)的行涌庭。簡(jiǎn)單點(diǎn)說(shuō)就是針對(duì)一個(gè)有索引的字段，給定范圍檢索數(shù)據(jù)欧宜。在where語(yǔ)句中使用 bettween...and坐榆、<、>冗茸、<=席镀、in 等條件查詢 type 都是 range。

indexindex：Index 與ALL 其實(shí)都是讀全表夏漱，區(qū)別在于index是遍歷索引樹(shù)讀取豪诲，而ALL是從硬盤(pán)中讀取。

ALL就不用多說(shuō)了挂绰，全表掃描屎篱。

possible_keys 列：顯示查詢可能使用哪些索引來(lái)查找，使用索引優(yōu)化sql的時(shí)候比較重要葵蒂。

key 列：這一列顯示 mysql 實(shí)際采用哪個(gè)索引來(lái)優(yōu)化對(duì)該表的訪問(wèn)交播，判斷索引是否失效的時(shí)候常用。

key_len 列：顯示了 MySQL使用

ref 列：ref 列展示的就是與索引列作等值匹配的值践付，常見(jiàn)的有：const（常量）秦士，func，NULL永高，字段名隧土。

rows 列：這也是一個(gè)重要的字段，MySQL查詢優(yōu)化器根據(jù)統(tǒng)計(jì)信息乏梁，估算SQL要查到結(jié)果集需要掃描讀取的數(shù)據(jù)行數(shù)次洼，這個(gè)值非常直觀顯示SQL的效率好壞，原則上rows越少越好遇骑。

Extra 列：顯示不適合在其它列的額外信息卖毁，雖然叫額外，但是也有一些重要的信息：

Using index：表示MySQL將使用覆蓋索引落萎，以避免回表

Using where：表示會(huì)在存儲(chǔ)引擎檢索之后再進(jìn)行過(guò)濾

Using temporary ：表示對(duì)查詢結(jié)果排序時(shí)會(huì)使用一個(gè)臨時(shí)表亥啦。

索引

索引可以說(shuō)是MySQL面試中的重中之重，一定要徹底拿下练链。

27.能簡(jiǎn)單說(shuō)一下索引的分類(lèi)嗎翔脱？

從三個(gè)不同維度對(duì)索引分類(lèi)：

image.png

索引分類(lèi)

例如從基本使用使用的角度來(lái)講：

主鍵索引: InnoDB主鍵是默認(rèn)的索引，數(shù)據(jù)列不允許重復(fù)媒鼓，不允許為NULL届吁，一個(gè)表只能有一個(gè)主鍵错妖。

唯一索引: 數(shù)據(jù)列不允許重復(fù)，允許為NULL值疚沐，一個(gè)表允許多個(gè)列創(chuàng)建唯一索引暂氯。

普通索引: 基本的索引類(lèi)型，沒(méi)有唯一性的限制亮蛔，允許為NULL值痴施。

組合索引：多列值組成一個(gè)索引，用于組合搜索究流，效率大于索引合并

28.為什么使用索引會(huì)加快查詢辣吃？

傳統(tǒng)的查詢方法，是按照表的順序遍歷的芬探，不論查詢幾條數(shù)據(jù)神得，MySQL需要將表的數(shù)據(jù)從頭到尾遍歷一遍。

在我們添加完索引之后灯节，MySQL一般通過(guò)BTREE算法生成一個(gè)索引文件循头，在查詢數(shù)據(jù)庫(kù)時(shí)，找到索引文件進(jìn)行遍歷炎疆，在比較小的索引數(shù)據(jù)里查找卡骂，然后映射到對(duì)應(yīng)的數(shù)據(jù)，能大幅提升查找的效率形入。

和我們通過(guò)書(shū)的目錄全跨，去查找對(duì)應(yīng)的內(nèi)容，一樣的道理亿遂。

image.png

索引加快查詢遠(yuǎn)離

29.創(chuàng)建索引有哪些注意點(diǎn)浓若？

索引雖然是sql性能優(yōu)化的利器，但是索引的維護(hù)也是需要成本的蛇数，所以創(chuàng)建索引挪钓，也要注意：

索引應(yīng)該建在查詢應(yīng)用頻繁的字段在用于 where 判斷、 order 排序和 join 的(on)字段上創(chuàng)建索引耳舅。

索引的個(gè)數(shù)應(yīng)該適量索引需要占用空間碌上；更新時(shí)候也需要維護(hù)。

區(qū)分度低的字段浦徊，例如性別馏予，不要建索引。離散度太低的字段盔性，掃描的行數(shù)降低的有限霞丧。

頻繁更新的值，不要作為主鍵或者索引維護(hù)索引文件需要成本冕香；還會(huì)導(dǎo)致頁(yè)分裂蛹尝，IO次數(shù)增多后豫。

組合索引把散列性高(區(qū)分度高)的值放在前面為了滿足最左前綴匹配原則

創(chuàng)建組合索引，而不是修改單列索引箩言。組合索引代替多個(gè)單列索引（對(duì)于單列索引硬贯，MySQL基本只能使用一個(gè)索引，所以經(jīng)常使用多個(gè)條件查詢時(shí)更適合使用組合索引）

過(guò)長(zhǎng)的字段陨收，使用前綴索引。當(dāng)字段值比較長(zhǎng)的時(shí)候鸵赖，建立索引會(huì)消耗很多的空間务漩，搜索起來(lái)也會(huì)很慢。我們可以通過(guò)截取字段的前面一部分內(nèi)容建立索引它褪，這個(gè)就叫前綴索引饵骨。

不建議用無(wú)序的值(例如身份證、UUID )作為索引當(dāng)主鍵具有不確定性茫打，會(huì)造成葉子節(jié)點(diǎn)頻繁分裂居触，出現(xiàn)磁盤(pán)存儲(chǔ)的碎片化

30.索引哪些情況下會(huì)失效呢？

查詢條件包含or老赤，可能導(dǎo)致索引失效

如果字段類(lèi)型是字符串轮洋，where時(shí)一定用引號(hào)括起來(lái)，否則會(huì)因?yàn)殡[式類(lèi)型轉(zhuǎn)換抬旺，索引失效

like通配符可能導(dǎo)致索引失效弊予。

聯(lián)合索引，查詢時(shí)的條件列不是聯(lián)合索引中的第一個(gè)列开财，索引失效汉柒。

在索引列上使用mysql的內(nèi)置函數(shù)，索引失效责鳍。

對(duì)索引列運(yùn)算（如碾褂，+、-历葛、*正塌、/），索引失效啃洋。

索引字段上使用（传货！= 或者 < >，not in）時(shí)宏娄，可能會(huì)導(dǎo)致索引失效问裕。

索引字段上使用is null， is not null孵坚，可能導(dǎo)致索引失效粮宛。

左連接查詢或者右連接查詢查詢關(guān)聯(lián)的字段編碼格式不一樣窥淆，可能導(dǎo)致索引失效。

MySQL優(yōu)化器估計(jì)使用全表掃描要比使用索引快,則不使用索引巍杈。

31.索引不適合哪些場(chǎng)景呢忧饭？

數(shù)據(jù)量比較少的表不適合加索引

更新比較頻繁的字段也不適合加索引

離散低的字段不適合加索引（如性別）

32.索引是不是建的越多越好呢？

當(dāng)然不是筷畦。

索引會(huì)占據(jù)磁盤(pán)空間

索引雖然會(huì)提高查詢效率词裤，但是會(huì)降低更新表的效率。比如每次對(duì)表進(jìn)行增刪改操作鳖宾，MySQL不僅要保存數(shù)據(jù)吼砂，還有保存或者更新對(duì)應(yīng)的索引文件。

33.MySQL索引用的什么數(shù)據(jù)結(jié)構(gòu)了解嗎鼎文？

MySQL的默認(rèn)存儲(chǔ)引擎是InnoDB渔肩，它采用的是B+樹(shù)結(jié)構(gòu)的索引。

B+樹(shù)：只有葉子節(jié)點(diǎn)才會(huì)存儲(chǔ)數(shù)據(jù)拇惋，非葉子節(jié)點(diǎn)只存儲(chǔ)鍵值周偎。葉子節(jié)點(diǎn)之間使用雙向指針連接，最底層的葉子節(jié)點(diǎn)形成了一個(gè)雙向有序鏈表撑帖。

image.png

B+樹(shù)索引

在這張圖里蓉坎，有兩個(gè)重點(diǎn)：

最外面的方塊，的塊我們稱之為一個(gè)磁盤(pán)塊磷仰，可以看到每個(gè)磁盤(pán)塊包含幾個(gè)數(shù)據(jù)項(xiàng)（粉色所示）和指針（黃色/灰色所示）袍嬉，如根節(jié)點(diǎn)磁盤(pán)包含數(shù)據(jù)項(xiàng)17和35，包含指針P1灶平、P2伺通、P3，P1表示小于17的磁盤(pán)塊逢享，P2表示在17和35之間的磁盤(pán)塊罐监，P3表示大于35的磁盤(pán)塊。真實(shí)的數(shù)據(jù)存在于葉子節(jié)點(diǎn)即3瞒爬、4弓柱、5……、65侧但。非葉子節(jié)點(diǎn)只不存儲(chǔ)真實(shí)的數(shù)據(jù)矢空，只存儲(chǔ)指引搜索方向的數(shù)據(jù)項(xiàng)，如17禀横、35并不真實(shí)存在于數(shù)據(jù)表中屁药。

葉子節(jié)點(diǎn)之間使用雙向指針連接，最底層的葉子節(jié)點(diǎn)形成了一個(gè)雙向有序鏈表柏锄，可以進(jìn)行范圍查詢酿箭。

34.那一棵B+樹(shù)能存儲(chǔ)多少條數(shù)據(jù)呢复亏？

image.png

B+樹(shù)存儲(chǔ)數(shù)據(jù)條數(shù)

假設(shè)索引字段是 bigint 類(lèi)型，長(zhǎng)度為 8 字節(jié)缭嫡。指針大小在 InnoDB 源碼中設(shè)置為 6 字節(jié)缔御，這樣一共 14 字節(jié)。非葉子節(jié)點(diǎn)(一頁(yè))可以存儲(chǔ) 16384/14=1170 個(gè)這樣的單元(鍵值+指針)妇蛀，代表有 1170 個(gè)指針耕突。

樹(shù)深度為 2 的時(shí)候，有 1170^2 個(gè)葉子節(jié)點(diǎn)评架，可以存儲(chǔ)的數(shù)據(jù)為 1170117016=21902400有勾。

在查找數(shù)據(jù)時(shí)一次頁(yè)的查找代表一次 IO，也就是說(shuō)古程，一張 2000 萬(wàn)左右的表，查詢數(shù)據(jù)最多需要訪問(wèn) 3 次磁盤(pán)喊崖。

所以在 InnoDB 中 B+ 樹(shù)深度一般為 1-3 層挣磨，它就能滿足千萬(wàn)級(jí)的數(shù)據(jù)存儲(chǔ)。

35.為什么要用 B+ 樹(shù)荤懂，而不用普通二叉樹(shù)茁裙？

可以從幾個(gè)維度去看這個(gè)問(wèn)題，查詢是否夠快节仿，效率是否穩(wěn)定晤锥，存儲(chǔ)數(shù)據(jù)多少，以及查找磁盤(pán)次數(shù)廊宪。

為什么不用普通二叉樹(shù)矾瘾？

普通二叉樹(shù)存在退化的情況，如果它退化成鏈表箭启，相當(dāng)于全表掃描壕翩。平衡二叉樹(shù)相比于二叉查找樹(shù)來(lái)說(shuō)，查找效率更穩(wěn)定傅寡，總體的查找速度也更快放妈。

為什么不用平衡二叉樹(shù)呢？

讀取數(shù)據(jù)的時(shí)候荐操，是從磁盤(pán)讀到內(nèi)存芜抒。如果樹(shù)這種數(shù)據(jù)結(jié)構(gòu)作為索引，那每查找一次數(shù)據(jù)就需要從磁盤(pán)中讀取一個(gè)節(jié)點(diǎn)托启，也就是一個(gè)磁盤(pán)塊宅倒，但是平衡二叉樹(shù)可是每個(gè)節(jié)點(diǎn)只存儲(chǔ)一個(gè)鍵值和數(shù)據(jù)的，如果是 B+ 樹(shù)驾中，可以存儲(chǔ)更多的節(jié)點(diǎn)數(shù)據(jù)唉堪，樹(shù)的高度也會(huì)降低模聋，因此讀取磁盤(pán)的次數(shù)就降下來(lái)啦，查詢效率就快唠亚。

36.為什么用 B+ 樹(shù)而不用 B 樹(shù)呢链方？

B+相比較B樹(shù)，有這些優(yōu)勢(shì)：

它是 B Tree 的變種灶搜，B Tree 能解決的問(wèn)題祟蚀，它都能解決。B Tree 解決的兩大問(wèn)題：每個(gè)節(jié)點(diǎn)存儲(chǔ)更多關(guān)鍵字割卖；路數(shù)更多

掃庫(kù)前酿、掃表能力更強(qiáng)如果我們要對(duì)表進(jìn)行全表掃描，只需要遍歷葉子節(jié)點(diǎn)就可以了鹏溯，不需要遍歷整棵 B+Tree 拿到所有的數(shù)據(jù)罢维。

B+Tree 的磁盤(pán)讀寫(xiě)能力相對(duì)于 B Tree 來(lái)說(shuō)更強(qiáng)，IO次數(shù)更少根節(jié)點(diǎn)和枝節(jié)點(diǎn)不保存數(shù)據(jù)區(qū)丙挽，所以一個(gè)節(jié)點(diǎn)可以保存更多的關(guān)鍵字肺孵，一次磁盤(pán)加載的關(guān)鍵字更多，IO次數(shù)更少。

排序能力更強(qiáng)因?yàn)槿~子節(jié)點(diǎn)上有下一個(gè)數(shù)據(jù)區(qū)的指針，數(shù)據(jù)形成了鏈表楷兽。

效率更加穩(wěn)定B+Tree 永遠(yuǎn)是在葉子節(jié)點(diǎn)拿到數(shù)據(jù)，所以 IO 次數(shù)是穩(wěn)定的瑰艘。

37.Hash 索引和 B+ 樹(shù)索引區(qū)別是什么？

B+ 樹(shù)可以進(jìn)行范圍查詢肤舞，Hash 索引不能紫新。

B+ 樹(shù)支持聯(lián)合索引的最左側(cè)原則，Hash 索引不支持萨赁。

B+ 樹(shù)支持 order by 排序弊琴，Hash 索引不支持。

Hash 索引在等值查詢上比 B+ 樹(shù)效率更高杖爽。

B+ 樹(shù)使用 like 進(jìn)行模糊查詢的時(shí)候敲董，like 后面（比如 % 開(kāi)頭）的話可以起到優(yōu)化的作用，Hash 索引根本無(wú)法進(jìn)行模糊查詢慰安。

38.聚簇索引與非聚簇索引的區(qū)別腋寨？

首先理解聚簇索引不是一種新的索引，而是而是一種數(shù)據(jù)存儲(chǔ)方式化焕。聚簇表示數(shù)據(jù)行和相鄰的鍵值緊湊地存儲(chǔ)在一起萄窜。我們熟悉的兩種存儲(chǔ)引擎——MyISAM采用的是非聚簇索引，InnoDB采用的是聚簇索引。

可以這么說(shuō)：

索引的數(shù)據(jù)結(jié)構(gòu)是樹(shù)查刻，聚簇索引的索引和數(shù)據(jù)存儲(chǔ)在一棵樹(shù)上键兜，樹(shù)的葉子節(jié)點(diǎn)就是數(shù)據(jù)，非聚簇索引索引和數(shù)據(jù)不在一棵樹(shù)上穗泵。

image.png

聚簇索引和非聚簇索引

一個(gè)表中只能擁有一個(gè)聚簇索引普气，而非聚簇索引一個(gè)表可以存在多個(gè)。

聚簇索引佃延，索引中鍵值的邏輯順序決定了表中相應(yīng)行的物理順序现诀；索引，索引中索引的邏輯順序與磁盤(pán)上行的物理存儲(chǔ)順序不同履肃。

聚簇索引：物理存儲(chǔ)按照索引排序仔沿；非聚集索引：物理存儲(chǔ)不按照索引排序；

39.回表了解嗎尺棋？

在InnoDB存儲(chǔ)引擎里封锉，利用輔助索引查詢，先通過(guò)輔助索引找到主鍵索引的鍵值膘螟，再通過(guò)主鍵值查出主鍵索引里面沒(méi)有符合要求的數(shù)據(jù)烘浦，它比基于主鍵索引的查詢多掃描了一棵索引樹(shù)，這個(gè)過(guò)程就叫回表萍鲸。

例如:select * from user where name = ‘張三’;

image.png

InnoDB回表

40.覆蓋索引了解嗎？

在輔助索引里面擦俐，不管是單列索引還是聯(lián)合索引脊阴，如果 select 的數(shù)據(jù)列只用輔助索引中就能夠取得，不用去查主鍵索引蚯瞧，這時(shí)候使用的索引就叫做覆蓋索引嘿期，避免了回表。

比如埋合，select name from user where name = ‘張三’;

image.png

覆蓋索引

41.什么是最左前綴原則/最左匹配原則备徐？

注意：最左前綴原則、最左匹配原則甚颂、最左前綴匹配原則這三個(gè)都是一個(gè)概念蜜猾。

最左匹配原則：在InnoDB的聯(lián)合索引中，查詢的時(shí)候只有匹配了前一個(gè)/左邊的值之后振诬，才能匹配下一個(gè)蹭睡。

根據(jù)最左匹配原則，我們創(chuàng)建了一個(gè)組合索引赶么，如 (a1,a2,a3)肩豁，相當(dāng)于創(chuàng)建了（a1）、(a1,a2)和 (a1,a2,a3) 三個(gè)索引。

為什么不從最左開(kāi)始查清钥，就無(wú)法匹配呢琼锋？

比如有一個(gè)user表，我們給 name 和 age 建立了一個(gè)組合索引祟昭。

ALTER TABLE user add INDEX comidx_name_phone (name,age);

組合索引在 B+Tree 中是復(fù)合的數(shù)據(jù)結(jié)構(gòu)缕坎，它是按照從左到右的順序來(lái)建立搜索樹(shù)的 (name 在左邊，age 在右邊)从橘。

image.png

組合索引

從這張圖可以看出來(lái)念赶，name 是有序的，age 是無(wú)序的恰力。當(dāng) name 相等的時(shí)候叉谜， age 才是有序的。

這個(gè)時(shí)候我們使用 where name= ‘張三‘ and age = ‘20 ‘去查詢數(shù)據(jù)的時(shí)候踩萎， B+Tree 會(huì)優(yōu)先比較 name 來(lái)確定下一步應(yīng)該搜索的方向停局，往左還是往右。如果 name 相同的時(shí)候再比較age香府。但是如果查詢條件沒(méi)有 name董栽，就不知道下一步應(yīng)該查哪個(gè) 節(jié)點(diǎn)，因?yàn)榻⑺阉鳂?shù)的時(shí)候 name 是第一個(gè)比較因子企孩，所以就沒(méi)用上索引锭碳。

42.什么是索引下推優(yōu)化？

索引條件下推優(yōu)化（Index Condition Pushdown (ICP) ）是MySQL5.6添加的勿璃，用于優(yōu)化數(shù)據(jù)查詢擒抛。

不使用索引條件下推優(yōu)化時(shí)存儲(chǔ)引擎通過(guò)索引檢索到數(shù)據(jù)，然后返回給MySQL Server补疑，MySQL Server進(jìn)行過(guò)濾條件的判斷歧沪。

當(dāng)使用索引條件下推優(yōu)化時(shí)，如果存在某些被索引的列的判斷條件時(shí)莲组，MySQL Server將這一部分判斷條件下推給存儲(chǔ)引擎诊胞，然后由存儲(chǔ)引擎通過(guò)判斷索引是否符合MySQL Server傳遞的條件，只有當(dāng)索引符合條件時(shí)才會(huì)將數(shù)據(jù)檢索出來(lái)返回給MySQL服務(wù)器锹杈。

例如一張表撵孤，建了一個(gè)聯(lián)合索引（name, age），查詢語(yǔ)句：select * from t_user where name like '張%' and age=10;竭望，由于name使用了范圍查詢早直，根據(jù)最左匹配原則：

不使用ICP，引擎層查找到name like '張%'的數(shù)據(jù)市框，再由Server層去過(guò)濾age=10這個(gè)條件霞扬，這樣一來(lái)，就回表了兩次，浪費(fèi)了聯(lián)合索引的另外一個(gè)字段age喻圃。

image.png

沒(méi)有使用ICP

但是萤彩，使用了索引下推優(yōu)化，把where的條件放到了引擎層執(zhí)行斧拍，直接根據(jù)name like '張%' and age=10的條件進(jìn)行過(guò)濾雀扶，減少了回表的次數(shù)。

image.png

使用ICP

索引條件下推優(yōu)化可以減少存儲(chǔ)引擎查詢基礎(chǔ)表的次數(shù)肆汹，也可以減少M(fèi)ySQL服務(wù)器從存儲(chǔ)引擎接收數(shù)據(jù)的次數(shù)愚墓。

鎖

43.MySQL中有哪幾種鎖，列舉一下昂勉？

image.png

MySQL中的鎖

如果按鎖粒度劃分浪册，有以下3種：

表鎖：開(kāi)銷(xiāo)小，加鎖快岗照；鎖定力度大村象，發(fā)生鎖沖突概率高，并發(fā)度最低;不會(huì)出現(xiàn)死鎖攒至。

行鎖：開(kāi)銷(xiāo)大厚者，加鎖慢；會(huì)出現(xiàn)死鎖迫吐；鎖定粒度小库菲，發(fā)生鎖沖突的概率低，并發(fā)度高志膀。

頁(yè)鎖：開(kāi)銷(xiāo)和加鎖速度介于表鎖和行鎖之間蝙昙；會(huì)出現(xiàn)死鎖；鎖定粒度介于表鎖和行鎖之間梧却，并發(fā)度一般

如果按照兼容性，有兩種败去，

共享鎖（S Lock）,也叫讀鎖（read lock）放航，相互不阻塞。

排他鎖（X Lock）圆裕，也叫寫(xiě)鎖（write lock）广鳍，排它鎖是阻塞的，在一定時(shí)間內(nèi)吓妆，只有一個(gè)請(qǐng)求能執(zhí)行寫(xiě)入赊时，并阻止其它鎖讀取正在寫(xiě)入的數(shù)據(jù)。

44.說(shuō)說(shuō)InnoDB里的行鎖實(shí)現(xiàn)?

我們拿這么一個(gè)用戶表來(lái)表示行級(jí)鎖行拢，其中插入了4行數(shù)據(jù)祖秒，主鍵值分別是1,6,8,12，現(xiàn)在簡(jiǎn)化它的聚簇索引結(jié)構(gòu)，只保留數(shù)據(jù)記錄竭缝。

image.png

簡(jiǎn)化的主鍵索引

InnoDB的行鎖的主要實(shí)現(xiàn)如下：

Record Lock 記錄鎖

記錄鎖就是直接鎖定某行記錄房维。當(dāng)我們使用唯一性的索引(包括唯一索引和聚簇索引)進(jìn)行等值查詢且精準(zhǔn)匹配到一條記錄時(shí)，此時(shí)就會(huì)直接將這條記錄鎖定抬纸。例如select * from t where id =6 for update;就會(huì)將id=6的記錄鎖定咙俩。

image.png

記錄鎖

Gap Lock 間隙鎖

間隙鎖(Gap Locks) 的間隙指的是兩個(gè)記錄之間邏輯上尚未填入數(shù)據(jù)的部分,是一個(gè)左開(kāi)右開(kāi)空間。

image.png

間隙鎖

間隙鎖就是鎖定某些間隙區(qū)間的湿故。當(dāng)我們使用用等值查詢或者范圍查詢阿趁，并且沒(méi)有命中任何一個(gè)record，此時(shí)就會(huì)將對(duì)應(yīng)的間隙區(qū)間鎖定坛猪。例如select * from t where id =3 for update;或者select * from t where id > 1 and id < 6 for update;就會(huì)將(1,6)區(qū)間鎖定脖阵。

Next-key Lock 臨鍵鎖

臨鍵指的是間隙加上它右邊的記錄組成的左開(kāi)右閉區(qū)間。比如上述的(1,6]砚哆、(6,8]等独撇。

image.png

臨鍵鎖

臨鍵鎖就是記錄鎖(Record Locks)和間隙鎖(Gap Locks)的結(jié)合，即除了鎖住記錄本身躁锁，還要再鎖住索引之間的間隙纷铣。當(dāng)我們使用范圍查詢，并且命中了部分record記錄战转，此時(shí)鎖住的就是臨鍵區(qū)間搜立。注意，臨鍵鎖鎖住的區(qū)間會(huì)包含最后一個(gè)record的右邊的臨鍵區(qū)間槐秧。例如select * from t where id > 5 and id <= 7 for update;會(huì)鎖住(4,7]啄踊、(7,+∞)。mysql默認(rèn)行鎖類(lèi)型就是臨鍵鎖(Next-Key Locks)刁标。當(dāng)使用唯一性索引颠通，等值查詢匹配到一條記錄的時(shí)候，臨鍵鎖(Next-Key Locks)會(huì)退化成記錄鎖膀懈；沒(méi)有匹配到任何記錄的時(shí)候顿锰，退化成間隙鎖。

間隙鎖(Gap Locks)和臨鍵鎖(Next-Key Locks)都是用來(lái)解決幻讀問(wèn)題的启搂，在已提交讀（READ COMMITTED）隔離級(jí)別下硼控，間隙鎖(Gap Locks)和臨鍵鎖(Next-Key Locks)都會(huì)失效！

上面是行鎖的三種實(shí)現(xiàn)算法胳赌，除此之外牢撼，在行上還存在插入意向鎖。

Insert Intention Lock 插入意向鎖

一個(gè)事務(wù)在插入一條記錄時(shí)需要判斷一下插入位置是不是被別的事務(wù)加了意向鎖疑苫，如果有的話熏版，插入操作需要等待纷责，直到擁有 gap鎖的那個(gè)事務(wù)提交。但是事務(wù)在等待的時(shí)候也需要在內(nèi)存中生成一個(gè) 鎖結(jié)構(gòu) 纳决，表明有事務(wù)想在某個(gè) 間隙中插入新記錄碰逸，但是現(xiàn)在在等待。這種類(lèi)型的鎖命名為 Insert Intention Locks 阔加，也就是插入意向鎖饵史。

假如我們有個(gè)T1事務(wù)，給(1,6)區(qū)間加上了意向鎖胜榔，現(xiàn)在有個(gè)T2事務(wù)胳喷，要插入一個(gè)數(shù)據(jù)，id為4夭织，它會(huì)獲取一個(gè)（1,6）區(qū)間的插入意向鎖吭露，又有有個(gè)T3事務(wù)，想要插入一個(gè)數(shù)據(jù)尊惰，id為3讲竿，它也會(huì)獲取一個(gè)（1,6）區(qū)間的插入意向鎖，但是弄屡，這兩個(gè)插入意向鎖鎖不會(huì)互斥题禀。

image.png

插入意向鎖

45.意向鎖是什么知道嗎？

意向鎖是一個(gè)表級(jí)鎖膀捷，不要和插入意向鎖搞混迈嘹。

意向鎖的出現(xiàn)是為了支持InnoDB的多粒度鎖，它解決的是表鎖和行鎖共存的問(wèn)題全庸。

當(dāng)我們需要給一個(gè)表加表鎖的時(shí)候秀仲，我們需要根據(jù)去判斷表中有沒(méi)有數(shù)據(jù)行被鎖定，以確定是否能加成功壶笼。

假如沒(méi)有意向鎖神僵，那么我們就得遍歷表中所有數(shù)據(jù)行來(lái)判斷有沒(méi)有行鎖；

有了意向鎖這個(gè)表級(jí)鎖之后覆劈，則我們直接判斷一次就知道表中是否有數(shù)據(jù)行被鎖定了保礼。

有了意向鎖之后，要執(zhí)行的事務(wù)A在申請(qǐng)行鎖（寫(xiě)鎖）之前墩崩，數(shù)據(jù)庫(kù)會(huì)自動(dòng)先給事務(wù)A申請(qǐng)表的意向排他鎖。當(dāng)事務(wù)B去申請(qǐng)表的互斥鎖時(shí)就會(huì)失敗侯勉，因?yàn)楸砩嫌幸庀蚺潘i之后事務(wù)B申請(qǐng)表的互斥鎖時(shí)會(huì)被阻塞鹦筹。

image.png

意向鎖

46.MySQL的樂(lè)觀鎖和悲觀鎖了解嗎？

悲觀鎖（Pessimistic Concurrency Control）：

悲觀鎖認(rèn)為被它保護(hù)的數(shù)據(jù)是極其不安全的址貌，每時(shí)每刻都有可能被改動(dòng)铐拐，一個(gè)事務(wù)拿到悲觀鎖后徘键，其他任何事務(wù)都不能對(duì)該數(shù)據(jù)進(jìn)行修改，只能等待鎖被釋放才可以執(zhí)行遍蟋。

數(shù)據(jù)庫(kù)中的行鎖吹害，表鎖，讀鎖虚青，寫(xiě)鎖均為悲觀鎖它呀。

樂(lè)觀鎖（Optimistic Concurrency Control）

樂(lè)觀鎖認(rèn)為數(shù)據(jù)的變動(dòng)不會(huì)太頻繁。

樂(lè)觀鎖通常是通過(guò)在表中增加一個(gè)版本(version)或時(shí)間戳(timestamp)來(lái)實(shí)現(xiàn)抢野，其中，版本最為常用昧互。

事務(wù)在從數(shù)據(jù)庫(kù)中取數(shù)據(jù)時(shí)玖雁，會(huì)將該數(shù)據(jù)的版本也取出來(lái)(v1)，當(dāng)事務(wù)對(duì)數(shù)據(jù)變動(dòng)完畢想要將其更新到表中時(shí)辽幌，會(huì)將之前取出的版本v1與數(shù)據(jù)中最新的版本v2相對(duì)比猪腕，如果v1=v2，那么說(shuō)明在數(shù)據(jù)變動(dòng)期間，沒(méi)有其他事務(wù)對(duì)數(shù)據(jù)進(jìn)行修改，此時(shí)剪侮，就允許事務(wù)對(duì)表中的數(shù)據(jù)進(jìn)行修改绪爸，并且修改時(shí)version會(huì)加1廊遍，以此來(lái)表明數(shù)據(jù)已被變動(dòng)。

如果挂疆，v1不等于v2，那么說(shuō)明數(shù)據(jù)變動(dòng)期間锈拨，數(shù)據(jù)被其他事務(wù)改動(dòng)了砌庄，此時(shí)不允許數(shù)據(jù)更新到表中，一般的處理辦法是通知用戶讓其重新操作奕枢。不同于悲觀鎖鹤耍，樂(lè)觀鎖通常是由開(kāi)發(fā)者實(shí)現(xiàn)的。

47.MySQL 遇到過(guò)死鎖問(wèn)題嗎验辞，你是如何解決的稿黄？

排查死鎖的一般步驟是這樣的：

（1）查看死鎖日志 show engine innodb status;

（2）找出死鎖 sql

（3）分析 sql 加鎖情況

（4）模擬死鎖案發(fā)

（5）分析死鎖日志

（6）分析死鎖結(jié)果

當(dāng)然，這只是一個(gè)簡(jiǎn)單的流程說(shuō)明跌造，實(shí)際上生產(chǎn)中的死鎖千奇百怪杆怕，排查和解決起來(lái)沒(méi)那么簡(jiǎn)單。

事務(wù)

48.MySQL 事務(wù)的四大特性說(shuō)一下壳贪？

image.png

事務(wù)四大特性

原子性：事務(wù)作為一個(gè)整體被執(zhí)行陵珍，包含在其中的對(duì)數(shù)據(jù)庫(kù)的操作要么全部被執(zhí)行，要么都不執(zhí)行违施。

一致性：指在事務(wù)開(kāi)始之前和事務(wù)結(jié)束以后互纯，數(shù)據(jù)不會(huì)被破壞，假如 A 賬戶給 B 賬戶轉(zhuǎn) 10 塊錢(qián)磕蒲，不管成功與否留潦，A 和 B 的總金額是不變的。

隔離性：多個(gè)事務(wù)并發(fā)訪問(wèn)時(shí)辣往，事務(wù)之間是相互隔離的兔院，即一個(gè)事務(wù)不影響其它事務(wù)運(yùn)行效果。簡(jiǎn)言之站削，就是事務(wù)之間是進(jìn)水不犯河水的坊萝。

持久性：表示事務(wù)完成以后，該事務(wù)對(duì)數(shù)據(jù)庫(kù)所作的操作更改，將持久地保存在數(shù)據(jù)庫(kù)之中十偶。

49.那ACID靠什么保證的呢菩鲜？

事務(wù)的隔離性是通過(guò)數(shù)據(jù)庫(kù)鎖的機(jī)制實(shí)現(xiàn)的。

事務(wù)的一致性由undo log來(lái)保證：undo log是邏輯日志惦积，記錄了事務(wù)的insert睦袖、update、deltete操作丧鸯，回滾的時(shí)候做相反的delete躁锡、update、insert操作來(lái)恢復(fù)數(shù)據(jù)。

事務(wù)的原子性和持久性由redo log來(lái)保證：redolog被稱作重做日志京髓，是物理日志，事務(wù)提交的時(shí)候让蕾，必須先將事務(wù)的所有日志寫(xiě)入redo log持久化铡俐，到事務(wù)的提交操作才算完成。

image.png

ACID靠什么保證

50.事務(wù)的隔離級(jí)別有哪些招刹？MySQL 的默認(rèn)隔離級(jí)別是什么恬试？

image.png

事務(wù)的四個(gè)隔離級(jí)別

讀未提交（Read Uncommitted）

讀已提交（Read Committed）

可重復(fù)讀（Repeatable Read）

串行化（Serializable）

MySQL默認(rèn)的事務(wù)隔離級(jí)別是可重復(fù)讀 (Repeatable Read)。

51.什么是幻讀疯暑，臟讀训柴，不可重復(fù)讀呢？

事務(wù) A妇拯、B 交替執(zhí)行幻馁，事務(wù) A 讀取到事務(wù) B 未提交的數(shù)據(jù)，這就是臟讀越锈。

在一個(gè)事務(wù)范圍內(nèi)仗嗦，兩個(gè)相同的查詢，讀取同一條記錄甘凭，卻返回了不同的數(shù)據(jù)稀拐，這就是不可重復(fù)讀。

事務(wù) A 查詢一個(gè)范圍的結(jié)果集丹弱，另一個(gè)并發(fā)事務(wù) B 往這個(gè)范圍中插入 / 刪除了數(shù)據(jù)德撬，并靜悄悄地提交，然后事務(wù) A 再次查詢相同的范圍躲胳，兩次讀取得到的結(jié)果集不一樣了砰逻，這就是幻讀。

不同的隔離級(jí)別泛鸟，在并發(fā)事務(wù)下可能會(huì)發(fā)生的問(wèn)題：

隔離級(jí)別臟讀不可重復(fù)讀幻讀Read Uncommited 讀取未提交是是是Read Commited 讀取已提交否是否Repeatable Read 可重復(fù)讀否否是Serialzable 可串行化否否否

52.事務(wù)的各個(gè)隔離級(jí)別都是如何實(shí)現(xiàn)的蝠咆？

讀未提交

讀未提交，就不用多說(shuō)了，采取的是讀不加鎖原理刚操。

事務(wù)讀不加鎖闸翅，不阻塞其他事務(wù)的讀和寫(xiě)

事務(wù)寫(xiě)阻塞其他事務(wù)寫(xiě)，但不阻塞其他事務(wù)讀菊霜；

讀取已提交&可重復(fù)讀

讀取已提交和可重復(fù)讀級(jí)別利用了ReadView和MVCC坚冀，也就是每個(gè)事務(wù)只能讀取它能看到的版本（ReadView）。

READ COMMITTED：每次讀取數(shù)據(jù)前都生成一個(gè)ReadView

REPEATABLE READ ：在第一次讀取數(shù)據(jù)時(shí)生成一個(gè)ReadView

串行化

串行化的實(shí)現(xiàn)采用的是讀寫(xiě)都加鎖的原理鉴逞。

串行化的情況下记某，對(duì)于同一行事務(wù)，寫(xiě)會(huì)加寫(xiě)鎖构捡，讀會(huì)加讀鎖液南。當(dāng)出現(xiàn)讀寫(xiě)鎖沖突的時(shí)候，后訪問(wèn)的事務(wù)必須等前一個(gè)事務(wù)執(zhí)行完成勾徽，才能繼續(xù)執(zhí)行滑凉。

53.MVCC了解嗎？怎么實(shí)現(xiàn)的喘帚？

MVCC(Multi Version Concurrency Control)畅姊，中文名是多版本并發(fā)控制，簡(jiǎn)單來(lái)說(shuō)就是通過(guò)維護(hù)數(shù)據(jù)歷史版本吹由，從而解決并發(fā)訪問(wèn)情況下的讀一致性問(wèn)題若未。關(guān)于它的實(shí)現(xiàn)，要抓住幾個(gè)關(guān)鍵點(diǎn)倾鲫，隱式字段陨瘩、undo日志、版本鏈级乍、快照讀&當(dāng)前讀舌劳、Read View。

版本鏈

對(duì)于InnoDB存儲(chǔ)引擎玫荣，每一行記錄都有兩個(gè)隱藏列DB_TRX_ID甚淡、DB_ROLL_PTR

DB_TRX_ID，事務(wù)ID捅厂，每次修改時(shí)贯卦，都會(huì)把該事務(wù)ID復(fù)制給DB_TRX_ID；

DB_ROLL_PTR焙贷，回滾指針撵割，指向回滾段的undo日志。

image.png

表隱藏列

假如有一張user表辙芍，表中只有一行記錄啡彬，當(dāng)時(shí)插入的事務(wù)id為80羹与。此時(shí)，該條記錄的示例圖如下：

image.png

在這里插入圖片描述

接下來(lái)有兩個(gè)DB_TRX_ID分別為100庶灿、200的事務(wù)對(duì)這條記錄進(jìn)行update操作纵搁，整個(gè)過(guò)程如下：

image.png

update操作

由于每次變動(dòng)都會(huì)先把undo日志記錄下來(lái)，并用DB_ROLL_PTR指向undo日志地址往踢。因此可以認(rèn)為腾誉，對(duì)該條記錄的修改日志串聯(lián)起來(lái)就形成了一個(gè)版本鏈，版本鏈的頭節(jié)點(diǎn)就是當(dāng)前記錄最新的值峻呕。如下：

image.png

MVCC

ReadView

對(duì)于Read Committed和Repeatable Read隔離級(jí)別來(lái)說(shuō)利职，都需要讀取已經(jīng)提交的事務(wù)所修改的記錄，也就是說(shuō)如果版本鏈中某個(gè)版本的修改沒(méi)有提交瘦癌，那么該版本的記錄時(shí)不能被讀取的猪贪。所以需要確定在Read Committed和Repeatable Read隔離級(jí)別下，版本鏈中哪個(gè)版本是能被當(dāng)前事務(wù)讀取的佩憾。于是就引入了ReadView這個(gè)概念來(lái)解決這個(gè)問(wèn)題。

Read View就是事務(wù)執(zhí)行快照讀時(shí)干花，產(chǎn)生的讀視圖妄帘，相當(dāng)于某時(shí)刻表記錄的一個(gè)快照，通過(guò)這個(gè)快照池凄，我們可以獲嚷胀铡：

image.png

事務(wù)和ReadView

m_ids ：表示在生成 ReadView 時(shí)當(dāng)前系統(tǒng)中活躍的讀寫(xiě)事務(wù)的事務(wù)id 列表。

min_trx_id ：表示在生成 ReadView 時(shí)當(dāng)前系統(tǒng)中活躍的讀寫(xiě)事務(wù)中最小的事務(wù)id 肿仑，也就是 m_ids 中的最小值致盟。

max_trx_id ：表示生成 ReadView 時(shí)系統(tǒng)中應(yīng)該分配給下一個(gè)事務(wù)的 id 值。

creator_trx_id ：表示生成該 ReadView 的事務(wù)的事務(wù)id

有了這個(gè) ReadView 尤慰，這樣在訪問(wèn)某條記錄時(shí)馏锡，只需要按照下邊的步驟判斷記錄的某個(gè)版本是否可見(jiàn)：

如果被訪問(wèn)版本的 DB_TRX_ID 屬性值與 ReadView 中的 creator_trx_id 值相同，意味著當(dāng)前事務(wù)在訪問(wèn)它自己修改過(guò)的記錄伟端，所以該版本可以被當(dāng)前事務(wù)訪問(wèn)杯道。

如果被訪問(wèn)版本的 DB_TRX_ID 屬性值小于 ReadView 中的 min_trx_id 值，表明生成該版本的事務(wù)在當(dāng)前事務(wù)生成 ReadView 前已經(jīng)提交责蝠，所以該版本可以被當(dāng)前事務(wù)訪問(wèn)党巾。

如果被訪問(wèn)版本的 DB_TRX_ID 屬性值大于 ReadView 中的 max_trx_id 值，表明生成該版本的事務(wù)在當(dāng)前事務(wù)生成 ReadView 后才開(kāi)啟霜医，所以該版本不可以被當(dāng)前事務(wù)訪問(wèn)齿拂。

如果被訪問(wèn)版本的 DB_TRX_ID 屬性值在 ReadView 的 min_trx_id 和 max_trx_id 之間，那就需要判斷一下trx_id 屬性值是不是在 m_ids 列表中肴敛，如果在署海，說(shuō)明創(chuàng)建 ReadView 時(shí)生成該版本的事務(wù)還是活躍的吗购，該版本不可以被訪問(wèn)；如果不在叹侄，說(shuō)明創(chuàng)建 ReadView 時(shí)生成該版本的事務(wù)已經(jīng)被提交巩搏，該版本可以被訪問(wèn)。

如果某個(gè)版本的數(shù)據(jù)對(duì)當(dāng)前事務(wù)不可見(jiàn)的話趾代，那就順著版本鏈找到下一個(gè)版本的數(shù)據(jù)贯底，繼續(xù)按照上邊的步驟判斷可見(jiàn)性，依此類(lèi)推撒强，直到版本鏈中的最后一個(gè)版本禽捆。如果最后一個(gè)版本也不可見(jiàn)的話，那么就意味著該條記錄對(duì)該事務(wù)完全不可見(jiàn)飘哨，查詢結(jié)果就不包含該記錄胚想。

在 MySQL 中， READ COMMITTED 和 REPEATABLE READ 隔離級(jí)別的的一個(gè)非常大的區(qū)別就是它們生成ReadView的時(shí)機(jī)不同芽隆。

READ COMMITTED 是每次讀取數(shù)據(jù)前都生成一個(gè)ReadView浊服，這樣就能保證自己每次都能讀到其它事務(wù)提交的數(shù)據(jù)；REPEATABLE READ 是在第一次讀取數(shù)據(jù)時(shí)生成一個(gè)ReadView胚吁，這樣就能保證后續(xù)讀取的結(jié)果完全一致牙躺。

高可用/性能

54.數(shù)據(jù)庫(kù)讀寫(xiě)分離了解嗎？

讀寫(xiě)分離的基本原理是將數(shù)據(jù)庫(kù)讀寫(xiě)操作分散到不同的節(jié)點(diǎn)上腕扶，下面是基本架構(gòu)圖：

image.png

讀寫(xiě)分離

讀寫(xiě)分離的基本實(shí)現(xiàn)是:

數(shù)據(jù)庫(kù)服務(wù)器搭建主從集群孽拷，一主一從、一主多從都可以半抱。

數(shù)據(jù)庫(kù)主機(jī)負(fù)責(zé)讀寫(xiě)操作脓恕，從機(jī)只負(fù)責(zé)讀操作。

數(shù)據(jù)庫(kù)主機(jī)通過(guò)復(fù)制將數(shù)據(jù)同步到從機(jī)窿侈，每臺(tái)數(shù)據(jù)庫(kù)服務(wù)器都存儲(chǔ)了所有的業(yè)務(wù)數(shù)據(jù)炼幔。

業(yè)務(wù)服務(wù)器將寫(xiě)操作發(fā)給數(shù)據(jù)庫(kù)主機(jī)，將讀操作發(fā)給數(shù)據(jù)庫(kù)從機(jī)史简。

55.那讀寫(xiě)分離的分配怎么實(shí)現(xiàn)呢江掩？

將讀寫(xiě)操作區(qū)分開(kāi)來(lái)，然后訪問(wèn)不同的數(shù)據(jù)庫(kù)服務(wù)器乘瓤，一般有兩種方式：程序代碼封裝和中間件封裝环形。

程序代碼封裝

程序代碼封裝指在代碼中抽象一個(gè)數(shù)據(jù)訪問(wèn)層（所以有的文章也稱這種方式為 "中間層封裝" ），實(shí)現(xiàn)讀寫(xiě)操作分離和數(shù)據(jù)庫(kù)服務(wù)器連接的管理衙傀。例如抬吟，基于 Hibernate 進(jìn)行簡(jiǎn)單封裝，就可以實(shí)現(xiàn)讀寫(xiě)分離：

image.png

業(yè)務(wù)代碼封裝

目前開(kāi)源的實(shí)現(xiàn)方案中统抬，淘寶的 TDDL (Taobao Distributed Data Layer, 外號(hào)：頭都大了）是比較有名的火本。

中間件封裝

中間件封裝指的是獨(dú)立一套系統(tǒng)出來(lái)危队，實(shí)現(xiàn)讀寫(xiě)操作分離和數(shù)據(jù)庫(kù)服務(wù)器連接的管理。中間件對(duì)業(yè)務(wù)服務(wù)器提供 SQL 兼容的協(xié)議钙畔，業(yè)務(wù)服務(wù)器無(wú)須自己進(jìn)行讀寫(xiě)分離茫陆。

對(duì)于業(yè)務(wù)服務(wù)器來(lái)說(shuō)，訪問(wèn)中間件和訪問(wèn)數(shù)據(jù)庫(kù)沒(méi)有區(qū)別擎析，事實(shí)上在業(yè)務(wù)服務(wù)器看來(lái)簿盅，中間件就是一個(gè)數(shù)據(jù)庫(kù)服務(wù)器。

其基本架構(gòu)是：

image.png

數(shù)據(jù)庫(kù)中間件

56.主從復(fù)制原理了解嗎揍魂？

master數(shù)據(jù)寫(xiě)入桨醋，更新binlog

master創(chuàng)建一個(gè)dump線程向slave推送binlog

slave連接到master的時(shí)候，會(huì)創(chuàng)建一個(gè)IO線程接收binlog现斋，并記錄到relay log中繼日志中

slave再開(kāi)啟一個(gè)sql線程讀取relay log事件并在slave執(zhí)行喜最，完成同步

slave記錄自己的binglog

image.png

主從復(fù)制

57.主從同步延遲怎么處理？

主從同步延遲的原因

一個(gè)服務(wù)器開(kāi)放Ｎ個(gè)鏈接給客戶端來(lái)連接的庄蹋，這樣有會(huì)有大并發(fā)的更新操作, 但是從服務(wù)器的里面讀取 binlog 的線程僅有一個(gè)瞬内，當(dāng)某個(gè) SQL 在從服務(wù)器上執(zhí)行的時(shí)間稍長(zhǎng) 或者由于某個(gè) SQL 要進(jìn)行鎖表就會(huì)導(dǎo)致，主服務(wù)器的 SQL 大量積壓限书，未被同步到從服務(wù)器里虫蝶。這就導(dǎo)致了主從不一致，也就是主從延遲蔗包。

主從同步延遲的解決辦法

解決主從復(fù)制延遲有幾種常見(jiàn)的方法:

寫(xiě)操作后的讀操作指定發(fā)給數(shù)據(jù)庫(kù)主服務(wù)器

例如秉扑，注冊(cè)賬號(hào)完成后慧邮，登錄時(shí)讀取賬號(hào)的讀操作也發(fā)給數(shù)據(jù)庫(kù)主服務(wù)器调限。這種方式和業(yè)務(wù)強(qiáng)綁定，對(duì)業(yè)務(wù)的侵入和影響較大误澳，如果哪個(gè)新來(lái)的程序員不知道這樣寫(xiě)代碼耻矮，就會(huì)導(dǎo)致一個(gè)bug。

讀從機(jī)失敗后再讀一次主機(jī)

這就是通常所說(shuō)的 "二次讀取" 忆谓，二次讀取和業(yè)務(wù)無(wú)綁定裆装，只需要對(duì)底層數(shù)據(jù)庫(kù)訪問(wèn)的 API 進(jìn)行封裝即可，實(shí)現(xiàn)代價(jià)較小倡缠，不足之處在于如果有很多二次讀取哨免，將大大增加主機(jī)的讀操作壓力。例如昙沦，黑客暴力破解賬號(hào)琢唾，會(huì)導(dǎo)致大量的二次讀取操作，主機(jī)可能頂不住讀操作的壓力從而崩潰盾饮。

關(guān)鍵業(yè)務(wù)讀寫(xiě)操作全部指向主機(jī)采桃，非關(guān)鍵業(yè)務(wù)采用讀寫(xiě)分離

例如懒熙，對(duì)于一個(gè)用戶管理系統(tǒng)來(lái)說(shuō)，注冊(cè) + 登錄的業(yè)務(wù)讀寫(xiě)操作全部訪問(wèn)主機(jī)普办，用戶的介紹工扎、爰好、等級(jí)等業(yè)務(wù)衔蹲，可以采用讀寫(xiě)分離肢娘，因?yàn)榧词褂脩舾牧俗约旱淖晕医榻B，在查詢時(shí)卻看到了自我介紹還是舊的踪危，業(yè)務(wù)影響與不能登錄相比就小很多蔬浙，還可以忍受。

58.你們一般是怎么分庫(kù)的呢贞远？

垂直分庫(kù)：以表為依據(jù)畴博，按照業(yè)務(wù)歸屬不同，將不同的表拆分到不同的庫(kù)中蓝仲。

image.png

垂直分庫(kù)

水平分庫(kù)：以字段為依據(jù)俱病，按照一定策略（hash、range 等）袱结，將一個(gè)庫(kù)中的數(shù)據(jù)拆分到多個(gè)庫(kù)中亮隙。

image.png

水平分庫(kù)

59.那你們是怎么分表的？

水平分表：以字段為依據(jù)垢夹，按照一定策略（hash溢吻、range 等），將一個(gè)表中的數(shù)據(jù)拆分到多個(gè)表中果元。

垂直分表：以字段為依據(jù)促王，按照字段的活躍性，將表中字段拆到不同的表（主表和擴(kuò)展表）中而晒。

image.png

表拆分

60.水平分表有哪幾種路由方式蝇狼？

什么是路由呢？就是數(shù)據(jù)應(yīng)該分到哪一張表倡怎。

水平分表主要有三種路由方式：

范圍路由：選取有序的數(shù)據(jù)列（例如迅耘，整形、時(shí)間戳等）作為路由的條件监署，不同分段分散到不同的數(shù)據(jù)庫(kù)表中颤专。

我們可以觀察一些支付系統(tǒng)，發(fā)現(xiàn)只能查一年范圍內(nèi)的支付記錄钠乏，這個(gè)可能就是支付公司按照時(shí)間進(jìn)行了分表栖秕。

image.png

范圍路由

范圍路由設(shè)計(jì)的復(fù)雜點(diǎn)主要體現(xiàn)在分段大小的選取上，分段太小會(huì)導(dǎo)致切分后子表數(shù)量過(guò)多缓熟，增加維護(hù)復(fù)雜度累魔；分段太大可能會(huì)導(dǎo)致單表依然存在性能問(wèn)題摔笤，一般建議分段大小在 100 萬(wàn)至2000 萬(wàn)之間，具體需要根據(jù)業(yè)務(wù)選取合適的分段大小垦写。

范圍路由的優(yōu)點(diǎn)是可以隨著數(shù)據(jù)的增加平滑地?cái)U(kuò)充新的表吕世。例如，現(xiàn)在的用戶是 100 萬(wàn)梯投，如果增加到 1000 萬(wàn)命辖，只需要增加新的表就可以了，原有的數(shù)據(jù)不需要?jiǎng)臃直汀７秶酚傻囊粋€(gè)比較隱含的缺點(diǎn)是分布不均勻尔艇，假如按照 1000 萬(wàn)來(lái)進(jìn)行分表，有可能某個(gè)分段實(shí)際存儲(chǔ)的數(shù)據(jù)量只有 1000 條么鹤，而另外一個(gè)分段實(shí)際存儲(chǔ)的數(shù)據(jù)量有 900 萬(wàn)條终娃。

Hash 路由：選取某個(gè)列（或者某幾個(gè)列組合也可以）的值進(jìn)行 Hash 運(yùn)算，然后根據(jù) Hash 結(jié)果分散到不同的數(shù)據(jù)庫(kù)表中蒸甜。

同樣以訂單 id 為例棠耕，假如我們一開(kāi)始就規(guī)劃了 4個(gè)數(shù)據(jù)庫(kù)表，路由算法可以簡(jiǎn)單地用 id % 4 的值來(lái)表示數(shù)據(jù)所屬的數(shù)據(jù)庫(kù)表編號(hào)柠新，id 為 12的訂單放到編號(hào)為 50的子表中窍荧，id為 13的訂單放到編號(hào)為 61的字表中。

image.png

Hash路由

Hash 路由設(shè)計(jì)的復(fù)雜點(diǎn)主要體現(xiàn)在初始表數(shù)量的選取上恨憎，表數(shù)量太多維護(hù)比較麻煩蕊退，表數(shù)量太少又可能導(dǎo)致單表性能存在問(wèn)題。而用了 Hash 路由后憔恳，增加子表數(shù)量是非常麻煩的瓤荔，所有數(shù)據(jù)都要重分布。Hash 路由的優(yōu)缺點(diǎn)和范圍路由基本相反喇嘱，Hash 路由的優(yōu)點(diǎn)是表分布比較均勻茉贡，缺點(diǎn)是擴(kuò)充新的表很麻煩塞栅，所有數(shù)據(jù)都要重分布者铜。

配置路由：配置路由就是路由表，用一張獨(dú)立的表來(lái)記錄路由信息放椰。同樣以訂單id 為例作烟，我們新增一張 order_router 表，這個(gè)表包含 orderjd 和 tablejd 兩列 , 根據(jù) orderjd 就可以查詢對(duì)應(yīng)的 table_id砾医。

配置路由設(shè)計(jì)簡(jiǎn)單拿撩，使用起來(lái)非常靈活，尤其是在擴(kuò)充表的時(shí)候如蚜，只需要遷移指定的數(shù)據(jù)压恒，然后修改路由表就可以了影暴。

image.png

配置路由

配置路由的缺點(diǎn)就是必須多查詢一次，會(huì)影響整體性能探赫；而且路由表本身如果太大（例如型宙，幾億條數(shù)據(jù)），性能同樣可能成為瓶頸伦吠，如果我們?cè)俅螌⒙酚杀矸謳?kù)分表妆兑，則又面臨一個(gè)死循環(huán)式的路由算法選擇問(wèn)題。

61.不停機(jī)擴(kuò)容怎么實(shí)現(xiàn)毛仪？

實(shí)際上搁嗓，不停機(jī)擴(kuò)容，實(shí)操起來(lái)是個(gè)非常麻煩而且很有風(fēng)險(xiǎn)的操作箱靴，當(dāng)然腺逛，面試回答起來(lái)就簡(jiǎn)單很多。

第一階段：在線雙寫(xiě)衡怀，查詢走老庫(kù)

建立好新的庫(kù)表結(jié)構(gòu)屉来，數(shù)據(jù)寫(xiě)入久庫(kù)的同時(shí)，也寫(xiě)入拆分的新庫(kù)

數(shù)據(jù)遷移狈癞，使用數(shù)據(jù)遷移程序茄靠，將舊庫(kù)中的歷史數(shù)據(jù)遷移到新庫(kù)

使用定時(shí)任務(wù)，新舊庫(kù)的數(shù)據(jù)對(duì)比蝶桶，把差異補(bǔ)齊第一階段

第二階段：在線雙寫(xiě)慨绳，查詢走新庫(kù)

完成了歷史數(shù)據(jù)的同步和校驗(yàn)

把對(duì)數(shù)據(jù)的讀切換到新庫(kù)第二階段

第三階段：舊庫(kù)下線

舊庫(kù)不再寫(xiě)入新的數(shù)據(jù)

經(jīng)過(guò)一段時(shí)間，確定舊庫(kù)沒(méi)有請(qǐng)求之后真竖，就可以下線老庫(kù)

image.png

第三階段

62.常用的分庫(kù)分表中間件有哪些脐雪？

sharding-jdbc

Mycat

63.那你覺(jué)得分庫(kù)分表會(huì)帶來(lái)什么問(wèn)題呢？

從分庫(kù)的角度來(lái)講：

事務(wù)的問(wèn)題

使用關(guān)系型數(shù)據(jù)庫(kù)恢共，有很大一點(diǎn)在于它保證事務(wù)完整性战秋。

而分庫(kù)之后單機(jī)事務(wù)就用不上了，必須使用分布式事務(wù)來(lái)解決讨韭。

跨庫(kù) JOIN 問(wèn)題

在一個(gè)庫(kù)中的時(shí)候我們還可以利用 JOIN 來(lái)連表查詢脂信，而跨庫(kù)了之后就無(wú)法使用 JOIN 了。

此時(shí)的解決方案就是在業(yè)務(wù)代碼中進(jìn)行關(guān)聯(lián)透硝，也就是先把一個(gè)表的數(shù)據(jù)查出來(lái)剪决，然后通過(guò)得到的結(jié)果再去查另一張表乍惊，然后利用代碼來(lái)關(guān)聯(lián)得到最終的結(jié)果崎场。

這種方式實(shí)現(xiàn)起來(lái)稍微比較復(fù)雜控乾，不過(guò)也是可以接受的。

還有可以適當(dāng)?shù)娜哂嘁恍┳侄?/strong>。比如以前的表就存儲(chǔ)一個(gè)關(guān)聯(lián) ID丽声，但是業(yè)務(wù)時(shí)常要求返回對(duì)應(yīng)的 Name 或者其他字段礁蔗。這時(shí)候就可以把這些字段冗余到當(dāng)前表中，來(lái)去除需要關(guān)聯(lián)的操作雁社。

還有一種方式就是數(shù)據(jù)異構(gòu)瘦麸，通過(guò)binlog同步等方式，把需要跨庫(kù)join的數(shù)據(jù)異構(gòu)到ES等存儲(chǔ)結(jié)構(gòu)中歧胁，通過(guò)ES進(jìn)行查詢滋饲。

從分表的角度來(lái)看：

跨節(jié)點(diǎn)的 count,order by,group by 以及聚合函數(shù)問(wèn)題

只能由業(yè)務(wù)代碼來(lái)實(shí)現(xiàn)或者用中間件將各表中的數(shù)據(jù)匯總、排序喊巍、分頁(yè)然后返回屠缭。

數(shù)據(jù)遷移，容量規(guī)劃崭参，擴(kuò)容等問(wèn)題

數(shù)據(jù)的遷移呵曹，容量如何規(guī)劃，未來(lái)是否可能再次需要擴(kuò)容何暮，等等奄喂，都是需要考慮的問(wèn)題。

ID 問(wèn)題

數(shù)據(jù)庫(kù)表被切分后海洼，不能再依賴數(shù)據(jù)庫(kù)自身的主鍵生成機(jī)制跨新，所以需要一些手段來(lái)保證全局主鍵唯一。

還是自增坏逢，只不過(guò)自增步長(zhǎng)設(shè)置一下域帐。比如現(xiàn)在有三張表，步長(zhǎng)設(shè)置為3是整，三張表 ID 初始值分別是1肖揣、2、3浮入。這樣第一張表的 ID 增長(zhǎng)是 1龙优、4、7事秀。第二張表是2彤断、5、8秽晚。第三張表是3瓦糟、6筒愚、9赴蝇，這樣就不會(huì)重復(fù)了。

UUID巢掺，這種最簡(jiǎn)單句伶，但是不連續(xù)的主鍵插入會(huì)導(dǎo)致嚴(yán)重的頁(yè)分裂劲蜻，性能比較差。

分布式 ID考余，比較出名的就是 Twitter 開(kāi)源的 sonwflake 雪花算法

運(yùn)維

64.百萬(wàn)級(jí)別以上的數(shù)據(jù)如何刪除先嬉？

關(guān)于索引：由于索引需要額外的維護(hù)成本，因?yàn)樗饕募菃为?dú)存在的文件,所以當(dāng)我們對(duì)數(shù)據(jù)的增加,修改,刪除,都會(huì)產(chǎn)生額外的對(duì)索引文件的操作,這些操作需要消耗額外的IO,會(huì)降低增/改/刪的執(zhí)行效率楚堤。

所以疫蔓，在我們刪除數(shù)據(jù)庫(kù)百萬(wàn)級(jí)別數(shù)據(jù)的時(shí)候，查詢MySQL官方手冊(cè)得知?jiǎng)h除數(shù)據(jù)的速度和創(chuàng)建的索引數(shù)量是成正比的身冬。

所以我們想要?jiǎng)h除百萬(wàn)數(shù)據(jù)的時(shí)候可以先刪除索引

然后刪除其中無(wú)用數(shù)據(jù)

刪除完成后重新創(chuàng)建索引創(chuàng)建索引也非承普停快

65.百萬(wàn)千萬(wàn)級(jí)大表如何添加字段？

當(dāng)線上的數(shù)據(jù)庫(kù)數(shù)據(jù)量到達(dá)幾百萬(wàn)酥筝、上千萬(wàn)的時(shí)候滚躯，加一個(gè)字段就沒(méi)那么簡(jiǎn)單，因?yàn)榭赡軙?huì)長(zhǎng)時(shí)間鎖表嘿歌。

大表添加字段掸掏，通常有這些做法：

通過(guò)中間表轉(zhuǎn)換過(guò)去創(chuàng)建一個(gè)臨時(shí)的新表，把舊表的結(jié)構(gòu)完全復(fù)制過(guò)去宙帝，添加字段丧凤，再把舊表數(shù)據(jù)復(fù)制過(guò)去，刪除舊表步脓，新表命名為舊表的名稱息裸，這種方式可能回丟掉一些數(shù)據(jù)。

用pt-online-schema-changept-online-schema-change是percona公司開(kāi)發(fā)的一個(gè)工具沪编，它可以在線修改表結(jié)構(gòu)呼盆，它的原理也是通過(guò)中間表。

先在從庫(kù)添加再進(jìn)行主從切換如果一張表數(shù)據(jù)量大且是熱表（讀寫(xiě)特別頻繁）蚁廓，則可以考慮先在從庫(kù)添加访圃，再進(jìn)行主從切換，切換后再將其他幾個(gè)節(jié)點(diǎn)上添加字段相嵌。

66.MySQL 數(shù)據(jù)庫(kù) cpu 飆升的話腿时，要怎么處理呢？

排查過(guò)程：

（1）使用 top 命令觀察饭宾，確定是 mysqld 導(dǎo)致還是其他原因批糟。

（2）如果是 mysqld 導(dǎo)致的，show processlist看铆，查看 session 情況徽鼎，確定是不是有消耗資源的 sql 在運(yùn)行。

（3）找出消耗高的 sql，看看執(zhí)行計(jì)劃是否準(zhǔn)確否淤，索引是否缺失悄但，數(shù)據(jù)量是否太大。

處理：

（1）kill 掉這些線程 (同時(shí)觀察 cpu 使用率是否下降)石抡，

（2）進(jìn)行相應(yīng)的調(diào)整 (比如說(shuō)加索引檐嚣、改 sql、改內(nèi)存參數(shù))

（3）重新跑這些 SQL啰扛。

其他情況：

也有可能是每個(gè) sql 消耗資源并不多嚎京，但是突然之間，有大量的 session 連進(jìn)來(lái)導(dǎo)致 cpu 飆升隐解，這種情況就需要跟應(yīng)用一起來(lái)分析為何連接數(shù)會(huì)激增挖藏，再做出相應(yīng)的調(diào)整，比如說(shuō)限制連接數(shù)等

原文鏈接：
https://mp.weixin.qq.com/s/zSTyZ-8CFalwAYSB0PN6wA

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市溜嗜，隨后出現(xiàn)的幾起案子宵膨，更是在濱河造成了極大的恐慌籽御，老刑警劉巖哑梳，帶你破解...
沈念sama閱讀 212,816評(píng)論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件瞄沙，死亡現(xiàn)場(chǎng)離奇詭異姑裂，居然都是意外死亡檐束，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,729評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)束倍，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)被丧，“玉大人，你說(shuō)我怎么就攤上這事绪妹∩穑” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 158,300評(píng)論 0贊 348
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵喂急，是天一觀的道長(zhǎng)格嘁。經(jīng)常有香客問(wèn)我，道長(zhǎng)廊移，這世上最難降的妖魔是什么糕簿？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,780評(píng)論 1贊 285
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮狡孔，結(jié)果婚禮上懂诗，老公的妹妹穿的比我還像新娘。我一直安慰自己苗膝，他們只是感情好殃恒，可當(dāng)我...
茶點(diǎn)故事閱讀 65,890評(píng)論 6贊 385
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著辱揭，像睡著了一般离唐。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上问窃，一...
開(kāi)封第一講書(shū)人閱讀 50,084評(píng)論 1贊 291
城市分裂傳說(shuō)
那天亥鬓，我揣著相機(jī)與錄音，去河邊找鬼域庇。笑死嵌戈，一個(gè)胖子當(dāng)著我的面吹牛覆积，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播熟呛，決...
沈念sama閱讀 39,151評(píng)論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼宽档，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了庵朝？” 一聲冷哼從身側(cè)響起吗冤，我...
開(kāi)封第一講書(shū)人閱讀 37,912評(píng)論 0贊 268
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎偿短，沒(méi)想到半個(gè)月后欣孤，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體馋没，經(jīng)...
沈念sama閱讀 44,355評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡昔逗，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,666評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了篷朵。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片勾怒。...
茶點(diǎn)故事閱讀 38,809評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖声旺，靈堂內(nèi)的尸體忽然破棺而出笔链，到底是詐尸還是另有隱情，我是刑警寧澤腮猖，帶...
沈念sama閱讀 34,504評(píng)論 4贊 334
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布鉴扫，位于F島的核電站，受9級(jí)特大地震影響澈缺，放射性物質(zhì)發(fā)生泄漏坪创。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,150評(píng)論 3贊 317
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一姐赡、第九天我趴在偏房一處隱蔽的房頂上張望莱预。院中可真熱鬧，春花似錦项滑、人聲如沸依沮。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,882評(píng)論 0贊 21
一樁弒父案枪狂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)危喉。三九已至，卻和暖如春州疾，著一層夾襖步出監(jiān)牢的瞬間辜限，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,121評(píng)論 1贊 267
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工孝治，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留列粪，地道東北人审磁。一個(gè)月前我還...
沈念sama閱讀 46,628評(píng)論 2贊 362
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像岂座，于是被迫代替她去往敵國(guó)和親态蒂。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,724評(píng)論 2贊 351