普通索引和唯一索引有什么區(qū)別耀里？我又該如何選擇

假設(shè)你現(xiàn)在有個(gè)公民表維護(hù)，有一個(gè)唯一身份證id拾氓，我們應(yīng)該怎么設(shè)計(jì)索引呢冯挎？

為什么主鍵索引不能過長？

身份證是唯一的那么是不是就可以把我們知道InnoDB使用的聚簇索引id和數(shù)據(jù)一起存，在通過二級(jí)索引（普通索引）查詢數(shù)據(jù)時(shí)是先找到主鍵索引再查詢數(shù)據(jù)房官，如果數(shù)據(jù)量比較大趾徽，主鍵id過長就會(huì)導(dǎo)致一個(gè)二級(jí)索引(普通非主鍵索引)樹所能存儲(chǔ)的主鍵id記錄就會(huì)變少，因?yàn)樗饕彌_區(qū)的內(nèi)存空間是有限的翰守。

主鍵索引為什么最好是自增的孵奶？

如果表使用自增主鍵，那么每次插入新的記錄蜡峰，記錄就會(huì)順序添加到當(dāng)前索引節(jié)點(diǎn)的后續(xù)位置了袁，當(dāng)一頁寫滿，就會(huì)自動(dòng)開辟一個(gè)新的頁湿颅。這樣就會(huì)形成一個(gè)「緊湊」的索引結(jié)構(gòu)载绿，近似順序填滿。由于每次插入時(shí)也不需要移動(dòng)已有數(shù)據(jù)油航，因此效率很高崭庸，也不會(huì)增加很多開銷在維護(hù)索引上。Mysql 為維護(hù)索引可能需要頻繁的刷新緩沖谊囚，增加了方法磁盤 IO 的次數(shù)怕享，而且時(shí)常需要對(duì)索引結(jié)構(gòu)進(jìn)行重組織。

應(yīng)該設(shè)置唯一索引還是普通索引镰踏？

唯一索引和普通索引有什么區(qū)別函筋？

先看看查詢操作兩者的區(qū)別。

對(duì)于普通索引來說余境，查找到滿足條件的第一個(gè)記錄(5,500)后驻呐，需要查找下一個(gè)記錄，直到碰到第一個(gè)不滿足k=5條件的記錄芳来。
對(duì)于唯一索引來說含末，由于索引定義了唯一性，查找到第一個(gè)滿足條件的記錄后即舌，就會(huì)停止繼續(xù)檢索佣盒。

上面的查詢區(qū)別對(duì)于性能而言是微乎其微的，InnoDB讀寫數(shù)據(jù)是按頁來的顽聂，也是說當(dāng)找到k=5的記錄的時(shí)候肥惭，它所在的數(shù)據(jù)?就都在內(nèi)存里了，那么我們只需要判斷下一條數(shù)據(jù)是不是等于5即可紊搪，直到出現(xiàn)不為5的值為止蜜葱，這些都是在內(nèi)存中操作的，所以性能微乎其微耀石。

再來看看更新插入操作牵囤。想了解更新操作對(duì)性能的影響先了解了解change buffer。

當(dāng)需要更新一個(gè)數(shù)據(jù)?時(shí)，如果數(shù)據(jù)?在內(nèi)存中就直接更新揭鳞，而如果這個(gè)數(shù)據(jù)?還沒有在內(nèi)存中的話炕贵，在不影響數(shù)據(jù)一致性的前提下，InooDB會(huì)將這些更新操作緩存在change buffer中野崇，這樣就不需要從磁盤中讀入這個(gè)數(shù)據(jù)?了称开。在下次查詢需要訪問這個(gè)數(shù)據(jù)?的時(shí)候，將數(shù)據(jù)?讀入內(nèi)存乓梨，然后執(zhí)行change buffer中與這個(gè)?有關(guān)的操作鳖轰。通過這種方式就能保證這個(gè)數(shù)據(jù)邏輯的正確性。

將change buffer中的操作應(yīng)用到原數(shù)據(jù)?督禽，得到最新結(jié)果的過程稱為merge脆霎。除了訪問這個(gè)數(shù)據(jù)?會(huì)觸發(fā)merge外总处，系統(tǒng)有后臺(tái)線程會(huì)定期merge狈惫。在數(shù)據(jù)庫正常關(guān)閉(shutdown)的過程中，也會(huì)執(zhí)行merge操作鹦马。

如果能夠?qū)⒏虏僮飨扔涗浽赾hange buffer胧谈，減少讀磁盤，語句的執(zhí)行速度會(huì)得到明顯的提升荸频。而且菱肖，數(shù)據(jù)讀入內(nèi)存是需要占用buffer pool的，所以這種方式還能夠避免占用內(nèi)存旭从，提高內(nèi)存利用率稳强。

什么情況下會(huì)使用change buffer？

對(duì)于唯一索引來說和悦，所有的更新操作都要先判斷這個(gè)操作是否違反唯一性約束退疫。比如，要插入(4,400)這個(gè)記錄鸽素，就要先判斷現(xiàn)在表中是否已經(jīng)存在k=4的記錄褒繁，而這必須要將數(shù)據(jù)?讀入內(nèi)存才能判斷。如果都已經(jīng)讀入到內(nèi)存了馍忽，那直接更新內(nèi)存會(huì)更快棒坏，就沒必要使用change buffer了。

唯一索引的更新就不能使用change buffer遭笋，實(shí)際上也只有普通索引可以使用坝冕。

change buffer用的是buffer pool里的內(nèi)存，不能無限增大瓦呼。change buffer的大小喂窟，可以通過參數(shù)innodb_change_buffer_max_size來動(dòng)態(tài)設(shè)置。這個(gè)參數(shù)設(shè)置為50的時(shí)候，表示change buffer的大小最多只能占用buffer pool 的50%谎替。

再了解了change buffer之后我們?cè)倏纯匆粭l插入流程是怎么樣的偷溺。

這個(gè)記錄要更新的目標(biāo)?在內(nèi)存中。這時(shí)钱贯，InnoDB的處理流程如下:
- 對(duì)于唯一索引來說挫掏，找到3和5之間的位置，判斷到?jīng)]有沖突秩命，插入這個(gè)值尉共，語句執(zhí)行結(jié)束;
- 對(duì)于普通索引來說，找到3和5之間的位置弃锐，插入這個(gè)值袄友，語句執(zhí)行結(jié)束。
普通索引和唯一索引對(duì)更新語句性能影響的差別霹菊，只是一個(gè)判斷剧蚣，只會(huì)耗費(fèi)微小的CPU時(shí)間⌒ⅲ可以認(rèn)為性能相同鸠按。
這個(gè)記錄要更新的目標(biāo)?不在內(nèi)存中。這時(shí)饶碘，InnoDB的處理流程如下:
- 對(duì)于唯一索引來說目尖，需要將數(shù)據(jù)?讀入內(nèi)存，判斷到?jīng)]有沖突扎运，插入這個(gè)值瑟曲，語句執(zhí)行結(jié)束;
- 對(duì)于普通索引來說，則是將更新記錄在change buffer豪治，語句執(zhí)行就結(jié)束了洞拨。

將數(shù)據(jù)從磁盤讀入內(nèi)存涉及隨機(jī)IO的訪問，是數(shù)據(jù)庫里面成本最高的操作之一鬼吵。change buffer因?yàn)闇p少了隨機(jī)磁盤訪問扣甲，所以對(duì)更新性能的提升是會(huì)很明顯的。

change buffer的使用場(chǎng)景

change buffer只限于用在普通索引的場(chǎng) 景下齿椅，而不適用于唯一索引琉挖。普通索引的所有場(chǎng)景，使用change buffer都可以起到加速作用嗎?

因?yàn)閙erge的時(shí)候是真正進(jìn)行數(shù)據(jù)更新的時(shí)刻涣脚，而change buffer的主要目的就是將記錄的變更動(dòng)作緩存下來示辈，所以在一個(gè)數(shù)據(jù)?做merge之前，change buffer記錄的變更越多(也就是這個(gè)?面上要更新的次數(shù)越多)遣蚀，收益就越大矾麻。

寫多讀少的業(yè)務(wù)來說纱耻，?面在寫完以后?上被訪問到的概率比較小，此時(shí)change buffer的使用效果最好险耀。這種業(yè) 務(wù)模型常?的就是賬單類弄喘、日志類的系統(tǒng)。

假設(shè)一個(gè)業(yè)務(wù)的更新模式是寫入之后?上會(huì)做查詢甩牺，那么即使?jié)M足了條件蘑志，將更新先記錄在change buffer，但之后由于?上要訪問這個(gè)數(shù)據(jù)?贬派，會(huì)立即觸發(fā)merge過程急但。這樣隨機(jī)訪問IO的次數(shù)不會(huì)減少，反而增加了change buffer的維護(hù)代價(jià)搞乏。所以波桩，對(duì)于這種業(yè)務(wù)模式來說，change buffer反而起到了副作用请敦。

change buffer 和 redo log

假設(shè)我們要執(zhí)行一個(gè)插入操作镐躲，insert into t(id,k) values(id1,k1),(id2,k2);我們假設(shè)當(dāng)前k索引樹的狀態(tài)，查找到位置后冬三，k1所在的數(shù)據(jù)?在內(nèi)存(InnoDB buffer pool)中匀油，k2所在的數(shù)據(jù)?不在內(nèi) 存中缘缚。如圖所示是帶change buffer的更新狀態(tài)圖勾笆。

image.png

分析這條更新語句，你會(huì)發(fā)現(xiàn)它涉及了四個(gè)部分:內(nèi)存桥滨、redo log(ib_log_fileX)窝爪、數(shù)據(jù)表空間(t.ibd)、系統(tǒng)表空間(ibdata1)齐媒。

這條更新語句做了如下的操作(按照?qǐng)D中的數(shù)字順序):

Page 1在內(nèi)存中蒲每，直接更新內(nèi)存;
Page 2沒有在內(nèi)存中，就在內(nèi)存的change buffer區(qū)域喻括，記錄下“我要往Page 2插入一行”這個(gè)信息 3. 將上述兩個(gè)動(dòng)作記入redo log中(圖中3和4)邀杏。

這條更新語句的成本很低，就是寫了兩處內(nèi)存唬血，然后寫了一處磁盤 (兩次操作合在一起寫了一次磁盤)望蜡，而且還是順序?qū)懙摹?/p>

我們現(xiàn)在要執(zhí)行 select * from t where k in (k1, k2)。這里拷恨，我畫了這兩個(gè)讀請(qǐng)求的流程圖脖律。如果讀語句發(fā)生在更新語句后不久，內(nèi)存中的數(shù)據(jù)都還在腕侄，那么此時(shí)的這兩個(gè)讀操作就與系統(tǒng)表空間(ibdata1)和 redo log(ib_log_fileX)無關(guān)了小泉。所以芦疏，我在圖中就沒畫出這兩部分。

image.png

讀Page 1的時(shí)候微姊，直接從內(nèi)存返回酸茴。WAL之后如果讀數(shù)據(jù)，是不是一定要讀盤兢交，是不是一定要從redo log里面把數(shù)據(jù)更新以后才可以返回?其實(shí)是不用的弊决。你可以看一下圖3的這個(gè)狀態(tài)，雖然磁盤上還是之前的數(shù)據(jù)魁淳，但是這里直接從內(nèi)存返回結(jié)果飘诗，結(jié)果是正確的。
要讀Page 2的時(shí)候界逛，需要把Page 2從磁盤讀入內(nèi)存中昆稿，然后應(yīng)用change buffer里面的操作日志，生成一個(gè)正確的版本并返回結(jié)果息拜。

如果要簡單地對(duì)比這兩個(gè)機(jī)制在提升更新性能上的收益的話溉潭，redo log 主要節(jié)省的是隨機(jī)寫磁盤的IO消耗(轉(zhuǎn)成順序寫)，而change buffer主要節(jié)省的則是隨機(jī)讀磁盤的IO消耗少欺。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末喳瓣，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子赞别，更是在濱河造成了極大的恐慌畏陕，老刑警劉巖，帶你破解...
沈念sama閱讀 216,402評(píng)論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件仿滔，死亡現(xiàn)場(chǎng)離奇詭異惠毁，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)崎页，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,377評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門鞠绰，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人飒焦，你說我怎么就攤上這事蜈膨。” “怎么了牺荠？”我有些...
開封第一講書人閱讀 162,483評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵翁巍，是天一觀的道長。經(jīng)常有香客問我志电，道長曙咽，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,165評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任挑辆，我火速辦了婚禮例朱，結(jié)果婚禮上孝情，老公的妹妹穿的比我還像新娘。我一直安慰自己洒嗤，他們只是感情好箫荡，可當(dāng)我...
茶點(diǎn)故事閱讀 67,176評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著渔隶，像睡著了一般羔挡。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上间唉，一...
開封第一講書人閱讀 51,146評(píng)論 1贊 297
城市分裂傳說
那天绞灼，我揣著相機(jī)與錄音，去河邊找鬼呈野。笑死低矮，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的被冒。我是一名探鬼主播军掂，決...
沈念sama閱讀 40,032評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼昨悼！你這毒婦竟也來了蝗锥？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,896評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤率触，失蹤者是張志新（化名）和其女友劉穎终议，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體闲延，經(jīng)...
沈念sama閱讀 45,311評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡痊剖，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,536評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了垒玲。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,696評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡找颓，死狀恐怖合愈，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情击狮，我是刑警寧澤佛析，帶...
沈念sama閱讀 35,413評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站彪蓬，受9級(jí)特大地震影響寸莫，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜档冬，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,008評(píng)論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一膘茎、第九天我趴在偏房一處隱蔽的房頂上張望桃纯。院中可真熱鬧，春花似錦披坏、人聲如沸态坦。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評(píng)論 0贊 22
一樁弒父案棒拂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽伞梯。三九已至，卻和暖如春帚屉，著一層夾襖步出監(jiān)牢的瞬間谜诫，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,815評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工攻旦，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留猜绣，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,698評(píng)論 2贊 368
代替公主和親
正文我出身青樓敬特，卻偏偏與公主長得像掰邢，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子伟阔，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,592評(píng)論 2贊 353