目錄
多關(guān)于索引炊汤,分為以下幾點來講解:
- 一劈伴、索引的概述(什么是索引,索引的優(yōu)缺點)
- 二、索引的基本使用(創(chuàng)建索引)
- 三镶柱、索引的基本原理(面試重點)
- 四婆硬、索引的數(shù)據(jù)結(jié)構(gòu)(B樹,hash)
- 五奸例、創(chuàng)建索引的原則(重中之重彬犯,面試必問!敬請收藏2榈酢)
- 六谐区、百萬級別或以上的數(shù)據(jù)如何刪除
一、索引的概述
Ⅰ逻卖、什么是索引宋列?
索引是一種特殊的文件(InnoDB數(shù)據(jù)表上的索引是表空間的一個組成部分),它們包含著對數(shù)據(jù)表里所有記錄的引用指針评也。更通俗的說炼杖,索引就相當(dāng)于目錄。當(dāng)你在用新華字典時盗迟,幫你把目錄撕掉了坤邪,你查詢某個字開頭的成語只能從第一頁翻到第一千頁。累罚缕!把目錄還給你艇纺,則能快速定位!
Ⅱ邮弹、索引的優(yōu)缺點:
可以大大加快數(shù)據(jù)的檢索速度黔衡,這也是創(chuàng)建索引的最主要的原因。腌乡,且通過使用索引盟劫,可以在查詢的過程中,使用優(yōu)化隱藏器与纽,提高系統(tǒng)的性能侣签。但是,索引也是有缺點的:索引需要額外的維護(hù)成本渣锦;因為索引文件是單獨存在的文件,對數(shù)據(jù)的增加,修改,刪除,都會產(chǎn)生額外的對索引文件的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執(zhí)行效率硝岗。
二、索引的基本使用
創(chuàng)建索引:(三種方式)
第一種方式:
第二種方式:使用ALTER TABLE命令去增加索引:
ALTER TABLE用來創(chuàng)建普通索引袋毙、UNIQUE索引或PRIMARY KEY索引。
其中table_name是要增加索引的表名冗尤,column_list指出對哪些列進(jìn)行索引听盖,多列時各列之間用逗號分隔胀溺。
索引名index_name可自己命名,缺省時皆看,MySQL將根據(jù)第一個索引列賦一個名稱仓坞。另外,ALTER TABLE允許在單個語句中更改多個表腰吟,因此可以在同時創(chuàng)建多個索引无埃。
第三種方式:使用CREATE INDEX命令創(chuàng)建
CREATE INDEX可對表增加普通索引或UNIQUE索引。(但是毛雇,不能創(chuàng)建PRIMARY KEY索引)
三嫉称、索引的基本原理
索引用來快速地尋找那些具有特定值的記錄。如果沒有索引灵疮,一般來說執(zhí)行查詢時遍歷整張表织阅。
索引的原理很簡單,就是把無序的數(shù)據(jù)變成有序的查詢
- 把創(chuàng)建了索引的列的內(nèi)容進(jìn)行排序
- 對排序結(jié)果生成倒排表
- 在倒排表內(nèi)容上拼上數(shù)據(jù)地址鏈
- 在查詢的時候震捣,先拿到倒排表內(nèi)容荔棉,再取出數(shù)據(jù)地址鏈,從而拿到具體數(shù)據(jù)
四蒿赢、索引的數(shù)據(jù)結(jié)構(gòu)
- b樹
- hash
Ⅰ.B樹索引
mysql通過存儲引擎取數(shù)據(jù)润樱,基本上90%的人用的就是InnoDB了,按照實現(xiàn)方式分羡棵,InnoDB的索引類型目前只有兩種:BTREE(B樹)索引和HASH索引祥国。B樹索引是Mysql數(shù)據(jù)庫中使用最頻繁的索引類型,基本所有存儲引擎都支持BTree索引晾腔。通常我們說的索引不出意外指的就是(B樹)索引(實際是用B+樹實現(xiàn)的舌稀,因為在查看表索引時,mysql一律打印BTREE灼擂,所以簡稱為B樹索引)
查詢方式:
主鍵索引區(qū):PI(關(guān)聯(lián)保存的時數(shù)據(jù)的地址)按主鍵查詢,
普通索引區(qū):si(關(guān)聯(lián)的id的地址,然后再到達(dá)上面的地址)壁查。所以按主鍵查詢,速度最快
B+tree性質(zhì):
- n棵子tree的節(jié)點包含n個關(guān)鍵字,不用來保存數(shù)據(jù)而是保存數(shù)據(jù)的索引剔应。
- 所有的葉子結(jié)點中包含了全部關(guān)鍵字的信息睡腿,及指向含這些關(guān)鍵字記錄的指針,且葉子結(jié)點本身依關(guān)鍵字的大小自小而大順序鏈接峻贮。
- 所有的非終端結(jié)點可以看成是索引部分席怪,結(jié)點中僅含其子樹中的最大(或最小)關(guān)鍵字纤控。
- B+ 樹中挂捻,數(shù)據(jù)對象的插入和刪除僅在葉節(jié)點上進(jìn)行。
- B+樹有2個頭指針船万,一個是樹的根節(jié)點刻撒,一個是最小關(guān)鍵碼的葉節(jié)點骨田。
Ⅱ.哈希索引
簡要說下,類似于數(shù)據(jù)結(jié)構(gòu)中簡單實現(xiàn)的HASH表(散列表)一樣声怔,當(dāng)我們在mysql中用哈希索引時态贤,主要就是通過Hash算法(常見的Hash算法有直接定址法、平方取中法醋火、折疊法悠汽、除數(shù)取余法、隨機(jī)數(shù)法)芥驳,將數(shù)據(jù)庫字段數(shù)據(jù)轉(zhuǎn)換成定長的Hash值柿冲,與這條數(shù)據(jù)的行指針一并存入Hash表的對應(yīng)位置;如果發(fā)生Hash碰撞(兩個不同關(guān)鍵字的Hash值相同)晚树,則在對應(yīng)Hash鍵下以鏈表形式存儲姻采。當(dāng)然這只是簡略模擬圖。
五爵憎、創(chuàng)建索引的原則
索引雖好慨亲,但也不是無限制的使用,最好符合一下幾個原則:
- 最左前綴匹配原則宝鼓,組合索引非常重要的原則刑棵,mysql會一直向右匹配直到遇到范圍查詢(>、<愚铡、between蛉签、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)順序的索引沥寥,d是用不到索引的碍舍,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調(diào)整邑雅。
- 較頻繁作為查詢條件的字段才去創(chuàng)建索引
- 更新頻繁字段不適合創(chuàng)建索引
- 若是不能有效區(qū)分?jǐn)?shù)據(jù)的列不適合做索引列(如性別片橡,男女未知,最多也就三種淮野,區(qū)分度實在太低)
- 盡量的擴(kuò)展索引捧书,不要新建索引。比如表中已經(jīng)有a的索引骤星,現(xiàn)在要加(a,b)的索引经瓷,那么只需要修改原來的索引即可。
- 定義有外鍵的數(shù)據(jù)列一定要建立索引洞难。
- 對于那些查詢中很少涉及的列舆吮,重復(fù)值比較多的列不要建立索引。
- 對于定義為text、image和bit的數(shù)據(jù)類型的列不要建立索引歪泳。
六萝勤、百萬級別或以上的數(shù)據(jù)如何刪除
關(guān)于索引:由于索引需要額外的維護(hù)成本露筒,因為索引文件是單獨存在的文件,所以當(dāng)我們對數(shù)據(jù)的增加,修改,刪除,都會產(chǎn)生額外的對索引文件的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執(zhí)行效率呐伞。所以,在我們刪除數(shù)據(jù)庫百萬級別數(shù)據(jù)的時候慎式,查詢MySQL官方手冊得知刪除數(shù)據(jù)的速度和創(chuàng)建的索引數(shù)量是成正比的伶氢。
- 所以我們想要刪除百萬數(shù)據(jù)的時候可以先刪除索引(此時大概耗時三分多鐘)
- 然后刪除其中無用數(shù)據(jù)(此過程需要不到兩分鐘)
- 刪除完成后重新創(chuàng)建索引(此時數(shù)據(jù)較少了)創(chuàng)建索引也非常快瘪吏,約十分鐘左右癣防。
- 與之前的直接刪除絕對是要快速很多,更別說萬一刪除中斷,一切刪除會回滾掌眠。那更是坑了蕾盯。