索引概念:
? ? 索引是關(guān)系數(shù)據(jù)庫(kù)中用于存放每一條記錄的一種對(duì)象,主要目的是加快數(shù)據(jù)的讀取速度和完整性檢查琉朽。建立索引是一項(xiàng)技術(shù)性要求高的工作。一般在數(shù)據(jù)庫(kù)設(shè)計(jì)階段的與數(shù)據(jù)庫(kù)結(jié)構(gòu)一道考慮。應(yīng)用系統(tǒng)的性能直接與索引的合理直接有關(guān)峭梳。
一、Oracle索引
1蹂喻、索引類型
列出常見常用的幾種索引類型葱椭,如下:
??非唯一索引(最常用)?NonUnique
唯一索引??Unique
位圖索引??Bitmap
分區(qū)索引??Partitioned
非分區(qū)索引??NonPartitioned ?
正常型B樹 Normal
基于函數(shù)的索引??Function-based
2、索引結(jié)構(gòu)
B-tree:
適合與大量的增口四、刪孵运、改(OLTP);?
不能用包含OR操作符的查詢蔓彩;?
適合高基數(shù)的列(唯一值多)?
典型的樹狀結(jié)構(gòu)治笨;?
每個(gè)結(jié)點(diǎn)都是數(shù)據(jù)塊驳概;?
大多都是物理上一層、兩層或三層不定旷赖,邏輯上三層顺又;?
葉子塊數(shù)據(jù)是排序的,從左向右遞增等孵;?
在分支塊和根塊中放的是索引的范圍稚照;
Bitmap:
適合與決策支持系統(tǒng);?
做UPDATE代價(jià)非常高俯萌;?
非常適合OR操作符的查詢果录;?
基數(shù)比較少的時(shí)候才能建位圖索引;
樹型結(jié)構(gòu):
索引頭?
開始ROWID绳瘟,結(jié)束ROWID(先列出索引的最大范圍)
BITMAP
每一個(gè)BIT對(duì)應(yīng)著一個(gè)ROWID雕憔,它的值是1還是0,如果是1糖声,表示著BIT對(duì)應(yīng)的ROWID有值
1. b-tree索引
Oracle數(shù)據(jù)庫(kù)中最常見的索引類型是b-tree索引斤彼,也就是B-樹索引,以其同名的計(jì)算科學(xué)結(jié)構(gòu)命名蘸泻。CREATE INDEX語(yǔ)句時(shí)琉苇,默認(rèn)就是在創(chuàng)建b-tree索引。沒有特別規(guī)定可用于任何情況悦施。
2. 位圖索引(bitmap index)
位圖索引特定于該列只有幾個(gè)枚舉值的情況并扇,比如性別字段,標(biāo)示字段比如只有0和1的情況抡诞。
3. 基于函數(shù)的索引
比如經(jīng)常對(duì)某個(gè)字段做查詢的時(shí)候是帶函數(shù)操作的穷蛹,那么此時(shí)建一個(gè)函數(shù)索引就有價(jià)值了。
4. 分區(qū)索引和全局索引
這2個(gè)是用于分區(qū)表的時(shí)候昼汗。前者是分區(qū)內(nèi)索引肴熏,后者是全表索引
5. 反向索引(REVERSE)
這個(gè)索引不常見,但是特定情況特別有效顷窒,比如一個(gè)varchar(5)位字段(員工編號(hào))含值(10001,10002,10033,10005,10016..)?
這種情況默認(rèn)索引分布過于密集蛙吏,不能利用好服務(wù)器的并行?
但是反向之后10001,20001,33001,50001,61001就有了一個(gè)很好的分布,能高效的利用好并行運(yùn)算鞋吉。
6.HASH索引
HASH索引可能是訪問數(shù)據(jù)庫(kù)中數(shù)據(jù)的最快方法鸦做,但它也有自身的缺點(diǎn)。集群鍵上不同值的數(shù)目必須在創(chuàng)建HASH集群之前就要知道谓着。需要在創(chuàng)建HASH集群的時(shí)候指定這個(gè)值泼诱。使用HASH索引必須要使用HASH集群。
3漆魔、索引原理
若沒有索引坷檩,搜索某個(gè)記錄時(shí)(例如查找name='wish')需要搜索所有的記錄却音,因?yàn)椴荒鼙WC只有一個(gè)wish,必須全部搜索一遍
若在name上建立索引矢炼,oracle會(huì)對(duì)全表進(jìn)行一次搜索系瓢,將每條記錄的name值哪找升序排列,然后構(gòu)建索引條目(name和rowid)句灌,存儲(chǔ)到索引段中夷陋,查詢name為wish時(shí)即可直接查找對(duì)應(yīng)地方
創(chuàng)建了索引并不一定就會(huì)使用,oracle自動(dòng)統(tǒng)計(jì)表的信息后胰锌,決定是否使用索引骗绕,表中數(shù)據(jù)很少時(shí)使用全表掃描速度已經(jīng)很快,沒有必要使用索引
4资昧、建立索引的原則
1.如果有兩個(gè)或者以上的索引酬土,其中有一個(gè)唯一性索引,而其他是非唯一格带,這種情況下oracle將使用唯一性索引而完全忽略非唯一性索引
2. 至少要包含組合索引的第一列(即如果索引建立在多個(gè)列上撤缴,只有它的第一個(gè)列被where子句引用時(shí),優(yōu)化器才會(huì)使用該索引)
3. 小表不要簡(jiǎn)歷索引
4. 對(duì)于基數(shù)大的列適合建立B樹索引叽唱,對(duì)于基數(shù)小的列適合簡(jiǎn)歷位圖索引
5. 列中有很多空值屈呕,但經(jīng)常查詢?cè)摿猩戏强沼涗洉r(shí)應(yīng)該建立索引
6. 經(jīng)常進(jìn)行連接查詢的列應(yīng)該創(chuàng)建索引
7. 使用create index時(shí)要將最常查詢的列放在最前面
8. LONG(可變長(zhǎng)字符串?dāng)?shù)據(jù),最長(zhǎng)2G)和LONG RAW(可變長(zhǎng)二進(jìn)制數(shù)據(jù)棺亭,最長(zhǎng)2G)列不能創(chuàng)建索引
9.限制表中索引的數(shù)量(創(chuàng)建索引耗費(fèi)時(shí)間虎眨,并且隨數(shù)據(jù)量的增大而增大;索引會(huì)占用物理空間镶摘;當(dāng)對(duì)表中的數(shù)據(jù)進(jìn)行增加嗽桩、刪除和修改的時(shí)候,索引也要?jiǎng)討B(tài)的維護(hù)凄敢,降低了數(shù)據(jù)的維護(hù)速度)
5涤躲、索引使用原則
經(jīng)常檢索排序大表中40%或非排序表7%的行,建議建索引贡未;
為了改善多表關(guān)聯(lián),索引列用于聯(lián)結(jié)蒙袍;
列中的值相對(duì)比較唯一俊卤;
取值范圍(大:B*樹索引,泻Ψ:位圖索引)消恍;
Date型列一般適合基于函數(shù)的索引;
列中有許多空值以现,不適合建立索引
二狠怨、MySQL索引
1约啊、索引類型
單列索引(普通索引,唯一索引佣赖,主鍵索引)恰矩、組合索引、全文索引憎蛤、空間索引
單列索引:一個(gè)索引只包含單個(gè)列外傅,但一個(gè)表中可以有多個(gè)單列索引。
普通索引:MySQL中基本索引類型俩檬,沒有什么限制萎胰,允許在定義索引的列中插入重復(fù)值和空值,純粹為了查詢數(shù)據(jù)更快一點(diǎn)棚辽。
唯一索引:索引列中的值必須是唯一的技竟,但是允許為空值。
? 主鍵索引:是一種特殊的唯一索引屈藐,不允許有空值榔组。
組合索引:在表中的多個(gè)字段組合上創(chuàng)建的索引,只有在查詢條件中使用了這些字段的左邊字段時(shí)估盘,索引才會(huì)被使用瓷患,使用組合索引時(shí)遵循最左前綴集合。這個(gè)如果還不明白遣妥,等后面舉例講解時(shí)在細(xì)說(shuō)
全文索引擅编,只有在MyISAM引擎上才能使用,只能在CHAR,VARCHAR,TEXT類型字段上使用全文索引箫踩,介紹了要求爱态,說(shuō)說(shuō)什么是全文索引,就是在一堆文字中境钟,通過其中的某個(gè)關(guān)鍵字等锦担,就能找到該字段所屬的記錄行,比如有"你是個(gè)大煞筆慨削,二貨 ..." 通過大煞筆洞渔,可能就可以找到該條記錄。這里說(shuō)的是可能缚态,因?yàn)槿乃饕氖褂蒙婕傲撕芏嗉?xì)節(jié)磁椒,我們只需要知道這個(gè)大概意思,如果感興趣進(jìn)一步深入使用它玫芦,那么看下面測(cè)試該索引時(shí)浆熔,會(huì)給出一個(gè)博文,供大家參考桥帆。
空間索引:空間索引是對(duì)空間數(shù)據(jù)類型的字段建立的索引医增,MySQL中的空間數(shù)據(jù)類型有四種慎皱,GEOMETRY、POINT叶骨、LINESTRING茫多、POLYGON。在創(chuàng)建空間索引時(shí)邓萨,使用SPATIAL關(guān)鍵字地梨。要求,引擎為MyISAM缔恳,創(chuàng)建空間索引的列宝剖,必須將其聲明為NOT NULL。
2歉甚、索引原理
在MySQL中万细,存儲(chǔ)引擎用類似的方法使用索引,其先在索引中查找對(duì)應(yīng)的值纸泄,然后根據(jù)匹配的索引記錄找到對(duì)應(yīng)的數(shù)據(jù)行赖钞,最后將數(shù)據(jù)結(jié)果集返回給客戶端。
3聘裁、索引使用原則
最左前綴匹配原則
mysql會(huì)一直向右匹配直到遇到范圍查詢(>雪营、<、between衡便、like)就停止匹配献起。比如a = 1 and b = 2 and c > 3 and d = 4,如果建立(a,b,c,d)順序的索引镣陕,d是用不到索引的谴餐,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調(diào)整呆抑。
=和in可以亂序
比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序岂嗓,mysql的查詢優(yōu)化器會(huì)幫你優(yōu)化成索引可以識(shí)別的形式。
盡量選擇區(qū)分度高的列作為索引
區(qū)分度的公式是count(distinct col)/count(*)鹊碍,表示字段不重復(fù)的比例厌殉,比例越大我們掃描的記錄數(shù)越少,唯一鍵的區(qū)分度是1侈咕,而一些狀態(tài)年枕、性別字段可能在大數(shù)據(jù)面前區(qū)分度就是0,那可能有人會(huì)問乎完,這個(gè)比例有什么經(jīng)驗(yàn)值嗎?使用場(chǎng)景不同品洛,這個(gè)值也很難確定树姨,一般需要join的字段我們都要求是0.1以上摩桶,即平均1條掃描10條記錄。
索引列不能參與計(jì)算帽揪,保持列“干凈”
比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引硝清,原因很簡(jiǎn)單,b+樹中存的都是數(shù)據(jù)表中的字段值转晰,但進(jìn)行檢索時(shí)芦拿,需要把所有元素都應(yīng)用函數(shù)才能比較,顯然成本太大查邢。所以語(yǔ)句應(yīng)該寫成create_time = unix_timestamp(’2014-05-29’);
盡量的擴(kuò)展索引蔗崎,不要新建索引
比如表中已經(jīng)有a的索引,現(xiàn)在要加(a,b)的索引扰藕,那么只需要修改原來(lái)的索引即可缓苛。
4、高性能索引列
獨(dú)立的列
前綴索引和索引的選擇性
多列索引
選擇合適的索引列順序
聚簇索引
覆蓋索引
使用索引掃描來(lái)做排序
冗余和重復(fù)索引
未使用的索引
關(guān)注個(gè)人技術(shù)公眾號(hào):nick_coding1024
不定期分享最新前沿技術(shù)框架和bat大廠常用技術(shù)等邓深,加群不定期分享行業(yè)內(nèi)大牛直播講課以及獲得內(nèi)退一線互聯(lián)網(wǎng)公司機(jī)會(huì)未桥。
---------------------CSDN技術(shù)博客
原文:https://blog.csdn.net/xuri24/article/details/80910082