1.數(shù)據(jù)庫(kù)設(shè)計(jì)三范式
滿足的范式越高瘾境,數(shù)據(jù)庫(kù)的數(shù)據(jù)冗余越少歧杏。
(1)第一范式:數(shù)據(jù)庫(kù)表不包含多值屬性。(屬性的值是不可分割的原子數(shù)據(jù)迷守,而不是數(shù)組或者集合)
(2)第二范式:滿足第一范式的基礎(chǔ)上犬绒,要求非主屬性必須完全依賴于主鍵,而不是依賴于 主鍵的一部分兑凿。
(3)第三范式:滿足第二范式的基礎(chǔ)上凯力,要求非主屬性不能依賴于其他非主屬性。
2.數(shù)據(jù)庫(kù)索引
(1)數(shù)據(jù)庫(kù)索引是對(duì)數(shù)據(jù)庫(kù)表中一個(gè)或多個(gè)列進(jìn)行排序的結(jié)構(gòu)礼华。
(2)索引的分類:普通索引(沒(méi)有任何限制)咐鹤,唯一索引(索引列的值唯一),主鍵索引(主鍵會(huì)默認(rèn)創(chuàng)建索引圣絮,因此主鍵索引是特殊的唯一索引)祈惶,組合索引(對(duì)兩個(gè)或多于兩個(gè)列建立的索引,最左前綴:加速查詢只適用于搜索列是索引的最左部分)扮匠。
(3)聚簇索引(只有InnoDB和solidDB擁有):聚簇索引不是一種特定的索引類型捧请,而是一種數(shù)據(jù)的存儲(chǔ)方式。聚簇索引建立的B樹(shù)棒搜,其葉節(jié)點(diǎn)保存了索引以及數(shù)據(jù)行疹蛉,而非聚簇索引,葉節(jié)點(diǎn)只保存行號(hào)力麸。
聚簇索引的數(shù)據(jù)的物理存放順序與索引順序是一致的氧吐,即:只要索引是相鄰的,那么對(duì)應(yīng)的數(shù)據(jù)一定也是相鄰地存放在磁盤上的末盔。
聚簇索引的優(yōu)點(diǎn):
A:可以把相關(guān)數(shù)據(jù)保存在一起筑舅,如:實(shí)現(xiàn)電子郵箱時(shí),可以根據(jù)用戶ID來(lái)聚集數(shù)據(jù)陨舱,這樣只需要從磁盤讀取少量的數(shù)據(jù)頁(yè)就能獲取某個(gè)用戶全部郵件翠拣,如果沒(méi)有使用聚集索引,則每封郵件都可能導(dǎo)致一次磁盤IO游盲。
B:數(shù)據(jù)訪問(wèn)更快误墓,聚集索引將索引和數(shù)據(jù)保存在同一個(gè)btree中,因此從聚集索引中獲取數(shù)據(jù)通常比在非聚集索引中查找要快
C:使用覆蓋索引掃描的查詢可以直接使用頁(yè)節(jié)點(diǎn)中的主鍵值
聚簇索引的缺點(diǎn):
A:聚簇?cái)?shù)據(jù)最大限度地提高了IO密集型應(yīng)用的性能益缎,但如果數(shù)據(jù)全部放在內(nèi)存中谜慌,則訪問(wèn)的順序就沒(méi)有那么重要了,聚集索引也沒(méi)有什么優(yōu)勢(shì)了
B:插入速度嚴(yán)重依賴于插入順序莺奔,按照主鍵的順序插入是加載數(shù)據(jù)到innodb表中速度最快的方式欣范,但如果不是按照主鍵順序加載數(shù)據(jù),那么在加載完成后最好使用optimize table命令重新組織一下表
C:更新聚集索引列的代價(jià)很高,因?yàn)闀?huì)強(qiáng)制innodb將每個(gè)被更新的行移動(dòng)到新的位置
D:基于聚集索引的表在插入新行恼琼,或者主鍵被更新導(dǎo)致需要移動(dòng)行的時(shí)候妨蛹,可能面臨頁(yè)分裂的問(wèn)題,當(dāng)行的主鍵值要求必須將這一行插入到某個(gè)已滿的頁(yè)中時(shí)晴竞,存儲(chǔ)引擎會(huì)將該頁(yè)分裂成兩個(gè)頁(yè)面來(lái)容納該行蛙卤,這就是一次頁(yè)分裂操作,頁(yè)分裂會(huì)導(dǎo)致表占用更多的磁盤空間
E:聚集索引可能導(dǎo)致全表掃描變慢噩死,尤其是行比較稀疏颤难,或者由于頁(yè)分裂導(dǎo)致數(shù)據(jù)存儲(chǔ)不連續(xù)的時(shí)候
F:二級(jí)索引可能比想象的更大,因?yàn)樵诙?jí)索引的葉子節(jié)點(diǎn)包含了引用行的主鍵列已维。
G:二級(jí)索引訪問(wèn)需要兩次索引查找行嗤,而不是一次
3.數(shù)據(jù)庫(kù)事務(wù)
3.1 ACID
(1)Atomicity(原子性):一個(gè)事務(wù)中的操作以原子方式執(zhí)行,不可分割衣摩。
(2)Consistency(一致性)事 務(wù)執(zhí)行的結(jié)果必須是使數(shù)據(jù)庫(kù)從一個(gè)一致性狀態(tài)變到另一個(gè)一致性狀態(tài)昂验。因此當(dāng)數(shù)據(jù)庫(kù)只包含成功事務(wù)提交的結(jié)果時(shí),就說(shuō)數(shù)據(jù)庫(kù)處于一致性狀態(tài)艾扮。如果數(shù)據(jù)庫(kù)系統(tǒng) 運(yùn)行中發(fā)生故障既琴,有些事務(wù)尚未完成就被迫中斷,這些未完成事務(wù)對(duì)數(shù)據(jù)庫(kù)所做的修改有一部分已寫入物理數(shù)據(jù)庫(kù)泡嘴,這時(shí)數(shù)據(jù)庫(kù)就處于一種不正確的狀態(tài),或者說(shuō)是 不一致的狀態(tài)酌予。
(3)Isolation(隔離性):一個(gè)事務(wù)的執(zhí)行不能其它事務(wù)干擾磺箕。即一個(gè)事務(wù)內(nèi)部的操作及使用的數(shù)據(jù)對(duì)其它并發(fā)事務(wù)是隔離的,并發(fā)執(zhí)行的各個(gè)事務(wù)之間不能互相干擾抛虫。
(4)Durability(持久性):事務(wù)結(jié)束后對(duì)數(shù)據(jù)的修改是永久的松靡。
3.2 四種隔離級(jí)別
參考:www.open-open.com/lib/view/open1477901691009.html
SQL標(biāo)準(zhǔn)定義的四種隔離級(jí)別:
(1)Read Uncommitted:在該隔離級(jí)別,所有事務(wù)都可以看到其他未提交事務(wù)的執(zhí)行結(jié)果建椰。
(2)Read Committed:這是大多數(shù)數(shù)據(jù)庫(kù)系統(tǒng)的默認(rèn)隔離級(jí)別(但不是MySQL默認(rèn)的)雕欺。它滿足了隔離的簡(jiǎn)單定義:一個(gè)事務(wù)只能看見(jiàn)已經(jīng)提交事務(wù)所做的改變。這種隔離級(jí)別 也支持所謂的不可重復(fù)讀(Nonrepeatable Read)棉姐,因?yàn)橥皇聞?wù)的其他實(shí)例在該實(shí)例處理其間可能會(huì)有新的commit屠列,所以同一select可能返回不同結(jié)果。
(3)Repeatable Read:這是MySQL的默認(rèn)事務(wù)隔離級(jí)別伞矩,它確保同一事務(wù)的多個(gè)實(shí)例在并發(fā)讀取數(shù)據(jù)時(shí)笛洛,會(huì)看到同樣的數(shù)據(jù)行。不過(guò)理論上乃坤,這會(huì)導(dǎo)致另一個(gè)棘手的問(wèn)題:幻讀 (Phantom Read)苛让。簡(jiǎn)單的說(shuō)沟蔑,幻讀指當(dāng)用戶讀取某一范圍的數(shù)據(jù)行時(shí),另一個(gè)事務(wù)又在該范圍內(nèi)插入了新行蝌诡,當(dāng)用戶再讀取該范圍的數(shù)據(jù)行時(shí)溉贿,會(huì)發(fā)現(xiàn)有新的“幻影” 行枫吧。InnoDB和Falcon存儲(chǔ)引擎通過(guò)多版本并發(fā)控制(MVCC浦旱,Multiversion Concurrency Control)機(jī)制解決了該問(wèn)題。
(4)Serializable:這是最高的隔離級(jí)別九杂,它通過(guò)強(qiáng)制事務(wù)排序颁湖,使之不可能相互沖突,從而解決幻讀問(wèn)題例隆。
臟讀:讀取到未提交的數(shù)據(jù)甥捺。
不可重復(fù)讀:在一個(gè)事務(wù)的兩次查詢之中數(shù)據(jù)不一致,這可能是兩次查詢過(guò)程中間镀层,有另外一個(gè)事務(wù)更新的原有的數(shù)據(jù)镰禾。
幻讀:幻讀問(wèn)題是指一個(gè)事務(wù)的兩次不同時(shí)間的相同查詢返回了不同的的結(jié)果集。例如:一個(gè) select 語(yǔ)句執(zhí)行了兩次唱逢,但是在第二次返回了第一次沒(méi)有返回的行,那么這些行就是“phantom” row吴侦。
如何避免幻讀:由于 SESSION_A 第一次的查詢開(kāi)始于 SESSION_B 插入數(shù)據(jù)前,所以創(chuàng)建了一個(gè)以SELECT操作的時(shí)間為基準(zhǔn)點(diǎn)的 read view,避免了幻讀的產(chǎn)生坞古。所以在 SESSION_A 的事務(wù)結(jié)束前,無(wú)法看到 SESSION_B 對(duì)表 read_view 做出的任何更改 (insert,delete,update)
大致的區(qū)別在于不可重復(fù)讀是由于另一個(gè)事務(wù)對(duì)數(shù)據(jù)的更改所造成的备韧,而幻讀是由于另一個(gè)事務(wù)插入或刪除引起的。
3.3 樂(lè)觀鎖和悲觀鎖
(1)樂(lè)觀鎖:樂(lè)觀鎖假設(shè)數(shù)據(jù)一般情況下不會(huì)造成沖突痪枫,因此在提交更新的時(shí)候才對(duì)數(shù)據(jù)是否存在沖突進(jìn)行檢驗(yàn)织堂。如果存在數(shù)據(jù)沖突則更新失敗。具體的實(shí)現(xiàn)是位數(shù)據(jù)庫(kù)表添加一個(gè)version字段奶陈,每次更新操作都會(huì)修改version易阳。提交時(shí)使用CAS操作修改version,如果修改成功吃粒,則更新數(shù)據(jù)成功潦俺,否則操作失敗。
(2)悲觀鎖:事務(wù)開(kāi)始時(shí)即獲取數(shù)據(jù)的排他鎖声搁,防止其他進(jìn)程讀取或修改該段數(shù)據(jù)黑竞。
在實(shí)際生產(chǎn)環(huán)境里邊,如果并發(fā)量不大且不允許臟讀,可以使用悲觀鎖疏旨;但如果系統(tǒng)的并發(fā)非常大的話,悲觀鎖定會(huì)帶來(lái)非常大的性能問(wèn)題,所以我們就要選擇樂(lè)觀鎖定的方法.很魂。
4.數(shù)據(jù)庫(kù)視圖
在SQL中,view 是基于SQL語(yǔ)句的結(jié)果集的可視化的表檐涝。
CREATE VIEW view_name AS?SELECT column_name(s)?FROM table_name?WHERE condition遏匆;
參考:blog.csdn.net/buhuikanjian/article/details/53105416
優(yōu)點(diǎn):
(1)將經(jīng)常使用的數(shù)據(jù)定義為視圖法挨,簡(jiǎn)化了以后的操作。
(2)安全性幅聘,用戶只能查詢和修改能看到的數(shù)據(jù)凡纳。
視圖和表的區(qū)別:
(1)視圖是已經(jīng)編譯好的sql語(yǔ)句,是基于sql結(jié)果集的可視化的表帝蒿,并不占有實(shí)際的物理空間荐糜。
(2)表里的數(shù)據(jù)增加或者刪除的時(shí)候,視圖里的內(nèi)容也隨著變化
(3)視圖的建立和刪除只影響視圖本身葛超,不影響對(duì)應(yīng)的基本表
(4)一般來(lái)說(shuō)你可以用update暴氏,insert燥筷,delete等sql語(yǔ)句修改表中的數(shù)據(jù)颈畸,而對(duì)視圖只能進(jìn)行select操作枯饿。但是也存在可更新的視圖赫模,對(duì)于這類視圖的update凳鬓,insert和delete等操作最終會(huì)作用于與其相關(guān)的表中數(shù)據(jù)眉抬。因此遭顶,表是數(shù)據(jù)庫(kù)中數(shù)據(jù)存儲(chǔ)的基礎(chǔ)喇聊,而視圖只是為了滿足某種查詢要求而建立的一個(gè)對(duì)象芜飘。
5. B樹(shù)和B+樹(shù)
*?http://www.reibang.com/p/ea8d0418d4ed
*?https://blog.codinglabs.org/articles/theory-of-mysql-index.html
6. SQL基礎(chǔ)
1. 內(nèi)連接:返回左表和右表的交集部分
2. 左外連接:返回全部的左表數(shù)據(jù)务豺,右表符合搜索條件的部分展示,不存在的部分顯示NULL
3. 右外連接:返回全部的右表數(shù)據(jù)燃箭,左表符合搜素條件的部分展示冲呢,不存在的部分顯示NULL
4. group by使用
(1)select 類別, avg(數(shù)量) AS 平均值 from product group by 類別;? //獲取每種類別商品數(shù)量的平均值
(2)select 類別, sum(數(shù)量) as 數(shù)量之和 from?product? group by 類別? //獲取每種類別商品數(shù)量之和
(3)where 子句的作用是在對(duì)查詢結(jié)果進(jìn)行分組前,即在分組之前過(guò)濾數(shù)據(jù)招狸。where條件中不能包含聚合函數(shù)敬拓。
(4)having 子句的作用是篩選滿足條件的組,即在分組之后過(guò)濾數(shù)據(jù)裙戏。條件中經(jīng)常包含聚合函數(shù)乘凸。
(5)select 類別, sum(數(shù)量) as 數(shù)量之和 from product group by 類別 having sum(數(shù)量) > 18