當(dāng)前數(shù)據(jù)庫分為關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫
關(guān)系型數(shù)據(jù)庫
關(guān)系型數(shù)據(jù)庫:指采用了關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫。
關(guān)系模型指的就是二維表格模型赠法,而一個(gè)關(guān)系型數(shù)據(jù)庫就是由二維表及其之間的聯(lián)系所組成的一個(gè)數(shù)據(jù)組織蓬痒。
關(guān)系模型中常用的概念:
關(guān)系:一張二維表扯键,每個(gè)關(guān)系都具有一個(gè)關(guān)系名,也就是表名
元組:二維表中的一行蜒程,在數(shù)據(jù)庫中被稱為記錄
屬性:二維表中的一列税弃,在數(shù)據(jù)庫中被稱為字段
域:屬性的取值范圍纪岁,也就是數(shù)據(jù)庫中某一列的取值限制
關(guān)鍵字:一組可以唯一標(biāo)識元組的屬性,數(shù)據(jù)庫中常稱為主鍵钙皮,由一個(gè)或多個(gè)列組成
關(guān)系模式:指對關(guān)系的描述蜂科。其格式為:關(guān)系名(屬性1,屬性2短条, ... ... 导匣,屬性N),在數(shù)據(jù)庫中成為表結(jié)構(gòu)
關(guān)系型數(shù)據(jù)庫的優(yōu)點(diǎn):
1.容易理解:二維表結(jié)構(gòu)是非常貼近邏輯世界的一個(gè)概念茸时,關(guān)系模型相對網(wǎng)狀贡定、層次等其他模型來說更容易理解
2.使用方便:通用的SQL語言使得操作關(guān)系型數(shù)據(jù)庫非常方便
3.易于維護(hù):豐富的完整性(實(shí)體完整性、參照完整性和用戶定義的完整性)大大減低了數(shù)據(jù)冗余和數(shù)據(jù)不一致的概率
關(guān)系型數(shù)據(jù)庫存在的問題
1.網(wǎng)站的用戶并發(fā)性非常高可都,往往達(dá)到每秒上萬次讀寫請求缓待,對于傳統(tǒng)關(guān)系型數(shù)據(jù)庫來說,硬盤I/O
是一個(gè)很大的瓶頸
2.網(wǎng)站每天產(chǎn)生的數(shù)據(jù)量是巨大的渠牲,對于關(guān)系型數(shù)據(jù)庫來說旋炒,在一張包含海量數(shù)據(jù)的表中查詢,效率是非常低的
3.在基于web的結(jié)構(gòu)當(dāng)中签杈,數(shù)據(jù)庫是最難進(jìn)行橫向擴(kuò)展的瘫镇,當(dāng)一個(gè)應(yīng)用系統(tǒng)的用戶量和訪問量與日俱增的時(shí)候,數(shù)據(jù)庫卻沒有辦法像web server
和app server
那樣簡單的通過添加更多的硬件和服務(wù)節(jié)點(diǎn)來擴(kuò)展性能和負(fù)載能力答姥。當(dāng)需要對數(shù)據(jù)庫系統(tǒng)進(jìn)行升級和擴(kuò)展時(shí)铣除,往往需要停機(jī)維護(hù)和數(shù)據(jù)遷移。
4.性能欠佳:在關(guān)系型數(shù)據(jù)庫中鹦付,導(dǎo)致性能欠佳的最主要原因是多表的關(guān)聯(lián)查詢尚粘,以及復(fù)雜的數(shù)據(jù)分析類型的復(fù)雜SQL報(bào)表查詢。為了保證數(shù)據(jù)庫的ACID特性敲长,必須盡量按照其要求的范式進(jìn)行設(shè)計(jì)郎嫁,關(guān)系型數(shù)據(jù)庫中的表都是存儲一個(gè)格式化的數(shù)據(jù)結(jié)構(gòu)。
數(shù)據(jù)庫事務(wù)必須具備ACID
特性祈噪,ACID
分別是Atomic
原子性泽铛,Consistency
一致性,
Isolation
隔離性钳降,Durability
持久性。
當(dāng)今十大主流的關(guān)系型數(shù)據(jù)庫
Oracle腌巾,Microsoft SQL Server遂填,MySQL铲觉,PostgreSQL,DB2吓坚,
Microsoft Access撵幽, SQLite,Teradata礁击,MariaDB(MySQL的一個(gè)分支)盐杂,SAP
非關(guān)系型數(shù)據(jù)庫
非關(guān)系型數(shù)據(jù)庫:指非關(guān)系型的,分布式的哆窿,且一般不保證遵循ACID
原則的數(shù)據(jù)存儲系統(tǒng)链烈。
非關(guān)系型數(shù)據(jù)庫結(jié)構(gòu)
非關(guān)系型數(shù)據(jù)庫以鍵值對存儲,且結(jié)構(gòu)不固定挚躯,每一個(gè)元組可以有不一樣的字段,每個(gè)元組可以根據(jù)需要增加一些自己的鍵值對码荔,不局限于固定的結(jié)構(gòu)漩勤,可以減少一些時(shí)間和空間的開銷。
優(yōu)點(diǎn)
1.用戶可以根據(jù)需要去添加自己需要的字段缩搅,為了獲取用戶的不同信息越败,不像關(guān)系型數(shù)據(jù)庫中,要對多表進(jìn)行關(guān)聯(lián)查詢硼瓣。僅需要根據(jù)id
取出相應(yīng)的value
就可以完成查詢究飞。
2.適用于SNS(Social Networking Services)
中,例如facebook巨双,微博噪猾。系統(tǒng)的升級,功能的增加筑累,往往意味著數(shù)據(jù)結(jié)構(gòu)巨大變動袱蜡,這一點(diǎn)關(guān)系型數(shù)據(jù)庫難以應(yīng)付,需要新的結(jié)構(gòu)化數(shù)據(jù)存儲慢宗。由于不可能用一種數(shù)據(jù)結(jié)構(gòu)化存儲應(yīng)付所有的新的需求坪蚁,因此,非關(guān)系型數(shù)據(jù)庫嚴(yán)格上不是一種數(shù)據(jù)庫镜沽,應(yīng)該是一種數(shù)據(jù)結(jié)構(gòu)化存儲方法的集合敏晤。
不足:
只適合存儲一些較為簡單的數(shù)據(jù),對于需要進(jìn)行較復(fù)雜查詢的數(shù)據(jù)缅茉,關(guān)系型數(shù)據(jù)庫顯的更為合適嘴脾。不適合持久存儲海量數(shù)據(jù)
非關(guān)系型數(shù)據(jù)庫的分類
非關(guān)系型數(shù)據(jù)庫都是針對某些特定的應(yīng)用需求出現(xiàn)的,因此,對于該類應(yīng)用译打,具有極高的性能耗拓。依據(jù)結(jié)構(gòu)化方法以及應(yīng)用場合的不同,主要分為以下幾類:
面向高性能并發(fā)讀寫的key-value數(shù)據(jù)庫:
key-value
數(shù)據(jù)庫的主要特點(diǎn)是具有極高的并發(fā)讀寫性能
Key-value
數(shù)據(jù)庫是一種以鍵值對存儲數(shù)據(jù)的一種數(shù)據(jù)庫奏司,類似Java
中的map
乔询。可以將整個(gè)數(shù)據(jù)庫理解為一個(gè)大的map
韵洋,每個(gè)鍵都會對應(yīng)一個(gè)唯一的值竿刁。
主流代表為Redis, Amazon DynamoDB搪缨, Memcached食拜,
Microsoft Azure Cosmos DB和Hazelcast
面向海量數(shù)據(jù)訪問的面向文檔數(shù)據(jù)庫:
這類數(shù)據(jù)庫的主要特點(diǎn)是在海量的數(shù)據(jù)中可以快速的查詢數(shù)據(jù)
文檔存儲通常使用內(nèi)部表示法,可以直接在應(yīng)用程序中處理勉吻,主要是JSON
监婶。JSON
文檔也可以作為純文本存儲在鍵值存儲或關(guān)系數(shù)據(jù)庫系統(tǒng)中。
主流代表為MongoDB齿桃,Amazon DynamoDB惑惶,Couchbase,
Microsoft Azure Cosmos DB和CouchDB
面向搜索數(shù)據(jù)內(nèi)容的搜索引擎:
搜索引擎是專門用于搜索數(shù)據(jù)內(nèi)容的NoSQL數(shù)據(jù)庫管理系統(tǒng)短纵。
主要是用于對海量數(shù)據(jù)進(jìn)行近實(shí)時(shí)的處理和分析處理带污,可用于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘
主流代表為Elasticsearch,Splunk香到,Solr鱼冀,MarkLogic和Sphinx
面向可擴(kuò)展性的分布式數(shù)據(jù)庫:
這類數(shù)據(jù)庫的主要特點(diǎn)是具有很強(qiáng)的可拓展性
普通的關(guān)系型數(shù)據(jù)庫都是以行為單位來存儲數(shù)據(jù)的,擅長以行為單位的讀入處理悠就,比如特定條件數(shù)據(jù)的獲取千绪。因此,關(guān)系型數(shù)據(jù)庫也被成為面向行的數(shù)據(jù)庫梗脾。相反荸型,面向列的數(shù)據(jù)庫是以列為單位來存儲數(shù)據(jù)的,擅長以列為單位讀入數(shù)據(jù)炸茧。
這類數(shù)據(jù)庫想解決的問題就是傳統(tǒng)數(shù)據(jù)庫存在可擴(kuò)展性上的缺陷瑞妇,這類數(shù)據(jù)庫可以適應(yīng)數(shù)據(jù)量的增加以及數(shù)據(jù)結(jié)構(gòu)的變化,將數(shù)據(jù)存儲在記錄中梭冠,能夠容納大量動態(tài)列辕狰。由于列名和記錄鍵不是固定的,并且由于記錄可能有數(shù)十億列控漠,因此可擴(kuò)展性存儲可以看作是二維鍵值存儲蔓倍。
主流代表為Cassandra,HBase,Microsoft Azure Cosmos DB偶翅,
Datastax Enterprise和Accumulo
CAP理論
NoSQL的基本需求就是支持分布式存儲他去,嚴(yán)格一致性與可用性需要互相取舍
CAP理論:一個(gè)分布式系統(tǒng)不可能同時(shí)滿足C(一致性)、A(可用性)倒堕、P(分區(qū)容錯(cuò)性)三個(gè)基本需求,并且最多只能滿足其中的兩項(xiàng)爆价。對于一個(gè)分布式系統(tǒng)來說垦巴,分區(qū)容錯(cuò)是基本需求,否則不能稱之為分布式系統(tǒng)铭段,因此需要在C和A之間尋求平衡
C(Consistency)
一致性
一致性是指更新操作成功并返回客戶端完成后骤宣,所有節(jié)點(diǎn)在同一時(shí)間的數(shù)據(jù)完全一致。與ACID的C完全不同
A(Availability)
可用性
可用性是指服務(wù)一直可用序愚,而且是正常響應(yīng)時(shí)間憔披。
P(Partition tolerance)
分區(qū)容錯(cuò)性
分區(qū)容錯(cuò)性是指分布式系統(tǒng)在遇到某節(jié)點(diǎn)或網(wǎng)絡(luò)分區(qū)故障的時(shí)候,仍然能夠?qū)ν馓峁M足一致性和可用性的服務(wù)爸吮。
關(guān)系型與非關(guān)系型數(shù)據(jù)庫的比較
1.成本:Nosql
數(shù)據(jù)庫簡單易部署芬膝,基本都是開源軟件,不需要像使用Oracle
那樣花費(fèi)大量成本購買使用形娇,相比關(guān)系型數(shù)據(jù)庫價(jià)格便宜锰霜。
2.查詢速度:Nosql
數(shù)據(jù)庫將數(shù)據(jù)存儲于緩存之中,而且不需要經(jīng)過SQL
層的解析桐早,關(guān)系型數(shù)據(jù)庫將數(shù)據(jù)存儲在硬盤中癣缅,自然查詢速度遠(yuǎn)不及Nosql
數(shù)據(jù)庫。
3.存儲數(shù)據(jù)的格式:Nosql
的存儲格式是key,value
形式哄酝、文檔形式友存、圖片形式等等,所以可以存儲基礎(chǔ)類型以及對象或者是集合等各種格式陶衅,而數(shù)據(jù)庫則只支持基礎(chǔ)類型屡立。
4.擴(kuò)展性:關(guān)系型數(shù)據(jù)庫有類似join這樣的多表查詢機(jī)制的限制導(dǎo)致擴(kuò)展很艱難。Nosql
基于鍵值對万哪,數(shù)據(jù)之間沒有耦合性侠驯,所以非常容易水平擴(kuò)展。
5.持久存儲:Nosql
不使用于持久存儲奕巍,海量數(shù)據(jù)的持久存儲吟策,還是需要關(guān)系型數(shù)據(jù)庫
6.數(shù)據(jù)一致性:非關(guān)系型數(shù)據(jù)庫一般強(qiáng)調(diào)的是數(shù)據(jù)最終一致性,不像關(guān)系型數(shù)據(jù)庫一樣強(qiáng)調(diào)數(shù)據(jù)的強(qiáng)一致性的止,從非關(guān)系型數(shù)據(jù)庫中讀到的有可能還是處于一個(gè)中間態(tài)的數(shù)據(jù)檩坚,
Nosql
不提供對事務(wù)的處理。
最近的數(shù)據(jù)庫排名
網(wǎng)站地址:https://db-engines.com/en/ranking
可以發(fā)現(xiàn)現(xiàn)在主流的還是關(guān)系型數(shù)據(jù)庫,非關(guān)系型數(shù)據(jù)庫中Redis和MongoDB最受歡迎