在此之前要了解關(guān)系型數(shù)據(jù)庫(kù)與非關(guān)系型數(shù)據(jù)庫(kù)
關(guān)系型數(shù)據(jù)庫(kù)(mysql , oracle, sqlserver,db2)
大部分收費(fèi)
支持關(guān)系關(guān)聯(lián)
支持SQL語(yǔ)句查詢
更好的對(duì)事務(wù)支持
存儲(chǔ)過(guò)程
函數(shù)
視圖。涛浙。绸贡。
非關(guān)系型數(shù)據(jù)庫(kù)
NOSQL : (NoSQL = Not Only SQL )暇唾,意即“不僅僅是SQL”祝峻,是一項(xiàng)全新的數(shù)據(jù)庫(kù)革命性運(yùn)動(dòng)伪嫁,早期就有人提出,發(fā)展至2009年趨勢(shì)越發(fā)高漲让蕾。NoSQL的擁護(hù)者們提倡運(yùn)用非關(guān)系型的數(shù)據(jù)存儲(chǔ)涡戳,相對(duì)于鋪天蓋地的關(guān)系型數(shù)據(jù)庫(kù)運(yùn)用结蟋,這一概念無(wú)疑是一種全新的思維的注入。
NoSQL數(shù)據(jù)庫(kù)的四大分類
鍵值([Key-Value]*)存儲(chǔ)數(shù)據(jù)庫(kù)
關(guān)系型數(shù)據(jù)庫(kù)與非關(guān)系型數(shù)據(jù)庫(kù)區(qū)別
關(guān)系型數(shù)據(jù)庫(kù)最典型的數(shù)據(jù)結(jié)構(gòu)是表渔彰,由二維表及其之間的聯(lián)系所組成的一個(gè)數(shù)據(jù)組織
優(yōu)點(diǎn):
1嵌屎、易于維護(hù):都是使用表結(jié)構(gòu),格式一致恍涂;
2宝惰、使用方便:SQL語(yǔ)言通用,可用于復(fù)雜查詢再沧;
3尼夺、復(fù)雜操作:支持SQL,可用于一個(gè)表以及多個(gè)表之間非常復(fù)雜的查詢炒瘸。
缺點(diǎn):
1.網(wǎng)站的用戶并發(fā)性非常高淤堵,往往達(dá)到每秒上萬(wàn)次讀寫請(qǐng)求,對(duì)于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)來(lái)說(shuō)顷扩,硬盤I/O是一個(gè)很大的瓶頸
2.網(wǎng)站每天產(chǎn)生的數(shù)據(jù)量是巨大的拐邪,對(duì)于關(guān)系型數(shù)據(jù)庫(kù)來(lái)說(shuō),在一張包含海量數(shù)據(jù)的表中查詢隘截,效率是非常低的
3.在基于web的結(jié)構(gòu)當(dāng)中扎阶,數(shù)據(jù)庫(kù)是最難進(jìn)行橫向擴(kuò)展的,當(dāng)一個(gè)應(yīng)用系統(tǒng)的用戶量和訪問(wèn)量與日俱增的時(shí)候婶芭,數(shù)據(jù)庫(kù)卻沒(méi)有辦法像web server和app server那樣簡(jiǎn)單的通過(guò)添加更多的硬件和服務(wù)節(jié)點(diǎn)來(lái)擴(kuò)展性能和負(fù)載能力乘陪。當(dāng)需要對(duì)數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行升級(jí)和擴(kuò)展時(shí),往往需要停機(jī)維護(hù)和數(shù)據(jù)遷移雕擂。
4.性能欠佳:在關(guān)系型數(shù)據(jù)庫(kù)中,導(dǎo)致性能欠佳的最主要原因是多表的關(guān)聯(lián)查詢贱勃,以及復(fù)雜的數(shù)據(jù)分析類型的復(fù)雜SQL報(bào)表查詢井赌。為了保證數(shù)據(jù)庫(kù)的ACID特性,必須盡量按照其要求的范式進(jìn)行設(shè)計(jì)贵扰,關(guān)系型數(shù)據(jù)庫(kù)中的表都是存儲(chǔ)一個(gè)格式化的數(shù)據(jù)結(jié)構(gòu)仇穗。
非關(guān)系型數(shù)據(jù)庫(kù)嚴(yán)格上不是一種數(shù)據(jù)庫(kù),應(yīng)該是一種數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)方法的集合戚绕,可以是文檔或者鍵值對(duì)等纹坐。
優(yōu)點(diǎn):
1、格式靈活:存儲(chǔ)數(shù)據(jù)的格式可以是key,value形式舞丛、文檔形式耘子、圖片形式等等果漾,文檔形式、圖片形式等等谷誓,使用靈活绒障,應(yīng)用場(chǎng)景廣泛,而關(guān)系型數(shù)據(jù)庫(kù)則只支持基礎(chǔ)類型捍歪。
2户辱、速度快:nosql可以使用硬盤或者隨機(jī)存儲(chǔ)器作為載體,而關(guān)系型數(shù)據(jù)庫(kù)只能使用硬盤糙臼;
3庐镐、高擴(kuò)展性;
4变逃、成本低:nosql數(shù)據(jù)庫(kù)部署簡(jiǎn)單必逆,基本都是開(kāi)源軟件。
缺點(diǎn):
1韧献、不提供sql支持末患,學(xué)習(xí)和使用成本較高;
2锤窑、無(wú)事務(wù)處理璧针;
3、數(shù)據(jù)結(jié)構(gòu)相對(duì)復(fù)雜渊啰,復(fù)雜查詢方面稍欠探橱。
- 只適合存儲(chǔ)一些較為簡(jiǎn)單的數(shù)據(jù),對(duì)于需要進(jìn)行較復(fù)雜查詢的數(shù)據(jù)绘证,關(guān)系型數(shù)據(jù)庫(kù)顯的更為合適隧膏。不適合持久存儲(chǔ)海量數(shù)據(jù)
非關(guān)系型數(shù)據(jù)庫(kù)的分類和比較:
1、文檔型
2嚷那、key-value型
3胞枕、列式數(shù)據(jù)庫(kù)
4、圖形數(shù)據(jù)庫(kù)
這一類數(shù)據(jù)庫(kù)主要會(huì)使用到一個(gè)哈希表魏宽,這個(gè)表中有一個(gè)特定的鍵和一個(gè)指針指向特定的數(shù)據(jù)腐泻。Key/value模型對(duì)于IT系統(tǒng)來(lái)說(shuō)的優(yōu)勢(shì)在于簡(jiǎn)單、易部署队询。但是如果DBA(DatabaseAdministrator)只對(duì)部分值進(jìn)行查詢或更新的時(shí)候派桩,Key/value就顯得效率低下了。舉例如:Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.
列存儲(chǔ)數(shù)據(jù)庫(kù)蚌斩。
這部分?jǐn)?shù)據(jù)庫(kù)通常是用來(lái)應(yīng)對(duì)分布式存儲(chǔ)的海量數(shù)據(jù)铆惑。鍵仍然存在,但是它們的特點(diǎn)是指向了多個(gè)列。這些列是由列家族來(lái)安排的员魏。如:Cassandra, HBase, Riak.
文檔型數(shù)據(jù)庫(kù)
文檔型數(shù)據(jù)庫(kù)的靈感是來(lái)自于Lotus Notes辦公軟件的丑蛤,而且它同第一種鍵值存儲(chǔ)相類似。該類型的數(shù)據(jù)模型是版本化的文檔逆趋,半結(jié)構(gòu)化的文檔以特定的格式存儲(chǔ)盏阶,比如JSON。文檔型數(shù)據(jù)庫(kù)可 以看作是鍵值數(shù)據(jù)庫(kù)的升級(jí)版闻书,允許之間嵌套鍵值名斟。而且文檔型數(shù)據(jù)庫(kù)比鍵值數(shù)據(jù)庫(kù)的查詢效率更高。如:CouchDB, MongoDb. 國(guó)內(nèi)也有文檔型數(shù)據(jù)庫(kù)SequoiaDB魄眉,已經(jīng)開(kāi)源砰盐。
圖形(Graph)數(shù)據(jù)庫(kù)
圖形結(jié)構(gòu)的數(shù)據(jù)庫(kù)同其他行列以及剛性結(jié)構(gòu)的SQL數(shù)據(jù)庫(kù)不同,它是使用靈活的圖形模型坑律,并且能夠擴(kuò)展到多個(gè)服務(wù)器上岩梳。NoSQL數(shù)據(jù)庫(kù)沒(méi)有標(biāo)準(zhǔn)的查詢語(yǔ)言(SQL),因此進(jìn)行數(shù)據(jù)庫(kù)查詢需要制定數(shù)據(jù)模型晃择。許多NoSQL數(shù)據(jù)庫(kù)都有REST式的數(shù)據(jù)接口或者查詢API冀值。如:Neo4J, InfoGrid, Infinite Graph.
因此,我們總結(jié)NoSQL數(shù)據(jù)庫(kù)在以下的這幾種情況下比較適用:
1宫屠、數(shù)據(jù)模型比較簡(jiǎn)單列疗;
2、需要靈活性更強(qiáng)的IT系統(tǒng)浪蹂;
3抵栈、對(duì)數(shù)據(jù)庫(kù)性能要求較高;
4坤次、不需要高度的數(shù)據(jù)一致性古劲;
5、對(duì)于給定key缰猴,比較容易映射復(fù)雜值的環(huán)境产艾。
關(guān)系型與非關(guān)系型數(shù)據(jù)庫(kù)的比較
- 成本:Nosql數(shù)據(jù)庫(kù)簡(jiǎn)單易部署,基本都是開(kāi)源軟件滑绒,不需要像使用Oracle那樣花費(fèi)大量成本購(gòu)買使用闷堡,相比關(guān)系型數(shù)據(jù)庫(kù)價(jià)格便宜。
- 查詢速度:Nosql數(shù)據(jù)庫(kù)將數(shù)據(jù)存儲(chǔ)于緩存之中蹬挤,而且不需要經(jīng)過(guò)SQL層的解析,關(guān)系型數(shù)據(jù)庫(kù)將數(shù)據(jù)存儲(chǔ)在硬盤中棘幸,自然查詢速度遠(yuǎn)不及Nosql數(shù)據(jù)庫(kù)焰扳。
- 存儲(chǔ)數(shù)據(jù)的格式:Nosql的存儲(chǔ)格式是key,value形式、文檔形式、圖片形式等等吨悍,所以可以存儲(chǔ)基礎(chǔ)類型以及對(duì)象或者是集合等各種格式扫茅,而數(shù)據(jù)庫(kù)則只支持基礎(chǔ)類型。
- 擴(kuò)展性:關(guān)系型數(shù)據(jù)庫(kù)有類似join這樣的多表查詢機(jī)制的限制導(dǎo)致擴(kuò)展很艱難育瓜。Nosql基于鍵值對(duì)葫隙,數(shù)據(jù)之間沒(méi)有耦合性,所以非常容易水平擴(kuò)展躏仇。
- 持久存儲(chǔ):Nosql不使用于持久存儲(chǔ)恋脚,海量數(shù)據(jù)的持久存儲(chǔ),還是需要關(guān)系型數(shù)據(jù)庫(kù)
6.數(shù)據(jù)一致性:非關(guān)系型數(shù)據(jù)庫(kù)一般強(qiáng)調(diào)的是數(shù)據(jù)最終一致性焰手,不像關(guān)系型數(shù)據(jù)庫(kù)一樣強(qiáng)調(diào)數(shù)據(jù)的強(qiáng)一致性糟描,從非關(guān)系型數(shù)據(jù)庫(kù)中讀到的有可能還是處于一個(gè)中間態(tài)的數(shù)據(jù),
Nosql不提供對(duì)事務(wù)的處理
存儲(chǔ)方式:
- 存儲(chǔ)方式 : 虛擬內(nèi)存+持久化
- 查詢方式 : 每種非關(guān)系數(shù)據(jù)庫(kù)都有自己的查詢方式
- 適合場(chǎng)景 : 日志存儲(chǔ)书妻, 事件記錄船响, 內(nèi)容管理,博客平臺(tái)躲履,論壇见间,....... 留言,彈幕等
- 數(shù)據(jù)處理方式: 數(shù)據(jù)存儲(chǔ)在硬盤上工猜, 只不過(guò)不需要經(jīng)常讀取硬盤中的數(shù)據(jù)米诉,在啟動(dòng)的時(shí)候會(huì)自動(dòng)將硬盤中的數(shù)據(jù)加載到內(nèi)存中
- 日志系統(tǒng) : 地理位置存儲(chǔ), 數(shù)據(jù)規(guī)模增長(zhǎng)較快域慷,物流系統(tǒng)荒辕,積分,社交系統(tǒng)犹褒。物聯(lián)網(wǎng)系統(tǒng)抵窒,游戲裝備,游戲及時(shí)數(shù)據(jù)
1000W 條數(shù)據(jù) 2.35 s 1.02s
MongoDB
它的特點(diǎn)是高性能叠骑、易部署李皇、易使用,存儲(chǔ)數(shù)據(jù)非常方便宙枷。主要功能特性有:
*面向集合存儲(chǔ)掉房,易存儲(chǔ)對(duì)象類型的數(shù)據(jù)。
*模式自由慰丛。
*支持動(dòng)態(tài)查詢卓囚。
*支持完全索引,包含內(nèi)部對(duì)象诅病。
*支持查詢哪亿。
*支持復(fù)制和故障恢復(fù)粥烁。
*使用高效的二進(jìn)制數(shù)據(jù)存儲(chǔ),包括大型對(duì)象(如視頻等)蝇棉。
*自動(dòng)處理碎片讨阻,以支持云計(jì)算層次的擴(kuò)展性。
*支持 Golang篡殷,RUBY钝吮,PYTHON,JAVA板辽,C++奇瘦,PHP,C#等多種語(yǔ)言戳气。
*文件存儲(chǔ)格式為BSON(一種JSON的擴(kuò)展)链患。
*可通過(guò)網(wǎng)絡(luò)訪問(wèn)。
所謂“面向集合”(Collection-Oriented)瓶您,意思是數(shù)據(jù)被分組存儲(chǔ)在數(shù)據(jù)集中麻捻,被稱為一個(gè)集合(Collection)。每個(gè)集合在數(shù)據(jù)庫(kù)中都有一個(gè)唯一的標(biāo)識(shí)名呀袱,并且可以包含無(wú)限數(shù)目的文檔贸毕。集合的概念類似關(guān)系型數(shù)據(jù)庫(kù)(RDBMS)里的表(table),不同的是它不需要定義任何模式(schema)夜赵。Nytro MegaRAID技術(shù)中的閃存高速緩存算法明棍,能夠快速識(shí)別數(shù)據(jù)庫(kù)內(nèi)大數(shù)據(jù)集中的熱數(shù)據(jù),提供一致的性能改進(jìn)寇僧。
模式自由(schema-free)摊腋,意味著對(duì)于存儲(chǔ)在mongodb數(shù)據(jù)庫(kù)中的文件,我們不需要知道它的任何結(jié)構(gòu)定義嘁傀。如果需要的話兴蒸,你完全可以把不同結(jié)構(gòu)的文件存儲(chǔ)在同一個(gè)數(shù)據(jù)庫(kù)里。
存儲(chǔ)在集合中的文檔细办,被存儲(chǔ)為鍵-值對(duì)的形式橙凳。鍵用于唯一標(biāo)識(shí)一個(gè)文檔,為字符串類型笑撞,而值則可以是各種復(fù)雜的文件類型岛啸。我們稱這種存儲(chǔ)形式為BSON(Binary Serialized Document Format)*。
MongoDB已經(jīng)在多個(gè)站點(diǎn)部署茴肥,其主要場(chǎng)景如下:
1)網(wǎng)站實(shí)時(shí)數(shù)據(jù)處理坚踩。它非常適合實(shí)時(shí)的插入、更新與查詢瓤狐,并具備網(wǎng)站實(shí)時(shí)數(shù)據(jù)存儲(chǔ)所需的復(fù)制及高度伸縮性瞬铸。
2)緩存卧晓。由于性能很高,它適合作為信息基礎(chǔ)設(shè)施的緩存層赴捞。在系統(tǒng)重啟之后,由它搭建的持久化緩存層可以避免下層的數(shù)據(jù)源過(guò)載郁稍。
3)高伸縮性的場(chǎng)景赦政。非常適合由數(shù)十或數(shù)百臺(tái)服務(wù)器組成的數(shù)據(jù)庫(kù),它的路線圖中已經(jīng)包含對(duì)MapReduce引擎的內(nèi)置支持耀怜。
不適用的場(chǎng)景如下:
1)要求高度事務(wù)性的系統(tǒng)恢着。
2)傳統(tǒng)的商業(yè)智能應(yīng)用。
3)復(fù)雜的跨文檔(表)級(jí)聯(lián)查詢财破。