思維導(dǎo)圖學(xué)《Mongo 官方文檔》

前言

本文是對 Mongo 官方文檔粗略的總結(jié)沛简，并沒有涉及到很深的細(xì)節(jié)（細(xì)節(jié)還是直接看官方文檔吧）扰藕。我認(rèn)為 Mongo 有重要的就 3 點(diǎn)：

存儲引擎原理问顷，如何保證斷電后恢復(fù)數(shù)據(jù)九府？Mongo 的 data 在文件系統(tǒng)中稻励，是如何組織和保存的父阻？
Replication
Sharding

思維導(dǎo)圖

Basic

Aggregation & Data Modeling

Indexes

Storage

Replication & Sharding

思考

Document 在內(nèi)部是如何存儲的？

每個 Document 被保存在一個 Record 中望抽。Record 相當(dāng)于 MongoDB 內(nèi)部分配的一塊空間加矛，除了保存 Document 的內(nèi)容可能還會預(yù)留一些填充的額外空間。對于寫入后的 Document 如果還會更新煤篙，可能導(dǎo)致 Document 長度增加斟览，就可以利用上額外的填充空間來。若業(yè)務(wù)對于寫入后的 Document 不會再更新或刪除（像監(jiān)控日志辑奈、流水記錄等）苛茂，可以指定無填充的 Record 分配策略，更節(jié)省空間鸠窗。

單個 Document 的容量是否有限制妓羊？

16MB。Document 這種 JSON 形態(tài)天生會帶來數(shù)據(jù)存儲冗余稍计，主要是 field 屬性每個 Document 都會保存一遍躁绸。目前 3.2 版本的 MongoDB 已經(jīng)將新的 WiredTiger 作為默認(rèn)存儲引擎，它提供了壓縮功能臣嚣，有兩種壓縮形式：

Snappy 默認(rèn)壓縮算法净刮，在壓縮率和 CPU 開銷之間取得平衡。
Zlib 更高的壓縮率硅则，但也帶來更高的 CPU 開銷淹父。

而每個 Document 依然有最大容量限制，不能無限增長下去怎虫，這個限制目前是 16MB弹灭。那么我要存大于 16MB 的文件怎么辦督暂，MongoDB 提供了 GridFS 來存儲超過 16MB 大小的文件。如下圖所示穷吮，一個大文件被拆分成小的 File Chunk，每個 Chunk 大小 255KB饥努，并存放在一個 Document 中捡鱼。GridFS 使用了 2 個 Collection 來分別存放文件 Chunk 和文件元數(shù)據(jù)。

遇到真正的「大數(shù)據(jù)」（單機(jī)存儲容量不夠）怎么辦酷愧？

分片化：利用更多的機(jī)器來提供更大的容量驾诈，分片集群采用代理模式：

而每個分片上的數(shù)據(jù)又以 Chunk 的形式組織（類似于 Redis Cluster 的 Slot 概念），以便于集群內(nèi)部的數(shù)據(jù)遷移和再平衡溶浴。比較容易混淆的是這里的 Chunk 不是前面 GridFS 里提到的 Chunk乍迄，它們的關(guān)系大概如下圖：

Mongo 的數(shù)據(jù)安全嗎？在保證效率的同時士败，在服務(wù)器突然宕機(jī)的情況下闯两，是否能夠保存數(shù)據(jù)？

安全和效率其實(shí)是相互制約的谅将，越安全則效率越低漾狼，越高效則越不安全。MongoDB 的設(shè)計(jì)場景考慮的是應(yīng)對大量的數(shù)據(jù)寫入和查詢饥臂，而數(shù)據(jù)的重要性相對沒那么高逊躁。所以 MongoDB 的默認(rèn)設(shè)置在安全和效率之間，更偏向效率隅熙。

Write To Buffer Without ACK

這個模式下 MongoDB 是不確認(rèn)寫請求的稽煤，Client 端調(diào)用驅(qū)動寫入后若沒有網(wǎng)絡(luò)錯誤就認(rèn)為成功，實(shí)際到底寫入成功沒有是不確定的囚戚。即使網(wǎng)絡(luò)沒有問題酵熙，數(shù)據(jù)到達(dá) MongoDB 后它先保存在內(nèi)存 Buffer 中，再異步寫入 Journaling 日志弯淘，這中間有 100ms（默認(rèn)值）的落盤（寫入磁盤）時間窗口绿店。一般數(shù)據(jù)庫的設(shè)計(jì)都是先寫 Journaling 的流水日志，隨后異步再寫真正的數(shù)據(jù)文件到磁盤庐橙，這個可能就比較長了假勿，MongoDB 是 60 秒或者 Journaling 日志達(dá)到 2G。

Write To Buffer With ACK

這個比上一種模式稍微好一點(diǎn)态鳖，MongoDB 收到寫入請求转培，先寫入內(nèi)存 Buffer 后回發(fā) Ack 確認(rèn)。Client 端能確保 MongoDB 收到了寫入數(shù)據(jù)浆竭，但依然有短暫的 Journaling 日志落盤時差導(dǎo)致潛在的數(shù)據(jù)丟失可能浸须。

Write To Journaling With ACK

這個模式確保至少寫入 Journaling 日志后才回發(fā) Ack 確認(rèn)惨寿，Client 端能確保數(shù)據(jù)至少寫入磁盤了，安全性較高删窒。

Write To Replica Buffer With ACK

這個模式是針對多副本集的裂垦，為了提升數(shù)據(jù)安全性，除了及時寫入磁盤也可以通過寫多個副本來提升肌索。在這個模式下蕉拢，數(shù)據(jù)至少寫入 2 個副本的內(nèi)存 Buffer 中才回發(fā) Ack 確認(rèn)。雖然都在內(nèi)存 Buffer 中诚亚，但兩個實(shí)例在落盤短暫的 100ms 時差中同時故障的概率很低晕换，所以安全性有所提升。

MMAPv1 和 WiredTiger 有什么區(qū)別站宗？

MMAPv1 是 Mongo 在 3.0 以前的存儲引擎闸准，WiredTiger 是 Mongo 在 3.2 及以后版本的默認(rèn)存儲引擎；
MMAPv1 只是單純地將 BSON 數(shù)據(jù)直接存儲在磁盤上梢灭，WiredTiger 則會在數(shù)據(jù)從內(nèi)存存儲到磁盤前進(jìn)行一次壓縮夷家；
MMAPv1 在 3.0 版本之前，以 database 為單位加鎖或辖，對同一個Database的其他Collection所做的操作也會被阻塞瘾英。而到了 3.0 版本，MMAPv1 則開始使用以 Collection 為單位的加鎖颂暇。WiredTiger 是基于 Document 級鎖機(jī)制缺谴。

MMAPv1 是如何分配記錄的？

在MongoDB中耳鸯，每條數(shù)據(jù)以 Document 的形式進(jìn)行存儲湿蛔，并通過 Collection 來管理Document。同一個Collection中的Document會根據(jù)插入（insert）的先后順序县爬，連續(xù)地寫入到磁盤的同一個區(qū)域（region）上阳啥。MMAP在第一次插入時會為每個Document開辟一小塊專屬的區(qū)域，你可以管它叫一個"record"（記錄）财喳，或一個"slot"（record這個名字容易和別的東西混淆察迟，所以后面我會管它叫slot），其他新插入的Document則必須從這一小塊區(qū)域的結(jié)尾處開始寫入耳高。

為了避免 update 時 Document 變大重新分配空間扎瓶，創(chuàng)建 Document 時會預(yù)留一定的空間，稱為 padding泌枪，可以降低重新分配 Document 的幾率概荷。

WiredTiger 是如何實(shí)現(xiàn) Document 級鎖的？

在平常的使用中碌燕，大多數(shù)對數(shù)據(jù)庫的更新操作都只會對某個 Collection 中的少量 Document 進(jìn)行更新误证。對多個Collection進(jìn)行同時更新的情況已是十分稀有继薛，對多個 Database 進(jìn)行同時更新則是更為罕見了。由此可見愈捅，加鎖粒度最小只支持到 Collection 是遠(yuǎn)遠(yuǎn)不夠的遏考。相對于 MMAPv1，WiredTiger 使用的實(shí)際為 Document 級的樂觀鎖機(jī)制蓝谨。

WiredTiger的樂觀鎖機(jī)制與其他樂觀鎖機(jī)制實(shí)現(xiàn)大同小異诈皿。WiredTiger會在更新Document前記錄住即將被更新的所有Document的當(dāng)前版本號，并在進(jìn)行更新前再次驗(yàn)證其當(dāng)前版本號像棘。若當(dāng)前版本號沒有發(fā)生改變，則說明該Document在該原子事件中沒有被其他請求所更新壶冒，可以順利進(jìn)行寫入缕题，并修改版本號；但如果版本號發(fā)生改變胖腾，則說明該Document在更新發(fā)生之前已被其他請求所更新烟零，由此便觸發(fā)了一次“寫沖突”。不過咸作，在遇到寫沖突以后锨阿，WiredTiger也會自動重試更新操作。

參考鏈接

The MongoDB 3.4 Manual
MongoDB存儲引擎
MongoDB 初見指南

最后編輯于：2017.12.07 12:09:43

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末记罚，一起剝皮案震驚了整個濱河市墅诡，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌桐智，老刑警劉巖末早，帶你破解...
沈念sama閱讀 216,651評論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異说庭，居然都是意外死亡然磷，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,468評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門刊驴，熙熙樓的掌柜王于貴愁眉苦臉地迎上來姿搜，“玉大人，你說我怎么就攤上這事捆憎【斯瘢” “怎么了？”我有些...
開封第一講書人閱讀 162,931評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵攻礼，是天一觀的道長业踢。經(jīng)常有香客問我，道長礁扮，這世上最難降的妖魔是什么知举？我笑而不...
開封第一講書人閱讀 58,218評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任瞬沦，我火速辦了婚禮，結(jié)果婚禮上雇锡，老公的妹妹穿的比我還像新娘逛钻。我一直安慰自己，他們只是感情好锰提，可當(dāng)我...
茶點(diǎn)故事閱讀 67,234評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布曙痘。她就那樣靜靜地躺著，像睡著了一般立肘。火紅的嫁衣襯著肌膚如雪边坤。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,198評論 1贊 299
城市分裂傳說
那天谅年，我揣著相機(jī)與錄音茧痒，去河邊找鬼。笑死融蹂，一個胖子當(dāng)著我的面吹牛旺订，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播超燃，決...
沈念sama閱讀 40,084評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼区拳，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了意乓？” 一聲冷哼從身側(cè)響起樱调，我...
開封第一講書人閱讀 38,926評論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎洽瞬，沒想到半個月后本涕，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,341評論 1贊 311
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡伙窃，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,563評論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年菩颖，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片为障。...
茶點(diǎn)故事閱讀 39,731評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡晦闰，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出鳍怨，到底是詐尸還是另有隱情呻右，我是刑警寧澤，帶...
沈念sama閱讀 35,430評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布鞋喇，位于F島的核電站声滥，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜落塑，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,036評論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一纽疟、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧憾赁，春花似錦污朽、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,676評論 0贊 22
一樁弒父案蟆肆，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至晦款，卻和暖如春炎功，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背缓溅。一陣腳步聲響...
開封第一講書人閱讀 32,829評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工亡问，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人肛宋。一個月前我還...
沈念sama閱讀 47,743評論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像束世，于是被迫代替她去往敵國和親酝陈。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,629評論 2贊 354

思維導(dǎo)圖學(xué)《Mongo 官方文檔》

思維導(dǎo)圖學(xué)《Mongo 官方文檔》

前言

思維導(dǎo)圖

目錄

Basic

Aggregation & Data Modeling

Indexes

Storage

Replication & Sharding

思考

Document 在內(nèi)部是如何存儲的？

單個 Document 的容量是否有限制妓羊？

遇到真正的「大數(shù)據(jù)」（單機(jī)存儲容量不夠）怎么辦酷愧？

Mongo 的數(shù)據(jù)安全嗎？在保證效率的同時士败，在服務(wù)器突然宕機(jī)的情況下闯两，是否能夠保存數(shù)據(jù)？

Write To Buffer Without ACK

Write To Buffer With ACK

Write To Journaling With ACK

Write To Replica Buffer With ACK

MMAPv1 和 WiredTiger 有什么區(qū)別站宗？

MMAPv1 是如何分配記錄的？

WiredTiger 是如何實(shí)現(xiàn) Document 級鎖的？

參考鏈接

推薦閱讀更多精彩內(nèi)容