1.leveldb簡介
leveldb是google兩位工程師實現(xiàn)的單機版k-v存儲系統(tǒng)喳张,具有以下幾個特點
- key和value都是任意的字節(jié)數(shù)組晰洒,支持內(nèi)存和持久化存儲
- 數(shù)據(jù)都是按照key排序
- 用戶可以重寫排序函數(shù)
- 包含基本的數(shù)據(jù)操作接口午绳,Put(key,value)袜硫,Get(key),Delete(key)
- 多操作可以當成一次原子操作
- 用戶可以通過生成snapshot吟孙,使得讀取操作不受寫操作影響讨阻,讀取過程中看到最終數(shù)據(jù)一致性
- 支持迭代器對數(shù)據(jù)的操作
- 數(shù)據(jù)使用snappy自動壓縮
- 外部操作(如文件系統(tǒng)操作等)通過一個虛擬接口使用芥永,用戶可以對操作系統(tǒng)進行定制相應操作
2. leveldb局限性
- leveldb非關系型數(shù)據(jù)庫,不支持SQL查詢也不支持索引
- 同一時間只支持單進程(支持多線程)訪問db
- 不支持客戶端-服務器模型钝吮,用戶需要自己封裝
3. leveldb基本框架
LevelDb本質(zhì)上是一套存儲系統(tǒng)以及在這套存儲系統(tǒng)上提供的一些操作接口埋涧。為了便于理解整個系統(tǒng)及其處理流程,我們可以從兩個不同的角度來看待LevleDb:靜態(tài)角度和動態(tài)角度搀绣。從靜態(tài)角度飞袋,可以假想整個系統(tǒng)正在運行過程中(不斷插入刪除讀取數(shù)據(jù)),此時我們給LevelDb照相链患,從照片可以看到之前系統(tǒng)的數(shù)據(jù)在內(nèi)存和磁盤中是如何分布的巧鸭,處于什么狀態(tài)等;從動態(tài)的角度麻捻,主要是了解系統(tǒng)是如何寫入一條記錄,讀出一條記錄贸毕,刪除一條記錄的郑叠,同時也包括除了這些接口操作外的內(nèi)部操作比如compaction,系統(tǒng)運行時崩潰后如何恢復系統(tǒng)等等方面
leveldb做為存儲系統(tǒng)明棍,在整個系統(tǒng)運行過程中乡革,基本的框架如下所示
如圖所示,leveldb的存儲介質(zhì)分為內(nèi)存和磁盤兩種摊腋。內(nèi)存中有memtable和immutable memtable沸版;磁盤中有l(wèi)og文件,manifest文件,Current文件以及分level的sstable文件兴蒸;
1). 當用戶往db插入一條key-value數(shù)據(jù)的時候视粮,會先寫log文件,當寫log成功之后再把當前記錄寫到memtable中橙凳。為什么寫數(shù)據(jù)的時候要先寫log文件呢蕾殴,主要是因為新插入的數(shù)據(jù)會保存在內(nèi)存中笑撞,為了防止系統(tǒng)崩潰導致新插入數(shù)據(jù)丟失,因此要先寫log文件保證落地之后钓觉,再寫內(nèi)存茴肥。這樣即使系統(tǒng)崩潰了,也能夠從log中恢復出來荡灾。
2). memtable中的數(shù)據(jù)是可讀可寫炉爆,當memtable的數(shù)據(jù)量達到一個數(shù)據(jù)量之后。當前的memtable變成了immutable memtable卧晓,只讀不可修改。重新生成新的memtable和log文件赴捞,新來的數(shù)據(jù)寫到新的log和memtable中逼裆。
3). immutable memtable中的數(shù)據(jù)會被dump到磁盤中的sstable文件,磁盤中的sstable文件是有層級的赦政,第一層level0到第n層leveln...胜宇,每個level都有很多sstable文件,每個文件都是按照key排好序恢着。注意了level0和其它level不一樣桐愉,level0中的sstable文件的key有可能重復,其它level的sstable文件的key保證不會有重復掰派。
4). 由于每個level中有許多sstable文件从诲,每個sstable文件都有key range。所以需要一個文件來保存當前所有l(wèi)evel中sstabel的key range靡羡。manifest文件主要就是用來存儲每個level中的sstable的信息
5). 隨著系統(tǒng)不斷的運行系洛,每個level中的sstable文件可能會越來越多,這個時候db會自動把同一個level或者不同level中的sstable文件會進行merge略步。這個時候manifest就會發(fā)生變化描扯,因此我們需要一個Current文件來記錄當前最新的manifest文件。