(轉)Kudu、Hudi和Delta Lake的比較

Kudu、Hudi和Delta Lake的比較

Kudu声滥、Hudi和Delta Lake的比較

kudu、hudi和delta lake是目前比較熱門的支持行級別數(shù)據(jù)增刪改查的存儲方案确徙，本文對三者之間進行了比較醒串。

存儲機制

kudu

kudu的存儲機制和hudi的寫優(yōu)化方式有些相似。

kudu的最新數(shù)據(jù)保存在內存鄙皇，稱為MemRowSet（行式存儲芜赌，基于primary key有序），
當MemRowSet寫滿（默認1G或者120s）后flush到磁盤伴逸，形成DiskRowSet（列式存儲）缠沈。

DiskRowSet包含baseData與DeltaStores兩部分，DeltaStores包含一個DeltMemStore和多個DeltaFile错蝴，
后續(xù)的更新數(shù)據(jù)存放在DeltMemStore中洲愤，增長到一定程度后flush成DeltaFile文件。

kudu會定期執(zhí)行compaction操作顷锰，將DeltaFile中的更新合并到DiskRowSet柬赐，或者合并DiskRowSet，清除已刪除的數(shù)據(jù)官紫，并減少DiskRowSet的數(shù)量肛宋。

hudi

hudi維護了一個時間軸，記錄了在不同時刻對數(shù)據(jù)集進行的所有操作束世。

hudi擁有2種存儲優(yōu)化酝陈，讀優(yōu)化適合讀多寫少的場景，寫優(yōu)化適合讀少寫多的場景毁涉。

讀優(yōu)化（Copy On Write）：在每次commit后都將最新的數(shù)據(jù)compaction成列式存儲（parquet）沉帮；
寫優(yōu)化（Merge On Read）：對增量數(shù)據(jù)使用行式存儲（avro），后臺定期將它compaction成列式存儲贫堰。

delta lake

delta lake的存儲機制和hudi的讀優(yōu)化方式相似穆壕。

delta lake的數(shù)據(jù)不會保存在內存中，而是直接寫到新的數(shù)據(jù)文件中（parquet格式）其屏，同時在commit log中添加AddFile這種FileAction粱檀，快照新建/更新時讀取事務日志，會加載新的數(shù)據(jù)文件信息漫玄。

讀數(shù)據(jù)

kudu

先根據(jù)要掃描數(shù)據(jù)的主鍵范圍，定位到目標的tablets，然后讀取tablets中的DiskRowSet睦优。

在讀取每個DiskRowSet時渗常，先根據(jù)主鍵過濾要scan的范圍，然后加載范圍內的baseData汗盘，再找到對應的DeltaStores皱碘，
應用所有變更，最后union上MemRowSet中的內容隐孽，最后返回數(shù)據(jù)給client癌椿。

kudu提供range分區(qū)和hash分區(qū)兩種分區(qū)方式，通過多種索引（主鍵范圍索引菱阵、bloomfilter踢俄、主鍵索引），支持隨機讀取數(shù)據(jù)和高效的批量讀取數(shù)據(jù)晴及。

hudi

hudi也維護著一個索引都办，以此將key快速映射到對應的fileId。索引的實現(xiàn)是插件式的虑稼，默認是bloomFilter琳钉，也可以使用HBase。

hudi提供3種查詢視圖蛛倦。

讀優(yōu)化視圖：僅提供compaction后的列式存儲的數(shù)據(jù)歌懒；
增量視圖：僅提供一次compaction/commit前的增量數(shù)據(jù)；
實時視圖：包括列式存儲數(shù)據(jù)和寫優(yōu)化的行式存儲數(shù)據(jù)溯壶。

delta lake

通過讀取事務日志的checkpoint文件（parquet格式）和之后版本的commit文件（json格式）及皂，
建立當前最新的快照，該快照包含了當前版本所有數(shù)據(jù)文件的地址茸塞，然后使用spark讀取數(shù)據(jù)躲庄。

更新數(shù)據(jù)

kudu

client向master發(fā)出請求，通過索引定位到具體的tablet钾虐，然后根據(jù)元數(shù)據(jù)連接tablet對應的tserver噪窘。

若數(shù)據(jù)在磁盤（DiskRowSet）上，則將更新信息寫入DeltMemStore中效扫，若數(shù)據(jù)在內存（MemRowSet）中倔监，則將信息寫入所在行的mutation鏈表中。

hudi

hudi沒有傳統(tǒng)意義的更新菌仁，只有append和重寫浩习。

hudi寫數(shù)據(jù)的時候需要指定以下3個key。

RECORDKEY_FIELD_OPT_KEY：每條記錄的唯一id济丘，支持多個字段谱秽；
PRECOMBINE_FIELD_OPT_KEY：在數(shù)據(jù)合并的時候使用到洽蛀，當RECORDKEY_FIELD_OPT_KEY相同時，默認取PRECOMBINE_FIELD_OPT_KEY屬性配置的字段最大值所對應的行疟赊；
PARTITIONPATH_FIELD_OPT_KEY：用于存放數(shù)據(jù)的分區(qū)字段郊供。

hudi更新數(shù)據(jù)和插入數(shù)據(jù)很相似（寫法幾乎一樣），更新數(shù)據(jù)時近哟，會根據(jù)以上三個字段對數(shù)據(jù)進行Merge驮审。

delta lake

delta lake更新數(shù)據(jù)時會先定位待更新數(shù)據(jù)所在的文件，使用spark join獲得結果數(shù)據(jù)集吉执，將更新后的數(shù)據(jù)和文件中其他不需要更新的數(shù)據(jù)一起寫入到新的文件里疯淫，同時在commit log中記錄AddFile（新文件）和RemoveFile（舊文件）兩種action。

其他

---	kudu	hudi	delta lake
行級別更新	支持	支持	支持
schema修改	支持	支持	支持
批流共享	支持	支持	支持
使用索引	是	是	否
多作業(yè)并發(fā)寫	允許	不允許	允許
元數(shù)據(jù)位置	master	根目錄文件夾	根目錄文件夾
版本回滾	不支持	通過設置增量視圖的INSTANTTIME范圍戳玫，支持版本回滾	自帶Time Travel功能熙掺，支持版本回滾
實時性	kudu使用內存存儲新增數(shù)據(jù)，實時性相對較高	hudi有寫優(yōu)化存儲方式量九，能達到1-5分鐘延遲的近實時處理	delta lake必須完成commit提交才能查詢到新增數(shù)據(jù)适掰，實時性差
支持hadoop文件系統(tǒng)	不支持，kudu通過raft管理自己的存儲服務器	支持	支持
缺省列處理	默認為null	hudi在插入時必須指定所有字段荠列，否則報錯	默認為null
并發(fā)讀寫	支持	不支持多客戶端同時寫	支持
兼容性	與impala集成支持sql类浪，支持spark讀寫	支持spark、presto肌似、hive费就、mapreduce，兼容性較好	深度依賴spark川队，目前有限支持hive力细、presto，有待完善

如何選擇合適的存儲方案

kudu

不同于hudi和delta lake是作為數(shù)據(jù)湖的存儲方案固额，kudu設計的初衷是作為hive和hbase的折中眠蚂，因此它同時具有隨機讀寫和批量分析的特性。
kudu允許對不同列使用單獨的編碼和壓縮格式斗躏，擁有強大的索引支持逝慧，搭配range分區(qū)和hash分區(qū)的合理劃分，
對分區(qū)查看啄糙、擴容和數(shù)據(jù)高可用性的支持都非常好笛臣，適用于既有隨機訪問，也有批量數(shù)據(jù)掃描的復合場景隧饼。
kudu可以和impala沈堡、spark集成，支持sql操作燕雁，除此之外诞丽，kudu能夠充分發(fā)揮高性能存儲設備的優(yōu)勢鲸拥。
相比較其他兩者，kudu不支持云存儲率拒，也不支持版本回滾和增量處理崩泡。

hudi

hudi的產生背景是為了解決Uber的增量更新問題，它提供了豐富的視圖和存儲優(yōu)化方式猬膨，
可以適配批量訪問場景，增量處理場景呛伴，以及近實時查詢場景勃痴，無論是讀多寫少還是讀少寫多，hudi都能提供對應的優(yōu)化方案热康，
用戶可以根據(jù)自身場景靈活選擇合適的配置沛申。
三者之中，hudi的兼容性最好姐军，它原生支持spark铁材、presto、hive和mapreduce等大數(shù)據(jù)生態(tài)系統(tǒng)奕锌，并且讀寫底層文件實現(xiàn)了自己的InputFormat著觉，更容易與其它系統(tǒng)做兼容。
hudi目前還不支持通過sql操作數(shù)據(jù)惊暴，（19年12月）社區(qū)已經將其作為下一步的方向饼丘，但完成時間不確定。
hudi不存在鎖機制辽话，因此不支持多客戶端同時寫一張表肄鸽，這是需要注意的一點。

delta lake

delta lake深度綁定spark油啤，支持版本回滾典徘，在寫入的時候對數(shù)據(jù)進行合并，因此對讀取比較友好益咬。
delta lake有樂觀鎖機制逮诲，允許并發(fā)寫操作。但目前源碼中對沖突檢測很嚴格础废，對多用戶同時更新的場景支持并不好汛骂，適用于寫少讀多（或者only append寫多更新少）的場景。
delta lake開源版目前基本不支持sql操作數(shù)據(jù)（0.5版本支持hive和presto讀數(shù)據(jù)）评腺，應該在spark3.0發(fā)布后才會支持delete帘瞭、update和merge操作。
開源版目前還存在小文件合并問題（商業(yè)版有優(yōu)化蒿讥，但是因為涉及到Databricks的Runtime功能蝶念，所以不準備開源抛腕，因此得自己手動合并小文件）。
總體來說媒殉，delta lake是一個較為優(yōu)秀的數(shù)據(jù)湖存儲方案担敌，但直接使用開源版本還需要用戶稍微進行一些針對性的優(yōu)化。

轉自: https://www.cnblogs.com/kehanc/p/12153409.html

最后編輯于：2020.02.20 17:32:26

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末廷蓉，一起剝皮案震驚了整個濱河市膘融，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌永高，老刑警劉巖衔统，帶你破解...
沈念sama閱讀 216,372評論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異攒暇，居然都是意外死亡土匀，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門形用，熙熙樓的掌柜王于貴愁眉苦臉地迎上來就轧，“玉大人，你說我怎么就攤上這事田度《视” “怎么了？”我有些...
開封第一講書人閱讀 162,415評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵每币，是天一觀的道長携丁。經常有香客問我，道長兰怠，這世上最難降的妖魔是什么梦鉴？我笑而不...
開封第一講書人閱讀 58,157評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮揭保，結果婚禮上肥橙，老公的妹妹穿的比我還像新娘。我一直安慰自己秸侣，他們只是感情好存筏，可當我...
茶點故事閱讀 67,171評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著味榛，像睡著了一般椭坚。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上搏色，一...
開封第一講書人閱讀 51,125評論 1贊 297
城市分裂傳說
那天善茎，我揣著相機與錄音，去河邊找鬼频轿。笑死垂涯，一個胖子當著我的面吹牛烁焙，可吹牛的內容都是我干的。我是一名探鬼主播耕赘，決...
沈念sama閱讀 40,028評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼骄蝇，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了操骡？” 一聲冷哼從身側響起九火，我...
開封第一講書人閱讀 38,887評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎当娱，沒想到半個月后吃既，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經...
沈念sama閱讀 45,310評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡跨细，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,533評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了河质。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片冀惭。...
茶點故事閱讀 39,690評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖掀鹅，靈堂內的尸體忽然破棺而出散休，到底是詐尸還是另有隱情，我是刑警寧澤乐尊，帶...
沈念sama閱讀 35,411評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布戚丸，位于F島的核電站，受9級特大地震影響扔嵌，放射性物質發(fā)生泄漏限府。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,004評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一痢缎、第九天我趴在偏房一處隱蔽的房頂上張望胁勺。院中可真熱鬧，春花似錦独旷、人聲如沸署穗。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案嵌洼，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽案疲。三九已至，卻和暖如春麻养，著一層夾襖步出監(jiān)牢的瞬間褐啡，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,812評論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工回溺，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留春贸，地道東北人混萝。一個月前我還...
沈念sama閱讀 47,693評論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長得像萍恕，于是被迫代替她去往敵國和親逸嘀。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,577評論 2贊 353

(轉)Kudu、Hudi和Delta Lake的比較

Kudu声滥、Hudi和Delta Lake的比較

存儲機制

讀數(shù)據(jù)

更新數(shù)據(jù)

其他

如何選擇合適的存儲方案

推薦閱讀更多精彩內容