Kudu與Hbase
- Hbase是列族存儲,一般情況下定義一個(gè)列族魁衙,然后列族中多個(gè)列,這樣會更加接近于行存儲株搔,schema的定義比較寬松剖淀,可以隨時(shí)添加列;Kudu是真正的列式存儲纤房,而且schema的定義比較嚴(yán)格
- 底層的存儲實(shí)現(xiàn)不同
- Hbase隨機(jī)讀寫速度快纵隔,但scan性能一般;Kudu支持隨機(jī)讀寫的情況下炮姨,scan速度快捌刮。所以在支持OLTP的情況下又要支持OLAP(scan)的話,可以嘗試Kudu舒岸;
- 有人做過benchmark绅作,impala+parquet vs impala+kudu,得到結(jié)果是蛾派,impala+kudu只慢了一點(diǎn)俄认,但kudu還支持在線隨機(jī)讀寫;parquet不支持在線隨機(jī)讀寫洪乍,鏈接
- HDFS scan快眯杏,但不能隨機(jī)讀寫;
Hbase支持隨機(jī)讀寫典尾,但scan慢;
Kudu支持隨機(jī)讀寫糊探,但性能比Hbase差點(diǎn)钾埂,同時(shí)scan速度比HDFS慢河闰,但比Hbase快,所以Kudu是一個(gè)介于HDFS和Hbase的方案褥紫。(當(dāng)然姜性,HDFS是一個(gè)分布式文件系統(tǒng),Kudu是一個(gè)分布式列式存儲引擎髓考,不是同一類系統(tǒng)部念,其實(shí)不能直接對比)