2.1Hadoop的限制
Hadoop只能執(zhí)行批量處理,并且只能以順序的方式訪問數(shù)據(jù)凡蜻,導(dǎo)致隨機(jī)訪問的效率較低。
2.2HBase的存儲(chǔ)機(jī)制
HBase可以存儲(chǔ)海量數(shù)據(jù)歪脏,并且以隨機(jī)方式訪問數(shù)據(jù)。
HBase是一個(gè)分布式的面向列的數(shù)據(jù)庫(kù),在表中由行進(jìn)行排序梯澜。在創(chuàng)建表的時(shí)候就指定列族,定義列的時(shí)候以列族:列名鍵值對(duì)的形式定義渴析。一個(gè)表有多個(gè)列族晚伙,每個(gè)列族可以有任意數(shù)量的列吮龄。后續(xù)列的值連續(xù)地存儲(chǔ)在磁盤上。表中的每個(gè)單元格即每個(gè)列都有具體的時(shí)間戳咆疗。
在HBase中:
l 表是行的集合
l 行是列族的集合
l 列族是列的集合
l 列是鍵值對(duì)的結(jié)合
下面是表模式的例子
image.png