hbase總結(jié)

一授帕、介紹

1.hbase是一個(gè)高緯度同木,面向列,高性能跛十,高可靠的分布式實(shí)時(shí)數(shù)據(jù)庫(kù)

2.hbase是一個(gè)nosql數(shù)據(jù)庫(kù)彤路,可以存儲(chǔ)結(jié)構(gòu)化,半結(jié)構(gòu)化芥映,非結(jié)構(gòu)化的數(shù)據(jù)

二洲尊、數(shù)據(jù)模型

高維數(shù)據(jù)庫(kù),4個(gè)維度確定一個(gè)單元格

數(shù)據(jù)存儲(chǔ)的格式是字節(jié)數(shù)組

1.rowkey

? ? 唯一確定一行數(shù)據(jù)

? ? 最多64kb

? ? 按字典排序

2.列族

? ? 創(chuàng)建表的時(shí)候定義

? ? 一個(gè)列族可以有多個(gè)列

? ? 一個(gè)列族的數(shù)據(jù)放到同一個(gè)目錄下

3.列名

? ? 動(dòng)態(tài)添加

? ? 每一行的列的個(gè)數(shù)和名稱可以不同

4.版本號(hào)

? ? 一般用時(shí)間戳來(lái)充當(dāng)版本號(hào)

? ? 默認(rèn)是降序排序的奈偏,自動(dòng)獲取最新版本

? ? 每個(gè)單元格可以有多個(gè)版本

三坞嘀、架構(gòu)

1.zookeeper

? ? 監(jiān)控regionserver的上下線信息,通知master

? ? 存儲(chǔ)region的尋址入口(表的增刪改查等dml操作不通過(guò)master來(lái)操作)

? ? 保存hbase的元數(shù)據(jù)信息

? ? 保證集群中只有一個(gè)可用的master

2.master

? ? 若發(fā)現(xiàn)失效的regionserver(由zookeeper告知)惊来,會(huì)移動(dòng)這臺(tái)regionserver的region到其他機(jī)器上

? ? master管理表的創(chuàng)建姆吭,刪除,修改唁盏、重命名等ddl操作

? ? 負(fù)責(zé)集群的負(fù)載均衡

? ? 給regionserver分配region

3.regionserver

????切分過(guò)大的region

????負(fù)責(zé)region的io讀寫(xiě)請(qǐng)求? ??

4.region

? ? 對(duì)應(yīng)的是一張表中的一段連續(xù)的數(shù)據(jù)

? ? 默認(rèn)一個(gè)region對(duì)應(yīng)一張表

? ? 隨著表的數(shù)據(jù)越來(lái)越多内狸,region分裂成2個(gè),后面會(huì)不斷分裂

5.hlog

? ????存放操作日志厘擂,數(shù)據(jù)存放是首先將操作日志放入hlog中昆淡,保證以后regionserver失效時(shí),hbase能將其恢復(fù)

6.store

? ? 一個(gè)store中由一個(gè)memstore和0-多個(gè)storefile

? ? 一個(gè)store對(duì)應(yīng)一個(gè)列族

7.memstore和storefile

? ? 數(shù)據(jù)存放的時(shí)候首先會(huì)寫(xiě)入到memstore內(nèi)存緩沖區(qū)中刽严,達(dá)到memstore的閾值128M的時(shí)候會(huì)溢寫(xiě)到storefile中昂灵,最后storefile會(huì)以hfile的形式存入hdfs中

8.compact

? ? 小合并:挑一些文件比較小的進(jìn)行合并,只挑一部分文件合并

? ? 大合并:將所有的storefile文件進(jìn)行合并

? ? 在合并的時(shí)候會(huì)從磁盤層面刪除數(shù)據(jù)

四舞萄、API

1.put

????可以批量插入眨补,List<Put>

2.get

????可以批量獲取,List<Get>

3.scan(重要)

? ? 把握rowkey時(shí)字典排序的原則

4.delete

? ? 刪除數(shù)據(jù)的時(shí)候倒脓,只會(huì)標(biāo)記一個(gè)刪除狀態(tài)的表示撑螺,并不會(huì)馬上刪除數(shù)據(jù)

五、過(guò)濾器

1.pagefilter

2.valuefilter

3.singlecolumnvaluefilter

4.keyonlyfilter

5.prefixfilter

六崎弃、protobuf

? ? 1.一個(gè)第三方插件甘晤,可以產(chǎn)生java類代碼,里面由序列化和反序列化的方法

? ? 2.可以將多個(gè)字段的數(shù)據(jù)饲做,合并成一個(gè)字段线婚,然后通過(guò)序列化存儲(chǔ)到hbase的一個(gè)字段中,節(jié)省磁盤空間

七盆均、性能優(yōu)化

1.預(yù)分區(qū)

? ? 提前分區(qū),減少split分區(qū)對(duì)集群的性能影響

? ? 數(shù)據(jù)遷移

2.熱點(diǎn)問(wèn)題

? ? 由于rowkey設(shè)計(jì)不合理導(dǎo)致的客戶端的讀寫(xiě)請(qǐng)求只會(huì)訪問(wèn)小部分的region,其他大部分的region訪問(wèn)不到,負(fù)載不均衡

? ? 解決:重新設(shè)計(jì)rowkey,取反,取hash,取模

? ? 無(wú)論是hash還取反,都會(huì)打散數(shù)據(jù),后期查詢的時(shí)候就不能通過(guò)scan方法遍歷數(shù)據(jù)

3.列族

? ? 一張表列族的個(gè)數(shù)一般不超過(guò)兩個(gè),當(dāng)一個(gè)store中的memstore發(fā)生溢寫(xiě)的時(shí)候,相鄰的memstore也會(huì)發(fā)生溢寫(xiě),這樣對(duì)集群的io消耗比較大

4.blockcache

? ? 查詢數(shù)據(jù)的時(shí)候,首先查詢memstore,在查詢blockcache,最后查看storefile中的文件

? ? 當(dāng)從磁盤文件查出數(shù)據(jù)后,就會(huì)放入到blockcache中

? ? blockcache數(shù)據(jù)隊(duì)列的三個(gè)級(jí)別:第一次查詢到的數(shù)據(jù)會(huì)放入single,多次查詢到的數(shù)據(jù)存放到multi中,除非手動(dòng)指明某些數(shù)據(jù)放入到in-memory中,否者數(shù)據(jù)不會(huì)存放到這個(gè)級(jí)別中

5.compact

? ? 小合并:有多種因素決定,最少三個(gè)符合條件的文件,最多10個(gè)文件,文件不能太大,大于某個(gè)參數(shù),合并的時(shí)候,優(yōu)先選擇創(chuàng)建時(shí)間比較早的文件

? ? 大合并:所有的文件都合并,io消耗大,默認(rèn)7天,優(yōu)化:關(guān)閉自動(dòng)合并,改成手動(dòng)合并

6.生命周期

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末塞弊,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌游沿,老刑警劉巖饰抒,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異奏候,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)唇敞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門蔗草,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人疆柔,你說(shuō)我怎么就攤上這事咒精。” “怎么了旷档?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵模叙,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我鞋屈,道長(zhǎng)范咨,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任厂庇,我火速辦了婚禮渠啊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘权旷。我一直安慰自己替蛉,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布拄氯。 她就那樣靜靜地躺著躲查,像睡著了一般。 火紅的嫁衣襯著肌膚如雪译柏。 梳的紋絲不亂的頭發(fā)上镣煮,一...
    開(kāi)封第一講書(shū)人閱讀 52,441評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音鄙麦,去河邊找鬼怎静。 笑死,一個(gè)胖子當(dāng)著我的面吹牛黔衡,可吹牛的內(nèi)容都是我干的蚓聘。 我是一名探鬼主播,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼盟劫,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼夜牡!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤塘装,失蹤者是張志新(化名)和其女友劉穎急迂,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蹦肴,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡僚碎,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阴幌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片勺阐。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖矛双,靈堂內(nèi)的尸體忽然破棺而出渊抽,到底是詐尸還是另有隱情,我是刑警寧澤议忽,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布懒闷,位于F島的核電站,受9級(jí)特大地震影響栈幸,放射性物質(zhì)發(fā)生泄漏愤估。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一速址、第九天 我趴在偏房一處隱蔽的房頂上張望灵疮。 院中可真熱鬧,春花似錦壳繁、人聲如沸震捣。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蒿赢。三九已至,卻和暖如春渣触,著一層夾襖步出監(jiān)牢的瞬間羡棵,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工嗅钻, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留皂冰,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓养篓,卻偏偏與公主長(zhǎng)得像秃流,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子柳弄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 參考:http://www.reibang.com/p/569106a3008f 最近在逐步跟進(jìn)Hbase的相關(guān)...
    博弈史密斯閱讀 859評(píng)論 1 1
  • 1. HBase介紹舶胀,Hbase是什么? HBase -- Hadoop Database ,是一個(gè)高可靠嚣伐、高性能...
    奉先閱讀 3,756評(píng)論 1 36
  • 簡(jiǎn)介 HBase —— Hadoop Database的簡(jiǎn)稱糖赔,Google BigTable的另一種開(kāi)源實(shí)現(xiàn)方式,...
    編碼前線閱讀 279評(píng)論 0 0
  • 簡(jiǎn)介 HBase —— Hadoop Database的簡(jiǎn)稱轩端,Google BigTable的另一種開(kāi)源實(shí)現(xiàn)方式放典,...
    尼小摩閱讀 535評(píng)論 0 3
  • 一、簡(jiǎn)介 Hbase:全名Hadoop DataBase基茵,是一種開(kāi)源的奋构,可伸縮的,嚴(yán)格一致性(并非最終一致性)的分...
    菜鳥(niǎo)小玄閱讀 2,392評(píng)論 0 12