hbase總結(jié)

一授帕、介紹

1.hbase是一個(gè)高緯度同木，面向列，高性能跛十，高可靠的分布式實(shí)時(shí)數(shù)據(jù)庫(kù)

2.hbase是一個(gè)nosql數(shù)據(jù)庫(kù)彤路，可以存儲(chǔ)結(jié)構(gòu)化，半結(jié)構(gòu)化芥映，非結(jié)構(gòu)化的數(shù)據(jù)

二洲尊、數(shù)據(jù)模型

高維數(shù)據(jù)庫(kù)，4個(gè)維度確定一個(gè)單元格

數(shù)據(jù)存儲(chǔ)的格式是字節(jié)數(shù)組

1.rowkey

? ? 唯一確定一行數(shù)據(jù)

? ? 最多64kb

? ? 按字典排序

2.列族

? ? 創(chuàng)建表的時(shí)候定義

? ? 一個(gè)列族可以有多個(gè)列

? ? 一個(gè)列族的數(shù)據(jù)放到同一個(gè)目錄下

3.列名

? ? 動(dòng)態(tài)添加

? ? 每一行的列的個(gè)數(shù)和名稱可以不同

4.版本號(hào)

? ? 一般用時(shí)間戳來(lái)充當(dāng)版本號(hào)

? ? 默認(rèn)是降序排序的奈偏，自動(dòng)獲取最新版本

? ? 每個(gè)單元格可以有多個(gè)版本

三坞嘀、架構(gòu)

1.zookeeper

? ? 監(jiān)控regionserver的上下線信息，通知master

? ? 存儲(chǔ)region的尋址入口（表的增刪改查等dml操作不通過(guò)master來(lái)操作）

? ? 保存hbase的元數(shù)據(jù)信息

? ? 保證集群中只有一個(gè)可用的master

2.master

? ? 若發(fā)現(xiàn)失效的regionserver（由zookeeper告知）惊来，會(huì)移動(dòng)這臺(tái)regionserver的region到其他機(jī)器上

? ? master管理表的創(chuàng)建姆吭，刪除，修改唁盏、重命名等ddl操作

? ? 負(fù)責(zé)集群的負(fù)載均衡

? ? 給regionserver分配region

3.regionserver

????切分過(guò)大的region

????負(fù)責(zé)region的io讀寫(xiě)請(qǐng)求? ??

4.region

? ? 對(duì)應(yīng)的是一張表中的一段連續(xù)的數(shù)據(jù)

? ? 默認(rèn)一個(gè)region對(duì)應(yīng)一張表

? ? 隨著表的數(shù)據(jù)越來(lái)越多内狸，region分裂成2個(gè)，后面會(huì)不斷分裂

5.hlog

? ????存放操作日志厘擂，數(shù)據(jù)存放是首先將操作日志放入hlog中昆淡，保證以后regionserver失效時(shí)，hbase能將其恢復(fù)

6.store

? ? 一個(gè)store中由一個(gè)memstore和0-多個(gè)storefile

? ? 一個(gè)store對(duì)應(yīng)一個(gè)列族

7.memstore和storefile

? ? 數(shù)據(jù)存放的時(shí)候首先會(huì)寫(xiě)入到memstore內(nèi)存緩沖區(qū)中刽严，達(dá)到memstore的閾值128M的時(shí)候會(huì)溢寫(xiě)到storefile中昂灵，最后storefile會(huì)以hfile的形式存入hdfs中

8.compact

? ? 小合并：挑一些文件比較小的進(jìn)行合并，只挑一部分文件合并

? ? 大合并：將所有的storefile文件進(jìn)行合并

? ? 在合并的時(shí)候會(huì)從磁盤層面刪除數(shù)據(jù)

四舞萄、API

1.put

????可以批量插入眨补，List<Put>

2.get

????可以批量獲取，List<Get>

3.scan(重要）

? ? 把握rowkey時(shí)字典排序的原則

4.delete

? ? 刪除數(shù)據(jù)的時(shí)候倒脓，只會(huì)標(biāo)記一個(gè)刪除狀態(tài)的表示撑螺，并不會(huì)馬上刪除數(shù)據(jù)

五、過(guò)濾器

1.pagefilter

2.valuefilter

3.singlecolumnvaluefilter

4.keyonlyfilter

5.prefixfilter

六崎弃、protobuf

? ? 1.一個(gè)第三方插件甘晤，可以產(chǎn)生java類代碼，里面由序列化和反序列化的方法

? ? 2.可以將多個(gè)字段的數(shù)據(jù)饲做，合并成一個(gè)字段线婚，然后通過(guò)序列化存儲(chǔ)到hbase的一個(gè)字段中，節(jié)省磁盤空間

七盆均、性能優(yōu)化

1.預(yù)分區(qū)

? ? 提前分區(qū),減少split分區(qū)對(duì)集群的性能影響

? ? 數(shù)據(jù)遷移

2.熱點(diǎn)問(wèn)題

? ? 由于rowkey設(shè)計(jì)不合理導(dǎo)致的客戶端的讀寫(xiě)請(qǐng)求只會(huì)訪問(wèn)小部分的region,其他大部分的region訪問(wèn)不到,負(fù)載不均衡

? ? 解決:重新設(shè)計(jì)rowkey,取反,取hash,取模

? ? 無(wú)論是hash還取反,都會(huì)打散數(shù)據(jù),后期查詢的時(shí)候就不能通過(guò)scan方法遍歷數(shù)據(jù)

3.列族

? ? 一張表列族的個(gè)數(shù)一般不超過(guò)兩個(gè),當(dāng)一個(gè)store中的memstore發(fā)生溢寫(xiě)的時(shí)候,相鄰的memstore也會(huì)發(fā)生溢寫(xiě),這樣對(duì)集群的io消耗比較大

4.blockcache

? ? 查詢數(shù)據(jù)的時(shí)候,首先查詢memstore,在查詢blockcache,最后查看storefile中的文件

? ? 當(dāng)從磁盤文件查出數(shù)據(jù)后,就會(huì)放入到blockcache中

? ? blockcache數(shù)據(jù)隊(duì)列的三個(gè)級(jí)別:第一次查詢到的數(shù)據(jù)會(huì)放入single,多次查詢到的數(shù)據(jù)存放到multi中,除非手動(dòng)指明某些數(shù)據(jù)放入到in-memory中,否者數(shù)據(jù)不會(huì)存放到這個(gè)級(jí)別中

5.compact

? ? 小合并:有多種因素決定,最少三個(gè)符合條件的文件,最多10個(gè)文件,文件不能太大,大于某個(gè)參數(shù),合并的時(shí)候,優(yōu)先選擇創(chuàng)建時(shí)間比較早的文件

? ? 大合并:所有的文件都合并,io消耗大,默認(rèn)7天,優(yōu)化:關(guān)閉自動(dòng)合并,改成手動(dòng)合并

6.生命周期

最后編輯于：2019.06.02 10:22:20

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末塞弊，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌游沿，老刑警劉巖饰抒，帶你破解...
沈念sama閱讀 222,104評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異奏候，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)唇敞，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,816評(píng)論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門蔗草，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人疆柔，你說(shuō)我怎么就攤上這事咒精。” “怎么了旷档？”我有些...
開(kāi)封第一講書(shū)人閱讀 168,697評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵模叙，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我鞋屈，道長(zhǎng)范咨，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 59,836評(píng)論 1贊 298
?港島之戀（遺憾婚禮）
正文為了忘掉前任厂庇，我火速辦了婚禮渠啊，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘权旷。我一直安慰自己替蛉，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 68,851評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布拄氯。她就那樣靜靜地躺著躲查，像睡著了一般。火紅的嫁衣襯著肌膚如雪译柏。梳的紋絲不亂的頭發(fā)上镣煮，一...
開(kāi)封第一講書(shū)人閱讀 52,441評(píng)論 1贊 310
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音鄙麦，去河邊找鬼怎静。笑死，一個(gè)胖子當(dāng)著我的面吹牛黔衡，可吹牛的內(nèi)容都是我干的蚓聘。我是一名探鬼主播，決...
沈念sama閱讀 40,992評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼盟劫，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼夜牡！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 39,899評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤塘装，失蹤者是張志新（化名）和其女友劉穎急迂，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蹦肴，經(jīng)...
沈念sama閱讀 46,457評(píng)論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡僚碎，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,529評(píng)論 3贊 341
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阴幌。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片勺阐。...
茶點(diǎn)故事閱讀 40,664評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖矛双，靈堂內(nèi)的尸體忽然破棺而出渊抽，到底是詐尸還是另有隱情，我是刑警寧澤议忽，帶...
沈念sama閱讀 36,346評(píng)論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布懒闷，位于F島的核電站，受9級(jí)特大地震影響栈幸，放射性物質(zhì)發(fā)生泄漏愤估。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,025評(píng)論 3贊 334
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一速址、第九天我趴在偏房一處隱蔽的房頂上張望灵疮。院中可真熱鬧，春花似錦壳繁、人聲如沸震捣。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,511評(píng)論 0贊 24
一樁弒父案闹炉，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)蒿赢。三九已至，卻和暖如春渣触，著一層夾襖步出監(jiān)牢的瞬間羡棵，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,611評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工嗅钻，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留皂冰，地道東北人。一個(gè)月前我還...
沈念sama閱讀 49,081評(píng)論 3贊 377
代替公主和親
正文我出身青樓养篓，卻偏偏與公主長(zhǎng)得像秃流，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子柳弄，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,675評(píng)論 2贊 359