HBase第二天

一探赫、版本的選擇

cdh5.3.0:archive.cloudera.com/cdh5/chd/5/

下載對應(yīng)的hadoop hive zookeeper hbase版本

二家坎、角色規(guī)劃

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? hadoop02 ? ? ? hadoop03 ? ? ? ? hadooop04 ? ? ?hadoop05

Master ? ? ? ? ? ? ? ? ? ? ? √ ? ? ? ? ? ? ? ? ? ? ? ?√

Regionserver ? ? ? ? ? √ ? ? ? ? ? ? ? ? ? ? ? ? √? ? ? ? ? ? ? ? ? ? ? ? √? ? ? ? ? ? ? ? ? ? ? √

zookeeper? ? ? ? ? ? ? ? √ ? ? ? ? ? ? ? ? ? ? ? ? √ ? ? ? ? ? ? ? ? ? ? ? ?√

三嘱能、問題

1吝梅、為什么要搭建zookeeper?

2惹骂、secondaryNameNode的作用

3苏携、建立軟鏈接

4、不配置slaves可以嗎对粪?每臺手動(dòng)啟動(dòng)

5右冻、集群搭建完成之后要做什么?Hadoop基準(zhǔn)測試

測試hdfs每秒能讀寫多少數(shù)據(jù)著拭?等等

6纱扭、怎樣區(qū)分bin和sbin內(nèi)容,各腳本之間的關(guān)系


啟動(dòng)Hadoop集群各腳本之間的關(guān)系

bin:

hdfs dfs -ls / ? ? ? ? ?查看/創(chuàng)建目錄

yarn jar xxx.jar ? ? ? 提交MR任務(wù)

sbin:

start-all.sh 由start-dfs.sh和start-yarn.sh腳本組成

start-dfs.sh:使用hadoop-daemons.sh啟動(dòng)zookeeper儡遮、journalnode乳蛾、NameNode、secondaryNameNode鄙币、DataNode

hadoop-daemons.sh腳本中執(zhí)行了bin/slaves.sh腳本

cat slaves:然后獲取到我們在slaves中配置的datanode節(jié)點(diǎn)(參數(shù))

如果我們使用start-dfs.sh啟動(dòng)集群肃叶,必須配置slaves,因?yàn)檫@個(gè)腳本依賴于slaves.sh腳本爱榔,如果使用hadoop-daemon.sh start namenode被环,不需要配置slaves,因?yàn)樵撃_本與slaves.sh腳本獨(dú)立。

7详幽、默認(rèn)情況下載DataNode節(jié)點(diǎn)啟動(dòng)NodeManager筛欢?

? ? ? ? ? ?數(shù)據(jù)本地化。

四唇聘、寫腳本執(zhí)行自動(dòng)發(fā)送

for i in hadoop03 hadoop04 hadoop05

do

nohup scp -r hadoop-2.6.5 $i:$PWD &

done

查看任務(wù)有沒有執(zhí)行完成

jobs

1)hdfs namenode -format 該命令是為了生成fsimage(元數(shù)據(jù))

格式化錯(cuò)誤問題

解決方案:刪除/tmp目錄下的元數(shù)據(jù)版姑,然后再執(zhí)行格式化操作

2)啟動(dòng)NameNode start-dfs.sh(hadoo-daemon.sh start namenode)

集群訪問地址:

Hadoop--50070 ? ? ??

yarn---8088

zookeeper--2181

hbase--16010

3)出錯(cuò)查看日志

tail -100 /日志文件目錄

手啟master ? ? ? ? ? ? hbase-daemon.sh start master

rm -rf *hadoop* /*cmd

五、HBase的使用場合

數(shù)據(jù)量大

功能簡單

虛擬化:docker

spark

人工智能:機(jī)器學(xué)習(xí) 深度學(xué)習(xí)

hbase-site.xml 配置訪問地址

? ? ?hdfs端口號:8020/9000

? ? ?zookeeper集群訪問地址

hbase-env.sh 兩種方式都可以迟郎,無所謂好壞

? ? ? HBASE_MANAGES_ZK=true表示用HBase自帶zookeeper

? ? ? HBASE_MANAGES_ZK=false表示用外面自己搭建的zookeeper

配置regionservers:zookeeper節(jié)點(diǎn)

實(shí)現(xiàn)HA:bachup_masters

問題:hdfs的地址:配成myha01剥险,只是一個(gè)邏輯名,它是怎么識別的宪肖?

我們怎么讓它知道表制?答:把配置myha01的文件復(fù)制到conf目錄下。還有一種高級的方式:調(diào)用腳本讓該文件自己找到我們的core-site.xml和hdfs-site.xml控乾。腳本該怎么寫么介?

日志的位置 hbase/logs

hbase后臺啟動(dòng)之后怎么停止?怎么轉(zhuǎn)到前臺蜕衡?

jobs查看當(dāng)前進(jìn)程是前臺還是后臺

ctrl+z掛起程序

bg 1切換到后臺

fg 1喚醒到前臺運(yùn)行

進(jìn)入客戶端名之后不能退格的解決方案壤短?

六、HBase寫數(shù)據(jù)的流程 put命令

HStore MemStore StoreFile 合并256M 10G

WAL機(jī)制

HStore的個(gè)數(shù)=列族的個(gè)數(shù)

HMaster決定分割出來的region分發(fā)到哪臺regionserver

內(nèi)存易丟失------WAL機(jī)制(Write Ahead Log)預(yù)寫日志

合并文件的時(shí)候會(huì)把過期的數(shù)據(jù)清理掉

MySQL使用B+樹架構(gòu)的,HBase:LSM樹:由B+樹演化過來的久脯。

在MemStore中按照rowkey字典排序

讀數(shù)據(jù):zookeeper/-Root-/.META/RegionServer

內(nèi)存纳胧、磁盤

布隆過濾器的思想:IP地址通過hash算法轉(zhuǎn)換為位數(shù)組(散列表/哈希表),通過0和1判斷一個(gè)IP地址是否同時(shí)在兩臺服務(wù)器出現(xiàn)帘撰,允許誤判的情況下可以提高效率跑慕。

解決散列沖突的幾種方法:

1、開地址法:二次探測再散列 ? ? ? ? ?

? ? ? ? ? ? 求桶號的公式:Hi=(H0+i^2)%m,i=1,2...m-1(m是一個(gè)4k+3的質(zhì)數(shù))

寫javaAPI:第一個(gè)API:HBaseDao和HBaseDaoImpl

獲取連接:hTablePool.getTable(tableName);

插入數(shù)據(jù)的方法save insert

對象 put tableName qualifer value .getbytes

查詢方法:getOneRow(tableName,rowKey)查詢一行--返回Result對象

? ? ? ? ? ? ? ? ? ? getRows(tableName,rowKey)模糊查詢--返回List<Result>

? ? ? ? ? ? ? ? ? ? getRows(tableName,startrow,endrow)根據(jù)起始鍵和結(jié)束鍵查詢幾行

構(gòu)建get對象(rowkey)(new的方式)

table.get(get)-->Result對象

table.getScanner(scan);

掃描對象要添加過濾器 ? ? ?scan.setFilter(filter);

前綴過濾器PrefixFilter(rowkey.getbytes());

hbase只支持左匹配

功能骡和,根據(jù)起始鍵和結(jié)束鍵掃描獲取數(shù)據(jù)

首先獲取表的連接

然后初始化一個(gè)scan對象并設(shè)置startRow 和 endRow 屬性值

最后返回一個(gè)List<Result result>的集合list

測試方法:

1相赁、getRow()返回一個(gè)result對象,獲取單元格集合

for(Cell cell:result.rawCells()){

?String rowKey=new String(CellUtil.cloneRow(cell));

}

2慰于、getRows(tableName,row_like)

一個(gè)result對應(yīng)一個(gè)rowkey钮科,一個(gè)rowkey對應(yīng)多個(gè)cell

3、測試getRows(tableName,startRow,endRow)

查詢多條rowkey對應(yīng)信息婆赠,前閉后開绵脯。

左匹配 +起始結(jié)束鍵(前閉后開) +字典順序

4、刪除表

delete對象

HBase的讀數(shù)據(jù):當(dāng)HMaster掛掉之后休里,不影響讀數(shù)據(jù)蛆挫。

HMaster參與的操作:寫數(shù)據(jù),具體:HMaster會(huì)管理region發(fā)送到哪臺服務(wù)器妙黍。

region中存放數(shù)據(jù)悴侵。

實(shí)現(xiàn)HA也必須有HMaster,管理regionserver

Master管理regionserver:master與znode保持心跳,znode保存regionserver上線和下線信息拭嫁。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末可免,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子做粤,更是在濱河造成了極大的恐慌浇借,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件怕品,死亡現(xiàn)場離奇詭異妇垢,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)肉康,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進(jìn)店門闯估,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人吼和,你說我怎么就攤上這事涨薪。” “怎么了纹安?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵尤辱,是天一觀的道長。 經(jīng)常有香客問我厢岂,道長光督,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任塔粒,我火速辦了婚禮结借,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘卒茬。我一直安慰自己船老,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布圃酵。 她就那樣靜靜地躺著柳畔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪郭赐。 梳的紋絲不亂的頭發(fā)上薪韩,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天,我揣著相機(jī)與錄音捌锭,去河邊找鬼俘陷。 笑死,一個(gè)胖子當(dāng)著我的面吹牛观谦,可吹牛的內(nèi)容都是我干的拉盾。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼豁状,長吁一口氣:“原來是場噩夢啊……” “哼捉偏!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起替蔬,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤告私,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后承桥,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體驻粟,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年凶异,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蜀撑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,605評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡剩彬,死狀恐怖酷麦,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情喉恋,我是刑警寧澤沃饶,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布母廷,位于F島的核電站,受9級特大地震影響糊肤,放射性物質(zhì)發(fā)生泄漏琴昆。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一馆揉、第九天 我趴在偏房一處隱蔽的房頂上張望业舍。 院中可真熱鬧,春花似錦升酣、人聲如沸舷暮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽下面。三九已至,卻和暖如春绩聘,著一層夾襖步出監(jiān)牢的瞬間诸狭,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工君纫, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留驯遇,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓蓄髓,卻偏偏與公主長得像叉庐,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子会喝,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 入門指南 1. 簡介 Quickstart會(huì)讓你啟動(dòng)和運(yùn)行一個(gè)單節(jié)點(diǎn)單機(jī)HBase陡叠。 2. 快速啟動(dòng) – 單點(diǎn)HB...
    和心數(shù)據(jù)閱讀 4,524評論 1 41
  • HBase那些事 @(大數(shù)據(jù)工程學(xué)院)[HBase, Hadoop, 優(yōu)化, HadoopChen, hbase]...
    分癡閱讀 3,931評論 3 17
  • 該文檔是用Hbase默認(rèn)配置文件生成的,文件源是Hbase-default.xml hbase.rootdir 這...
    我是嘻哈大哥閱讀 4,749評論 0 7
  • 1. HBase介紹肢执,Hbase是什么枉阵? HBase -- Hadoop Database ,是一個(gè)高可靠预茄、高性能...
    奉先閱讀 3,730評論 1 36
  • 3-29星期三21:45杭州桔子水晶酒店 江南好兴溜,風(fēng)景舊曾諳;日出江花紅勝火耻陕,春來江水綠如藍(lán)拙徽。能不憶江南? 江南憶...
    魏雨self閱讀 270評論 0 0