HBase讀寫優(yōu)化

一個系統(tǒng)上線之后督惰,開發(fā)和調(diào)優(yōu)將一直貫穿系統(tǒng)的生命周期中算柳,HBase也不列外。這里學習下HBase的調(diào)優(yōu)

Hbase查詢優(yōu)化

作為NoSQL數(shù)據(jù)庫旧蛾,增刪改查是其最基本的功能,其中查詢是最常用的一項芝硬。

設(shè)置Scan緩存

HBase中Scan查詢可以設(shè)置緩存蚜点,方法是setCaching()轧房,這樣可以有效的減少服務(wù)端與客戶端的交互拌阴,更有效的提升掃描查詢的性能。


   /**
   * Set the number of rows for caching that will be passed to scanners.
   * If not set, the default setting from {@link HTable#getScannerCaching()} will apply.
   * Higher caching values will enable faster scanners but will use more memory.
   * @param caching the number of rows for caching
   * 設(shè)置scanners緩存的行數(shù)
   */
  public void setCaching(int caching) {
    this.caching = caching;
  }
顯示的指定列

當使用Scan或者GET獲取大量的行時奶镶,最好指定所需要的列迟赃,因為服務(wù)端通過網(wǎng)絡(luò)傳輸?shù)娇蛻舳耍瑪?shù)據(jù)量太大可能是瓶頸厂镇。如果能有效過濾部分數(shù)據(jù)纤壁,能很大程度的減少網(wǎng)絡(luò)I/O的花費。

  /**
   * Get all columns from the specified family.
   * <p>
   * Overrides previous calls to addColumn for this family.
   * @param family family name
   * @return this
   * 獲取指定列簇的所有列
   */
  public Scan addFamily(byte [] family) {
    familyMap.remove(family);
    familyMap.put(family, null);
    return this;
  }

  /**
   * Get the column from the specified family with the specified qualifier.
   * <p>
   * Overrides previous calls to addFamily for this family.
   * @param family family name
   * @param qualifier column qualifier
   * @return this
   * 獲取指定列簇的特定列
   */
  public Scan addColumn(byte [] family, byte [] qualifier) {
    NavigableSet<byte []> set = familyMap.get(family);
    if(set == null) {
      set = new TreeSet<byte []>(Bytes.BYTES_COMPARATOR);
    }
    if (qualifier == null) {
      qualifier = HConstants.EMPTY_BYTE_ARRAY;
    }
    set.add(qualifier);
    familyMap.put(family, set);
    return this;
  }

一般用:
scan.addColumn(...)

關(guān)閉ResultScanner

如果在使用table.getScanner之后捺信,忘記關(guān)閉該類酌媒,它會一直和服務(wù)端保持連接,資源無法釋放迄靠,從而導(dǎo)致服務(wù)端的某些資源不可用秒咨。

所以在用完之后,需要執(zhí)行關(guān)閉操作掌挚,這點與JDBS操作MySQL類似

scanner.close()

禁用塊緩存

如果批量進行全表掃描雨席,默認是有緩存的,如果此時有緩存吠式,會降低掃描的效率陡厘。

scan.setCacheBlocks(true|false);

對于經(jīng)常讀到的數(shù)據(jù),建議使用默認值特占,開啟塊緩存

緩存查詢結(jié)果

對于頻繁查詢HBase的應(yīng)用場景糙置,可以考慮在應(yīng)用程序和Hbase之間做一層緩存系統(tǒng),新的查詢先去緩存查是目,緩存沒有再去查Hbase罢低。

寫入優(yōu)化

寫也是Hbase常有的操作之一,并且Hbase在寫入操作上有著其他NoSQL無法比擬的優(yōu)勢,下面講如何優(yōu)化寫入操作

關(guān)閉寫WAL日志

一般為了保證系統(tǒng)的高可用性网持,WAL日志默認是開啟狀態(tài)宜岛,WAL主要用于災(zāi)難恢復(fù)的,如果應(yīng)用可以容忍一定的數(shù)據(jù)丟失風險功舀,可以在寫數(shù)據(jù)的時候萍倡,關(guān)閉寫WAL。

風險: 當RegionServer宕機時辟汰,寫入的數(shù)據(jù)出現(xiàn)丟失列敲,且無法恢復(fù)

image
設(shè)置AutoFlush

Htable有一個屬性是AutoFlush,該屬性用于支持客戶端的批量更新帖汞,默認是true戴而,當客戶端每收到一條數(shù)據(jù),立刻發(fā)送到服務(wù)端翩蘸,如果設(shè)置為false所意,當客戶端提交put請求時候,先將該請求在客戶端緩存催首,到達閾值的時候或者執(zhí)行hbase.flushcommits()扶踊,才向RegionServer提交請求。

風險 在請求未發(fā)送到RegionServer之前客戶端崩潰郎任,數(shù)據(jù)也會丟失

        table.setAutoFlush(false);
        table.setWriteBufferSize( 12 * 1024 * 1024 );
預(yù)創(chuàng)建Region

一般表剛開始只有一個Region秧耗,插入該表的數(shù)據(jù)都會保存在此Region中,插入該表的所有塑化劑都會保存在該Region中舶治,當?shù)竭_一定的閾值時分井,才發(fā)生分裂。 這樣開始時刻針對該表的寫操作都集中在某臺服務(wù)器上霉猛,造成這臺服務(wù)器的壓力很緊張尺锚,同時對整個集群資源的浪費

建議剛開始的時候預(yù)創(chuàng)建Region,可以使用Hbase自帶的RegionSplitter

延遲日志flush

默認寫入操作韩脏,首先寫入WAL缩麸,并且在1S內(nèi)寫入HDFS,這個時間默認是1S赡矢,可以通過參數(shù)配置

hbase.regionserver.optionallogflushinterval

可以配置大一點的值杭朱,比如5s,這段時間數(shù)據(jù)會保留在內(nèi)存中吹散,直到RegionServer周期性的執(zhí)行flush操作弧械。

最后

這里提供了一些讀寫優(yōu)化的參考,希望能幫助大家

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末空民,一起剝皮案震驚了整個濱河市刃唐,隨后出現(xiàn)的幾起案子羞迷,更是在濱河造成了極大的恐慌,老刑警劉巖画饥,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件衔瓮,死亡現(xiàn)場離奇詭異,居然都是意外死亡抖甘,警方通過查閱死者的電腦和手機热鞍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來衔彻,“玉大人薇宠,你說我怎么就攤上這事〖瓒睿” “怎么了澄港?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長柄沮。 經(jīng)常有香客問我回梧,道長,這世上最難降的妖魔是什么铡溪? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任漂辐,我火速辦了婚禮泪喊,結(jié)果婚禮上棕硫,老公的妹妹穿的比我還像新娘。我一直安慰自己袒啼,他們只是感情好哈扮,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蚓再,像睡著了一般滑肉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上摘仅,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天靶庙,我揣著相機與錄音,去河邊找鬼娃属。 笑死六荒,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的矾端。 我是一名探鬼主播掏击,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼秩铆!你這毒婦竟也來了砚亭?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎捅膘,沒想到半個月后添祸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡寻仗,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年膝捞,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片愧沟。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡蔬咬,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出沐寺,到底是詐尸還是另有隱情林艘,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布混坞,位于F島的核電站狐援,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏究孕。R本人自食惡果不足惜啥酱,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望厨诸。 院中可真熱鬧镶殷,春花似錦、人聲如沸微酬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颗管。三九已至陷遮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間垦江,已是汗流浹背帽馋。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留比吭,地道東北人绽族。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像梗逮,于是被迫代替她去往敵國和親项秉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 一慷彤、簡介 Hbase:全名Hadoop DataBase娄蔼,是一種開源的怖喻,可伸縮的,嚴格一致性(并非最終一致性)的分...
    菜鳥小玄閱讀 2,388評論 0 12
  • 最近在逐步跟進Hbase的相關(guān)工作岁诉,由于之前對Hbase并不怎么了解锚沸,因此系統(tǒng)地學習了下Hbase,為了加深對Hb...
    飛鴻無痕閱讀 50,227評論 19 272
  • 參考:http://www.reibang.com/p/569106a3008f 最近在逐步跟進Hbase的相關(guān)...
    博弈史密斯閱讀 857評論 1 1
  • 本文首先簡單介紹了HBase,然后重點講述了HBase的高并發(fā)和實時處理數(shù)據(jù) 涕癣、HBase數(shù)據(jù)模型哗蜈、HBase物理...
    達微閱讀 2,735評論 1 13
  • 簡介 HBase是高可靠性,高性能坠韩,面向列距潘,可伸縮的分布式存儲系統(tǒng),利用HBase技術(shù)可在廉價PC Serve...
    九世的貓閱讀 2,192評論 1 6