//
java hbase 查詢某一時間段的數(shù)據(jù)匠抗?有什么好的方案耸采,前提保證效率 - 開源中國社區(qū)
https://www.oschina.net/question/727646_167953
好的方案應該挺多的锣杂,比如:可以將【日未玻、周辉浦、月】以3,2,1來表示(拼接到ROW_KEY中){離線跑job時候,可以分為月job(每月末run一下,周job(每周末run一下),日job(每天run一下)};然后在服務端對請求過來的日期時間段傅事,做下計算:根據(jù)兩個日期缕允,計算出START_ROW_KEY以及END_ROW_KEY,比如:2014-09-15~2014-09-23(這個是跨周的,先計算出整周的那個周末日期,該日期類型為2;然后剩余的兩個日期22及23號,作為天,類型為3;
最后分別進行查詢蹭越,然后在程序里Merge下,最終的查詢只有3次
我一直用的是上述的方式障本,說得有些啰嗦,不知道說明白沒有
//
HBase條件查詢(多條件查詢) - 胡同里的庇護所(Pirate Leo's Shelter) - 博客頻道 - CSDN.NET
http://blog.csdn.net/pirateleo/article/details/7956965
我們在設計RowKey時可以這樣做:采用UserID + CreateTime + FileID組成rowKey响鹃,這樣既能滿足多條件查詢驾霜,又能有很快的查詢速度。
需要注意以下幾點:
1买置、每條記錄的RowKey粪糙,每個字段都需要填充到相同長度。假如預期我們最多有10萬量級的用戶忿项,則userID應該統(tǒng)一填充至6位蓉冈,如000001,000002...
2轩触、結尾添加全局唯一的FileID的用意也是使每個文件對應的記錄全局唯一寞酿。避免當UserID與CreateTime相同時的兩個不同文件記錄相互覆蓋。
//
360HBase二級索引方案學習總結 - 博客頻道 - CSDN.NET http://blog.csdn.net/wwwxxdddx/article/details/50914667
hbase 二次索引_百度搜索 https://www.baidu.com/s?wd=hbase+%E4%BA%8C%E6%AC%A1%E7%B4%A2%E5%BC%95&ie=UTF-8
//
HBase在標簽方面的應用 - 菠蘿大數(shù)據(jù)夢工廠(Free World) - 博客頻道 - CSDN.NET http://blog.csdn.net/jiangshouzhuang/article/details/51497188
并導入到HBase表的指定列族(每個列族就當做一個標簽)中脱柱,查詢一個客戶信息的一個標簽數(shù)據(jù)時伐弹,就只會查詢指定的列族數(shù)據(jù)而不是查詢其他列族數(shù)據(jù),提升查詢性能褐捻。
//2017-3-20
scan如何操作
GC延遲導致延遲多久
scan過程的原理
rowkey的設計可以避免hbase的問題掸茅,
和ZOOKEEPER的關系,存什么東西在ZK里柠逞?
會將-ROOT-表的位置放到ZOOKEEPER中昧狮。
HBase總結(十六)HBase原理講解 - 記錄分享每一點進步和成長 - 博客頻道 - CSDN.NET http://blog.csdn.net/lifuxiangcaohui/article/details/40077753
如何判斷數(shù)據(jù)是在哪里(memstore和HFile)