實(shí)時(shí)分析系統(tǒng)(HIVE/HBASE/IMPALA)淺析 - 大數(shù)據(jù)和云計(jì)算技術(shù) (歡迎關(guān)注同名微信公眾號(hào)) - ITeye技術(shù)網(wǎng)站
http://jiezhu2007.iteye.com/blog/2055919
- 結(jié)語
目前來看蔫仙,業(yè)界還沒有一個(gè)完美的解決方案掸犬,通常的思路有:
a. 提前根據(jù)查詢結(jié)果來組織數(shù)據(jù)。每種業(yè)務(wù)都是不同的虑灰,要想查詢得快,就要提前分析場景害淤,在數(shù)據(jù)入庫時(shí)挖息,就提前根據(jù)查詢結(jié)果來組織數(shù)據(jù)。這也是微博等應(yīng)用的做法码邻,根據(jù)顯示結(jié)果提前存儲(chǔ)數(shù)據(jù)折剃。
b. 對(duì)不固定維度的,多維度查詢像屋,目前來看hadoop和傳統(tǒng)的并行數(shù)據(jù)庫架構(gòu)上會(huì)有一個(gè)融合的過程怕犁,相信最后會(huì)殊途同歸,Impala還是有前途的己莺。
c. 多查詢引擎的融合奏甫,通常我們希望一份數(shù)據(jù),可以承擔(dān)多種應(yīng)用凌受,既可以承擔(dān)直接帶用戶id的快速查詢阵子,也系統(tǒng)可以搞定多維度的復(fù)雜分析,所以要支持多種應(yīng)用胜蛉,多查詢引擎的特點(diǎn)融合不可以避免挠进。希望后面impala可以解決在habase上性能不高的問題。
d. 用高速硬件加速誊册,flash卡目前越來越便宜奈梳,將需要高速查詢的數(shù)據(jù)換成到flash等高速硬件上。