Hive作為Hadoop家族的重要一員,具有學習成本低理卑,開發(fā)者可通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計翘紊,不必開發(fā)專門的MapReduce應(yīng)用。在攢庫中藐唠,Hive也不負眾望帆疟,得到了非常高的票數(shù)。為此宇立,CSDN知識庫特邀社區(qū)專家蔣守壯(博客: http://blog.csdn.net/jiangshouzhuang
)繪制了Hive技術(shù)圖譜踪宠,幫助廣大開發(fā)者更加系統(tǒng)、全面的學習Hive技術(shù)妈嘹。
我要成為Hive專家團一員润脸,篩選優(yōu)質(zhì)內(nèi)容>>猛戳這里: http://lib.csdn.net/experts/invite
點擊下載Hive高清技能圖譜
Hive知識庫精華內(nèi)容一瞥*****基于Hadoop的數(shù)據(jù)倉庫Hive基礎(chǔ)知識*
本文從Hive概述柬脸、Hive系統(tǒng)架構(gòu)、Hive工作原理津函、Hive HA基本原理肖粮、Impala五大方面詳細講解了Hive,對于每個準備學習和使用Hive的開發(fā)者尔苦,都應(yīng)該讀一讀。
在探索數(shù)據(jù)存儲和供給的基本機制之前行施,開發(fā)者需要考慮存儲何種信息允坚,如何存儲它,以及打算存儲多長時間蛾号。本文就Hadoop和Hive如何存儲及獲取數(shù)據(jù)進行了全面分析稠项。
Hive最強大的地方是可以將SQL語句最終轉(zhuǎn)化為MapReduce作業(yè)進行處理。但是鲜结,對于超級長的Hive SQL語句展运,開發(fā)者想要分析哪個子段所花費的查詢時間活逆,就很難了。本文圍繞該問題出發(fā)拗胜,自定義Hive SQL Job分析工具蔗候,提高Hive查詢性能。
建立HBase的集群和HDInsight在Hadoop中使用Hive來查詢它們
本文將教你如何使用Hive Hadoop的HBase的表創(chuàng)建和查詢HDInsight埂软。
Hive作為Hadoop家族的重要一員锈遥,具有學習成本低,開發(fā)者可通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計勘畔,不必開發(fā)專門的MapReduce應(yīng)用所灸。本文分享了不少Hive優(yōu)化技巧,值得一讀炫七。
本文主要圍繞以下六方面進行詳細說明:1)Hive五種數(shù)據(jù)導入方式有哪些爬立?2)導入表命令中有無LOCAL關(guān)鍵字的區(qū)別?3)使用OVERWRITE或INTO關(guān)鍵字的作用及區(qū)別万哪?4)INPATH路徑的限制侠驯?5)什么是動態(tài)分區(qū)插入?6)動態(tài)分區(qū)插入需要做哪些設(shè)置壤圃?
充分的利用機器的性能陵霉,更快的完成MapReduce程序的計算任務(wù)。甚至是在有限的機器條件下伍绳,能夠支持運行足夠多的MapReduce程序踊挠。
本文詳細講解了Hive如何將SQL編譯為MapReduce,主要分為哪六個階段冲杀,以及Hive SQL編譯過程的設(shè)計效床,非常干貨的一篇文章。
本文使用Hive對三種不同的文件存儲格式——Text权谁、ORC和Parquet進行了對比測試剩檀,通過這三種文件存儲格式的測試對比,ORC文件存儲格式無論是在空間存儲旺芽、導數(shù)據(jù)速度還是查詢速度上表現(xiàn)的都較好一些沪猴,并且ORC可以一定程度上支持ACID操作。
本文介紹了Facebook公司數(shù)據(jù)分析系統(tǒng)中的RCFile存儲結(jié)構(gòu)采章,該結(jié)構(gòu)集行存儲和列存儲的優(yōu)點于一身运嗜,在MapReduce環(huán)境下的大規(guī)模數(shù)據(jù)分析中扮演重要角色。