一溃斋、本地模式劳秋、偽分布式模式和分布式模式
本地模式:使用的是本地文件系統(tǒng)绢馍,在該模式下羹膳,當執(zhí)行Hadoop job時(包含有大多數(shù)的Hive查詢)睡互,Map task和Reduce task在同一個進程中執(zhí)行。
真實的集群配置的都是分布式模式陵像,其中所有沒有完整URL指定的路徑默認都是分布式文件系統(tǒng)(通常是HDFS)中的路徑湃缎,而且由JobTracker 服務來管理job,不同的task在不同的進程中執(zhí)行蠢壹。
二嗓违、hive內(nèi)部是什么
hive 的metastore(元數(shù)據(jù)存儲)組件,元數(shù)據(jù)存儲中存儲了如表的模式和分區(qū)信息等元數(shù)據(jù)信息图贸。實踐中蹂季,大多數(shù)的hive客戶端會使用mysql,下載java驅動疏日,即可實現(xiàn)hive連接mysql
三偿洁、hive命令
(1)hive -e "sql" 可以執(zhí)行sql命令
(2)hive -S -e "sql" > /a/b :可以將結果輸出到指定文件中
(3)Hive中可以使用 -f文件名方式執(zhí)行指定文件中的一個或者多個查詢語句,一般把這些hive查詢文件保存為具備.q或者.hql的文件
(4)hive shell中可以使用SOURCE命令來執(zhí)行一個腳本文件
(5)執(zhí)行shell命令:
不需要退出hive CLI 就可以執(zhí)行沟优,只要在命令前加上!并且以分號結尾就可以涕滋。
(6)hive打印字段名稱
設置 set hive.cli.print.header = true;