hive進階寶典一——hive常用參數(shù)設置

1.hive并行執(zhí)行

set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=8;

**2.增大hive memory--java heep space **

--mr
set mapreduce.map.memory.mb=10240;
set mapreduce.reduce.memory.mb=10240;
--tez
set hive.tez.container.size=20480;
set hive.tez.java.opts=-Xmx16384m;

3.mr讀取遞歸目錄設置
hive執(zhí)行引擎為mr時,默認不支持讀取遞歸目錄遭京,如要讀取遞歸目錄下的文件虱歪,則需要進行如下設置

set mapreduce.input.fileinputformat.input.dir.recursive=true;
set hive.mapred.supports.subdirectories=true;

4.顯示當前數(shù)據(jù)庫名稱

set hive.cli.print.current.db=true;
--顯示列名
set hive.cli.print.header=true; 

5.map和reducer個數(shù)控制

---MR-map控制個數(shù):
set mapred.max.split.size=128000000 --128M新版本通過此參數(shù)控制map個數(shù)
set mapred.min.split.size.per.node=8000000;
set mapred.min.split.size.per.rack=8000000;
---設置tez的map大小
set tez.grouping.min-size = 128000000; --最小128M,合并map端小文件
set tez.grouping.max-size = 128000000; --最大128M,可增加處理Map數(shù)量
---reducer設置:
set hive.exec.reducers.bytes.per.reducer = 128000000;--設置reducer處理大小
set hive.exec.reducers.max = 999;--設置最大reducer個數(shù)

6.設置隊列名和作業(yè)名

set mapred/tez.job.queue.name=xxx;
set mapred.job.name=xxxx;

7.hive 列選擇

---hive中不選擇最后一列
set hive.support.quoted.identifiers=none;
SELECT `(inc_day)?+.+` FROM tbl_name limit 1;

8.日志信息中打印出統(tǒng)計信息

set hive.tez.exec.print.summary=true;

9.常用的數(shù)據(jù)傾斜設置

set hive.groupby.skewindata=true;
set hive.map.aggr = true;
set hive.groupby.mapaggr.checkinterval =100000;
 
set hive.optimize.skewjoin=true;
set hive.skewjoin.key=100000;

10.hive增加動態(tài)分區(qū)數(shù)量

set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions=2000;
set hive.exec.max.dynamic.partitions.pernode=2000;

11.更新表的統(tǒng)計信息

ANALYZE TABLE xxxx PARTITION(inc_day='20181031') COMPUTE STATISTICS;

12.mapjoin
親測map join在大表join小表的時候十分有用净刮,小表的大表由參數(shù)hive.mapjoin.smalltable.filesize來決定,該參數(shù)表示小表的總大小硅则,默認值淹父,即25M。
Hive0.7之前怎虫,需要使用hint提示 /*+ mapjoin(table) */才會執(zhí)行MapJoin,否則執(zhí)行Common Join暑认,但在0.7版本之后,默認自動會轉(zhuǎn)換Map Join大审,由參數(shù)hive.auto.convert.join來控制蘸际,默認為true.
假設a表為一張大表,b為小表徒扶,并且hive.auto.convert.join=true,那么Hive在執(zhí)行時候會自動轉(zhuǎn)化為MapJoin粮彤。

set hive.auto.convert.join=true
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子导坟,更是在濱河造成了極大的恐慌屿良,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件惫周,死亡現(xiàn)場離奇詭異尘惧,居然都是意外死亡,警方通過查閱死者的電腦和手機闯两,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門褥伴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人漾狼,你說我怎么就攤上這事重慢。” “怎么了逊躁?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵似踱,是天一觀的道長。 經(jīng)常有香客問我稽煤,道長核芽,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任酵熙,我火速辦了婚禮轧简,結果婚禮上,老公的妹妹穿的比我還像新娘匾二。我一直安慰自己哮独,他們只是感情好,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布察藐。 她就那樣靜靜地躺著皮璧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪分飞。 梳的紋絲不亂的頭發(fā)上悴务,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天,我揣著相機與錄音譬猫,去河邊找鬼讯檐。 笑死,一個胖子當著我的面吹牛染服,可吹牛的內(nèi)容都是我干的裂垦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼肌索,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起诚亚,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤晕换,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后站宗,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體闸准,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年梢灭,在試婚紗的時候發(fā)現(xiàn)自己被綠了夷家。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡敏释,死狀恐怖库快,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情钥顽,我是刑警寧澤义屏,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站蜂大,受9級特大地震影響闽铐,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜奶浦,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一兄墅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧澳叉,春花似錦隙咸、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至泌枪,卻和暖如春概荷,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背碌燕。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工误证, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人修壕。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓愈捅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親慈鸠。 傳聞我的和親對象是個殘疾皇子蓝谨,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容