Hive碎碎念(9):HIVE前綴

--1求橄、配置MR任務(wù)結(jié)束后進(jìn)行文件合并(合并小文件)

set hive.merge.mapfiles = true;
--在Map-only的任務(wù)結(jié)束時(shí)合并小文件
set hive.merge.mapredfiles = true;
--在Map-Reduce的任務(wù)結(jié)束時(shí)合并小文件
set hive.merge.size.per.tas = 512000000;
----合并文件的大小
set hive.merge.smallfiles.avgsize = 512000000;
--當(dāng)輸出文件的平均大小小于該值時(shí),啟動(dòng)一個(gè)獨(dú)立的map-reduce任務(wù)進(jìn)行文件merge
set hive.default.fileformat = Orc;
--ORC數(shù)據(jù)壓縮參數(shù)
set mapred.max.split.size=512000000;
--#每個(gè)Map最大輸入大小(目前集市層限制可能無(wú)效)
set mapred.min.split.size.per.node=512000000;
--#一個(gè)節(jié)點(diǎn)上split的至少的大小
set mapred.min.split.size.per.rack=512000000;
--#執(zhí)行Map前進(jìn)行小文件合并
set hive.hadoop.supports.splittable.combineinputformat = true;
--是否支持可切分的CombieInputFormat 工窍,true是支持
set mapreduce.input.fileinputformat.split.maxsize = 512000000;
--maxsize(切片最大值):參數(shù)如果調(diào)得比blocksize小多搀,則會(huì)讓切片變小聋亡,而且就等于配置的這個(gè)參數(shù)的值顽腾。
set mapreduce.input.fileinputformat.split.minsize.per =512000000;
--minsize (切片最小值):參數(shù)調(diào)的比blockSize大壁顶,則可以讓切片變得比blocksize還大珠洗。
set hive.exec.dynamic.partition = true;
---啟用動(dòng)態(tài)分區(qū)
set hive.exec.dynamic.partition.mode = nostrict;
---動(dòng)態(tài)分區(qū)類型
set hive.exec.max.dynamic.partitions.pernode = 1000;
--默認(rèn)值:100--;在每個(gè)執(zhí)行MR的節(jié)點(diǎn)上,最大可以創(chuàng)建多少個(gè)動(dòng)態(tài)分區(qū)若专。該參數(shù)需要根據(jù)實(shí)際的數(shù)據(jù)來(lái)設(shè)定许蓖。比如:源數(shù)據(jù)中包含了一年的數(shù)據(jù),即day字段有365個(gè)值调衰,那么該參數(shù)就需要設(shè)置成大于365膊爪,如果使用默認(rèn)值100,則會(huì)報(bào)錯(cuò)
set hive.exec.parallel = true;
--參數(shù)控制在同一個(gè)sql中的不同的job是否可以同時(shí)運(yùn)行,默認(rèn)為false.
set hive.exec.parallel.thread.number = 16;
--就是控制對(duì)于同一個(gè)sql來(lái)說(shuō)同時(shí)可以運(yùn)行的job的最大值,該參數(shù)默認(rèn)為8.此時(shí)最大可以同時(shí)運(yùn)行8個(gè)job.這里開(kāi)啟16個(gè)
set hive.new.job.grouping.set.cardinality = 5000;
--這條設(shè)置的意義在于告知解釋器嚎莉,group by之前米酬,每條數(shù)據(jù)復(fù)制量在5000份以內(nèi)。

常用的set頭如下:

SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;
SET hive.exec.max.dynamic.partitions.pernode = 1000;
SET hive.exec.max.dynamic.partitions = 1000;
SET hive.exec.compress.output = true;
SET hive.exec.dynamic.partition.mode = nonstrict;
SET hive.exec.dynamic.partition = true;
SET hive.merge.mapfiles = true;
SET hive.merge.mapredfiles = true;
SET mapred.max.split.size=536870912;
SET mapred.min.split.size.per.node=536870912;
SET mapred.min.split.size.per.rack=536870912;
SET hive.input.format=[org.apache.hadoop.hive.ql.io](http://org.apache.hadoop.hive.ql.io/).CombineHiveInputFormat;
SET mapreduce.input.fileinputformat.split.minsize=536870912;
SET hive.map.aggr = true;
SET hive.groupby.mapaggr.checkinterval = 100000;
SET hive.auto.convert.join = true;
SET hive.default.fileformat = Orc;
SET hive.exec.parallel = true;
SET hive.exec.parallel.thread.number = 16;
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末趋箩,一起剝皮案震驚了整個(gè)濱河市赃额,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌阁簸,老刑警劉巖爬早,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異启妹,居然都是意外死亡筛严,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)饶米,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)桨啃,“玉大人,你說(shuō)我怎么就攤上這事檬输≌振” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵丧慈,是天一觀的道長(zhǎng)析命。 經(jīng)常有香客問(wèn)我,道長(zhǎng)逃默,這世上最難降的妖魔是什么鹃愤? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮完域,結(jié)果婚禮上软吐,老公的妹妹穿的比我還像新娘。我一直安慰自己吟税,他們只是感情好凹耙,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布姿现。 她就那樣靜靜地躺著,像睡著了一般肖抱。 火紅的嫁衣襯著肌膚如雪备典。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,146評(píng)論 1 297
  • 那天虐沥,我揣著相機(jī)與錄音熊经,去河邊找鬼。 笑死欲险,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的匹涮。 我是一名探鬼主播天试,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼然低!你這毒婦竟也來(lái)了喜每?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤雳攘,失蹤者是張志新(化名)和其女友劉穎带兜,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體吨灭,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡刚照,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了喧兄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片无畔。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖吠冤,靈堂內(nèi)的尸體忽然破棺而出浑彰,到底是詐尸還是另有隱情,我是刑警寧澤拯辙,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布郭变,位于F島的核電站,受9級(jí)特大地震影響涯保,放射性物質(zhì)發(fā)生泄漏诉濒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一遭赂、第九天 我趴在偏房一處隱蔽的房頂上張望循诉。 院中可真熱鬧,春花似錦撇他、人聲如沸茄猫。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)划纽。三九已至脆侮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間勇劣,已是汗流浹背靖避。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留比默,地道東北人幻捏。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像命咐,于是被迫代替她去往敵國(guó)和親篡九。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353