Hive碎碎念（9）：HIVE前綴

--1求橄、配置MR任務(wù)結(jié)束后進(jìn)行文件合并（合并小文件）

set hive.merge.mapfiles = true;
--在Map-only的任務(wù)結(jié)束時(shí)合并小文件
set hive.merge.mapredfiles = true;
--在Map-Reduce的任務(wù)結(jié)束時(shí)合并小文件
set hive.merge.size.per.tas = 512000000;
----合并文件的大小
set hive.merge.smallfiles.avgsize = 512000000;
--當(dāng)輸出文件的平均大小小于該值時(shí)，啟動(dòng)一個(gè)獨(dú)立的map-reduce任務(wù)進(jìn)行文件merge
set hive.default.fileformat = Orc;
--ORC數(shù)據(jù)壓縮參數(shù)
set mapred.max.split.size=512000000;
--#每個(gè)Map最大輸入大小(目前集市層限制可能無(wú)效)
set mapred.min.split.size.per.node=512000000;
--#一個(gè)節(jié)點(diǎn)上split的至少的大小
set mapred.min.split.size.per.rack=512000000;
--#執(zhí)行Map前進(jìn)行小文件合并
set hive.hadoop.supports.splittable.combineinputformat = true;
--是否支持可切分的CombieInputFormat 工窍，true是支持
set mapreduce.input.fileinputformat.split.maxsize = 512000000;
--maxsize（切片最大值）：參數(shù)如果調(diào)得比blocksize小多搀，則會(huì)讓切片變小聋亡，而且就等于配置的這個(gè)參數(shù)的值顽腾。
set mapreduce.input.fileinputformat.split.minsize.per =512000000;
--minsize （切片最小值）：參數(shù)調(diào)的比blockSize大壁顶，則可以讓切片變得比blocksize還大珠洗。
set hive.exec.dynamic.partition = true;
---啟用動(dòng)態(tài)分區(qū)
set hive.exec.dynamic.partition.mode = nostrict;
---動(dòng)態(tài)分區(qū)類型
set hive.exec.max.dynamic.partitions.pernode = 1000;
--默認(rèn)值：100--;在每個(gè)執(zhí)行MR的節(jié)點(diǎn)上，最大可以創(chuàng)建多少個(gè)動(dòng)態(tài)分區(qū)若专。該參數(shù)需要根據(jù)實(shí)際的數(shù)據(jù)來(lái)設(shè)定许蓖。比如：源數(shù)據(jù)中包含了一年的數(shù)據(jù)，即day字段有365個(gè)值调衰，那么該參數(shù)就需要設(shè)置成大于365膊爪，如果使用默認(rèn)值100，則會(huì)報(bào)錯(cuò)
set hive.exec.parallel = true;
--參數(shù)控制在同一個(gè)sql中的不同的job是否可以同時(shí)運(yùn)行,默認(rèn)為false.
set hive.exec.parallel.thread.number = 16;
--就是控制對(duì)于同一個(gè)sql來(lái)說(shuō)同時(shí)可以運(yùn)行的job的最大值,該參數(shù)默認(rèn)為8.此時(shí)最大可以同時(shí)運(yùn)行8個(gè)job.這里開(kāi)啟16個(gè)
set hive.new.job.grouping.set.cardinality = 5000;
--這條設(shè)置的意義在于告知解釋器嚎莉，group by之前米酬，每條數(shù)據(jù)復(fù)制量在5000份以內(nèi)。

常用的set頭如下：

SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;
SET hive.exec.max.dynamic.partitions.pernode = 1000;
SET hive.exec.max.dynamic.partitions = 1000;
SET hive.exec.compress.output = true;
SET hive.exec.dynamic.partition.mode = nonstrict;
SET hive.exec.dynamic.partition = true;
SET hive.merge.mapfiles = true;
SET hive.merge.mapredfiles = true;
SET mapred.max.split.size=536870912;
SET mapred.min.split.size.per.node=536870912;
SET mapred.min.split.size.per.rack=536870912;
SET hive.input.format=[org.apache.hadoop.hive.ql.io](http://org.apache.hadoop.hive.ql.io/).CombineHiveInputFormat;
SET mapreduce.input.fileinputformat.split.minsize=536870912;
SET hive.map.aggr = true;
SET hive.groupby.mapaggr.checkinterval = 100000;
SET hive.auto.convert.join = true;
SET hive.default.fileformat = Orc;
SET hive.exec.parallel = true;
SET hive.exec.parallel.thread.number = 16;

最后編輯于：2021.01.22 18:32:15

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末趋箩，一起剝皮案震驚了整個(gè)濱河市赃额，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌阁簸，老刑警劉巖爬早，帶你破解...
沈念sama閱讀 216,402評(píng)論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異启妹，居然都是意外死亡筛严，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,377評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)饶米，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)桨啃，“玉大人，你說(shuō)我怎么就攤上這事檬输≌振” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 162,483評(píng)論 0贊 353
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵丧慈，是天一觀的道長(zhǎng)析命。經(jīng)常有香客問(wèn)我，道長(zhǎng)逃默，這世上最難降的妖魔是什么鹃愤？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,165評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮完域，結(jié)果婚禮上软吐，老公的妹妹穿的比我還像新娘。我一直安慰自己吟税，他們只是感情好凹耙，可當(dāng)我...
茶點(diǎn)故事閱讀 67,176評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布姿现。她就那樣靜靜地躺著，像睡著了一般肖抱。火紅的嫁衣襯著肌膚如雪备典。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,146評(píng)論 1贊 297
城市分裂傳說(shuō)
那天虐沥，我揣著相機(jī)與錄音熊经，去河邊找鬼。笑死欲险，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的匹涮。我是一名探鬼主播天试，決...
沈念sama閱讀 40,032評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼然低！你這毒婦竟也來(lái)了喜每？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 38,896評(píng)論 0贊 274
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤雳攘，失蹤者是張志新（化名）和其女友劉穎带兜，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體吨灭，經(jīng)...
沈念sama閱讀 45,311評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡刚照，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,536評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了喧兄。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片无畔。...
茶點(diǎn)故事閱讀 39,696評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖吠冤，靈堂內(nèi)的尸體忽然破棺而出浑彰，到底是詐尸還是另有隱情，我是刑警寧澤拯辙，帶...
沈念sama閱讀 35,413評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布郭变，位于F島的核電站，受9級(jí)特大地震影響涯保，放射性物質(zhì)發(fā)生泄漏诉濒。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,008評(píng)論 3贊 325
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一遭赂、第九天我趴在偏房一處隱蔽的房頂上張望循诉。院中可真熱鬧，春花似錦撇他、人聲如沸茄猫。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,659評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)划纽。三九已至脆侮，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間勇劣，已是汗流浹背靖避。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,815評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留比默，地道東北人幻捏。一個(gè)月前我還...
沈念sama閱讀 47,698評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像命咐，于是被迫代替她去往敵國(guó)和親篡九。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,592評(píng)論 2贊 353