Hive 公司調(diào)優(yōu)總結(jié)(一)

1.開啟Fetch抓取

Hive優(yōu)化(十四)- Fetch抓弱锓ぁ(Hive可以避免進(jìn)行MapReduce)

2.使用本地模式

Hive優(yōu)化(十五)-本地模式(小數(shù)據(jù)集縮短執(zhí)行時間)

3.表的優(yōu)化

Hive優(yōu)化(九)-表優(yōu)化

4.數(shù)據(jù)傾斜

Hive優(yōu)化(五)-避免數(shù)據(jù)傾斜
? 某一個reduce處理數(shù)據(jù)量太大煞肾,產(chǎn)生處理效率降低勾栗。

1)map個數(shù)的設(shè)置

blocksize minsplit maxsplit
? max(minsplit ,min(blocksize ,maxsplit))
set dfs.blocksize;

  • 2)map是不是越多越好
    對于小文件,要進(jìn)行合并操作
  • 3)是不是保證每個map處理接近128m的文件塊郊霎,就高枕無憂了?
reduce的設(shè)置

1)recude是不是越多越好
不是爷绘,浪費(fèi)資源
如何有效的設(shè)置reduce個數(shù)
如果指定分區(qū)书劝,最好按照指定分區(qū)的個數(shù)進(jìn)行設(shè)置
如果動態(tài)分區(qū),需要自己按照數(shù)據(jù)量的大小進(jìn)行嘗試分區(qū)

5.并行執(zhí)行

Hive優(yōu)化(十七)-并行執(zhí)行

6.嚴(yán)格模式

Hive優(yōu)化(十七)-嚴(yán)格模式

7.JVM重用

  • JVM重用是Hadoop調(diào)優(yōu)參數(shù)的內(nèi)容土至,其對Hive的性能具有非常大的影響购对,特別是對于很難避免小文件的場景或task特別多的場景,這類場景大多數(shù)執(zhí)行時間都很短陶因。
  • Hadoop的默認(rèn)配置通常是使用派生JVM來執(zhí)行map和Reduce任務(wù)的骡苞。這時JVM的啟動過程可能會造成相當(dāng)大的開銷,尤其是執(zhí)行的job包含有成百上千task任務(wù)的情況楷扬。JVM重用可以使得JVM實例在同一個job中重新使用N次解幽。N的值可以在Hadoop的mapred-site.xml文件中進(jìn)行配置。通常在10-20之間烘苹,具體多少需要根據(jù)具體業(yè)務(wù)場景測試得出躲株。
<property>
  <name>mapreduce.job.jvm.numtasks</name>
  <value>10</value>
  <description>How many tasks to run per jvm. If set to -1, there is
  no limit. 
  </description>
</property>

這個功能的缺點是,開啟JVM重用將一直占用使用到的task插槽镣衡,以便進(jìn)行重用霜定,直到任務(wù)完成后才能釋放。如果某個“不平衡的”job中有某幾個reduce task執(zhí)行的時間要比其他Reduce task消耗的時間多的多的話廊鸥,那么保留的插槽就會一直空閑著卻無法被其他的job使用望浩,直到所有的task都結(jié)束了才會釋放。

8.推測執(zhí)行

Hive優(yōu)化(十八)-推測執(zhí)行

9.壓縮

待續(xù)黍图,有需要可以關(guān)注我,哈哈哈!

10.執(zhí)行計劃(Explain)

Hive優(yōu)化(十六)-使用EXPLAIN(執(zhí)行計劃)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末奴烙,一起剝皮案震驚了整個濱河市助被,隨后出現(xiàn)的幾起案子剖张,更是在濱河造成了極大的恐慌,老刑警劉巖揩环,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件搔弄,死亡現(xiàn)場離奇詭異,居然都是意外死亡丰滑,警方通過查閱死者的電腦和手機(jī)顾犹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來褒墨,“玉大人炫刷,你說我怎么就攤上這事∮袈瑁” “怎么了浑玛?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長噩咪。 經(jīng)常有香客問我顾彰,道長,這世上最難降的妖魔是什么胃碾? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任涨享,我火速辦了婚禮,結(jié)果婚禮上仆百,老公的妹妹穿的比我還像新娘厕隧。我一直安慰自己,他們只是感情好儒旬,可當(dāng)我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布栏账。 她就那樣靜靜地躺著,像睡著了一般栈源。 火紅的嫁衣襯著肌膚如雪挡爵。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天甚垦,我揣著相機(jī)與錄音茶鹃,去河邊找鬼。 笑死艰亮,一個胖子當(dāng)著我的面吹牛闭翩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播迄埃,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼疗韵,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了侄非?” 一聲冷哼從身側(cè)響起蕉汪,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤流译,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后者疤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體福澡,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡谤碳,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年涛漂,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绅这。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡糯累,死狀恐怖算利,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情寇蚊,我是刑警寧澤笔时,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站仗岸,受9級特大地震影響允耿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扒怖,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一较锡、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧盗痒,春花似錦蚂蕴、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至稽鞭,卻和暖如春鸟整,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背朦蕴。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工篮条, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人吩抓。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓涉茧,卻偏偏與公主長得像,于是被迫代替她去往敵國和親疹娶。 傳聞我的和親對象是個殘疾皇子伴栓,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,573評論 2 353