Kylin官方優(yōu)化參考

#refer: http://kylin.apache.org/docs20/howto/howto_optimize_build.html

1.使用和hive相同的partition cloumn

關(guān)閉自動(dòng)合并設(shè)置
<property>
<name>hive.merge.mapfiles</name>
<value>false</value>
<description>Disable Hive's auto merge</description>
</property>

2.重新分布中間表

作用: 防止不均勻霎匈;
默認(rèn)是100W一個(gè)文件,你可以通過(guò)conf/kylin.properties镊绪,
kylin.job.mapreduce.mapper.input.rows=500000這個(gè)進(jìn)行配置,
在構(gòu)建cube的時(shí)候有一個(gè)配置叫做shard by這個(gè)可以設(shè)置,這個(gè)用于高基數(shù)的維度有很大作用,可以避免數(shù)據(jù)的重新分布也就是減少了shuffle 這個(gè)起碼可以減少40%的build時(shí)間顶别。

3.Extract Fact Table Distinct Columns

在這個(gè)階段 kylin會(huì)使用mr來(lái)獲取不同的維度的value,以供下一步進(jìn)行編碼 生成字典仓技,
如果發(fā)現(xiàn)mapper工作的非常慢,這顯示是你的cube太復(fù)雜了脱衙,請(qǐng)進(jìn)行剪枝蹭睡,
如果發(fā)現(xiàn)reducer發(fā)生了oom,這顯示你的cubiod發(fā)生了膨脹(剪枝).或者是你的yarn 內(nèi)存設(shè)置碧浊。

4.Build Dimension Dictionary

從上一步,獲取到了各個(gè)維度的distinct values.kylin將會(huì)在內(nèi)存中生成字典.通常情況下會(huì)很快。
但是如果出現(xiàn)高基數(shù)的維度隘击,也就是值非常多侍芝,然后kylin會(huì)報(bào)錯(cuò),如:Too high cardinality is not suitable for dictionary埋同。這時(shí)候你就得考慮一下在建cube的時(shí)候州叠,使用別的方式進(jìn)行編碼rowkey,比如int之類(lèi)的凶赁。

5.Build Base Cuboid

這一步如果你發(fā)現(xiàn)你的reducer 個(gè)數(shù)過(guò)于少咧栗,
則可以通過(guò)kylin.job.mapreduce.default.reduce.input.mb=200這個(gè)進(jìn)行設(shè)置。

6.Build Cube

這個(gè)階段需要很多的內(nèi)存 默認(rèn)是3G 這個(gè)你可以通過(guò)配置文件conf/kylin_job_conf_inmem.xml進(jìn)行配置<property>
<name>mapreduce.map.memory.mb</name>
<value>6144</value>
<description></description>
</property>
<property>
<name>mapreduce.map.java.opts</name>
<value>-Xmx5632m</value>
<description></description>
</property>

7.Convert Cuboid Data to HFile

默認(rèn)是一個(gè)region大小5G虱肄,如果你觀察到reducer的個(gè)數(shù)太少了致板,
你可以通過(guò)配置文件conf/kylin.properties進(jìn)行配置。
kylin.hbase.region.cut=2
kylin.hbase.hfile.size.gb=1

#

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末咏窿,一起剝皮案震驚了整個(gè)濱河市斟或,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌集嵌,老刑警劉巖萝挤,帶你破解...
    沈念sama閱讀 212,599評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異纸淮,居然都是意外死亡平斩,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)咽块,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)绘面,“玉大人,你說(shuō)我怎么就攤上這事〗伊В” “怎么了晚凿?”我有些...
    開(kāi)封第一講書(shū)人閱讀 158,084評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)瘦馍。 經(jīng)常有香客問(wèn)我歼秽,道長(zhǎng),這世上最難降的妖魔是什么情组? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,708評(píng)論 1 284
  • 正文 為了忘掉前任燥筷,我火速辦了婚禮,結(jié)果婚禮上院崇,老公的妹妹穿的比我還像新娘肆氓。我一直安慰自己,他們只是感情好底瓣,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,813評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布谢揪。 她就那樣靜靜地躺著,像睡著了一般捐凭。 火紅的嫁衣襯著肌膚如雪拨扶。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 50,021評(píng)論 1 291
  • 那天茁肠,我揣著相機(jī)與錄音患民,去河邊找鬼。 笑死垦梆,一個(gè)胖子當(dāng)著我的面吹牛酒奶,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播奶赔,決...
    沈念sama閱讀 39,120評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼杠氢!你這毒婦竟也來(lái)了站刑?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,866評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤鼻百,失蹤者是張志新(化名)和其女友劉穎绞旅,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體温艇,經(jīng)...
    沈念sama閱讀 44,308評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡因悲,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,633評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了勺爱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片晃琳。...
    茶點(diǎn)故事閱讀 38,768評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出卫旱,到底是詐尸還是另有隱情人灼,我是刑警寧澤,帶...
    沈念sama閱讀 34,461評(píng)論 4 333
  • 正文 年R本政府宣布顾翼,位于F島的核電站投放,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏适贸。R本人自食惡果不足惜灸芳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,094評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望拜姿。 院中可真熱鬧烙样,春花似錦、人聲如沸砾隅。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,850評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)晴埂。三九已至究反,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間儒洛,已是汗流浹背精耐。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,082評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留琅锻,地道東北人卦停。 一個(gè)月前我還...
    沈念sama閱讀 46,571評(píng)論 2 362
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像恼蓬,于是被迫代替她去往敵國(guó)和親惊完。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,666評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容