Kettle性能調(diào)優(yōu)匯總

? ? ?性能調(diào)優(yōu)在整個工程中是非常重要的,也是非常有必要的卧波。但有的時候我們往往都不知道如何對性能進(jìn)行調(diào)優(yōu)时肿。其實性能調(diào)優(yōu)主要分兩個方面:一方面是硬件調(diào)優(yōu),一方面是軟件調(diào)優(yōu)港粱。本章主要是介紹Kettle的性能優(yōu)化及效率提升螃成。

一、Kettle調(diào)優(yōu)

1查坪、??調(diào)整JVM大小進(jìn)行性能優(yōu)化寸宏,修改Kettle定時任務(wù)中的Kitchen與Pan腳本中。

?2偿曙、??調(diào)整提交(Commit)記錄數(shù)大小進(jìn)行優(yōu)化

如修改RotKang_Test01中的“表輸出”組件中的“提交記錄數(shù)量”參數(shù)進(jìn)行優(yōu)化氮凝,Kettle默認(rèn)Commit數(shù)量為:1000,可以根據(jù)數(shù)據(jù)量大小來設(shè)置Commitsize:1000~50000遥昧。

3覆醇、??調(diào)整記錄集合里的記錄數(shù)

4朵纷、盡量使用數(shù)據(jù)庫連接池炭臭;

5、盡量提高批處理的commit size袍辞;

6鞋仍、盡量使用緩存,緩存盡量大一些(主要是文本文件和數(shù)據(jù)流)搅吁;

7威创、Kettle是Java做的落午,盡量用大一點的內(nèi)存參數(shù)啟動Kettle;

8肚豺、可以使用sql來做的一些操作盡量用sql溃斋;

? ? ? Group , merge , stream lookup,split field這些操作都是比較慢的,想辦法避免他們.吸申,能用sql就用sql梗劫;

9、插入大量數(shù)據(jù)的時候盡量把索引刪掉截碴;

10梳侨、盡量避免使用update , delete操作,尤其是update,如果可以把update變成先delete, ?后insert日丹;

11走哺、能使用truncate table的時候,就不要使用deleteall row這種類似sql合理的分區(qū)哲虾,如果刪除操作是基于某一個分區(qū)的丙躏,就不要使用delete row這種方式(不管是deletesql還是delete步驟),直接把分區(qū)drop掉,再重新創(chuàng)建束凑;

12彼哼、盡量縮小輸入的數(shù)據(jù)集的大小(增量更新也是為了這個目的)湘今;

13敢朱、盡量使用數(shù)據(jù)庫原生的方式裝載文本文件(Oracle的sqlloader, mysql的bulk loader步驟);

14摩瞎、盡量不要用kettle的calculate計算步驟拴签,能用數(shù)據(jù)庫本身的sql就用sql ,不能用sql就盡量想辦法用procedure,實在不行才是calculate步驟;

15旗们、要知道你的性能瓶頸在哪蚓哩,可能有時候你使用了不恰當(dāng)?shù)姆绞剑瑢?dǎo)致整個操作都變慢上渴,觀察kettle log生成的方式來了解你的ETL操作最慢的地方岸梨;

16、遠(yuǎn)程數(shù)據(jù)庫用文件+FTP的方式來傳數(shù)據(jù)稠氮,文件要壓縮曹阔。(只要不是局域網(wǎng)都可以認(rèn)為是遠(yuǎn)程連接)。

二隔披、索引的正確使用

在ETL過程中的索引需要遵循以下使用原則:

1赃份、當(dāng)插入的數(shù)據(jù)為數(shù)據(jù)表中的記錄數(shù)量10%以上時,首先需要刪除該表的索引來提高數(shù)據(jù)的插入效率,當(dāng)數(shù)據(jù)全部插入后再建立索引抓韩。

2纠永、避免在索引列上使用函數(shù)或計算,在where子句中谒拴,如果索引列是函數(shù)的一部分尝江,優(yōu)化器將不使用索引而使用全表掃描。

3英上、避免在索引列上使用?NOT和?“!=”茂装,索引只能告訴什么存在于表中,而不能告訴什么不存在于表中善延,當(dāng)數(shù)據(jù)庫遇到NOT和?“!=”時少态,就會停止使用索引轉(zhuǎn)而執(zhí)行全表掃描。

4易遣、索引列上用?>=替代?>

? ? ? 高效:select * from temp where deptno>=4

? ? ? 低效:select * from temp where deptno>3

? ? ? 兩者的區(qū)別在于彼妻,前者DBMS將直接跳到第一個DEPT等于4的記錄而后者將首先定位到DEPTNO=3的記錄并且向前掃描到第一個DEPT大于3的記錄。

三豆茫、數(shù)據(jù)抽取的SQL優(yōu)化

1侨歉、Where子句中的連接順序。

2揩魂、刪除全表是用TRUNCATE替代DELETE幽邓。

3、盡量多使用COMMIT火脉。

4牵舵、用EXISTS替代IN。

5倦挂、用NOT EXISTS替代NOT IN畸颅。

6、優(yōu)化GROUP BY方援。

7没炒、有條件的使用UNION-ALL替換UNION。

8犯戏、分離表和索引送火。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市先匪,隨后出現(xiàn)的幾起案子种吸,更是在濱河造成了極大的恐慌,老刑警劉巖胚鸯,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件骨稿,死亡現(xiàn)場離奇詭異笨鸡,居然都是意外死亡姜钳,警方通過查閱死者的電腦和手機(jī)坦冠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哥桥,“玉大人辙浑,你說我怎么就攤上這事∧飧猓” “怎么了判呕?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長送滞。 經(jīng)常有香客問我侠草,道長,這世上最難降的妖魔是什么犁嗅? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任边涕,我火速辦了婚禮,結(jié)果婚禮上褂微,老公的妹妹穿的比我還像新娘功蜓。我一直安慰自己,他們只是感情好宠蚂,可當(dāng)我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布式撼。 她就那樣靜靜地躺著,像睡著了一般求厕。 火紅的嫁衣襯著肌膚如雪著隆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天呀癣,我揣著相機(jī)與錄音旅东,去河邊找鬼。 笑死十艾,一個胖子當(dāng)著我的面吹牛抵代,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播忘嫉,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼荤牍,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了庆冕?” 一聲冷哼從身側(cè)響起康吵,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎访递,沒想到半個月后晦嵌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年惭载,在試婚紗的時候發(fā)現(xiàn)自己被綠了旱函。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡描滔,死狀恐怖棒妨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情含长,我是刑警寧澤券腔,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站拘泞,受9級特大地震影響纷纫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜陪腌,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一涛酗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧偷厦,春花似錦商叹、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至请唱,卻和暖如春弥咪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背十绑。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工聚至, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人本橙。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓扳躬,卻偏偏與公主長得像,于是被迫代替她去往敵國和親甚亭。 傳聞我的和親對象是個殘疾皇子贷币,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,452評論 2 348