kettle7.1的基本使用總結(jié)

概念:

Kettle是一款國(guó)外開(kāi)源的ETL工具十饥,純java編寫(xiě)励背,可以在Windows瑟枫、Linux斗搞、Unix上運(yùn)行,數(shù)據(jù)抽取高效穩(wěn)定慷妙。

Kettle家族目前包括4個(gè)產(chǎn)品:Spoon僻焚、Pan、CHEF景殷、Kitchen溅呢。

SPOON?允許你通過(guò)圖形界面來(lái)設(shè)計(jì)ETL轉(zhuǎn)換過(guò)程(Transformation)。

PAN?允許你批量運(yùn)行由Spoon設(shè)計(jì)的ETL轉(zhuǎn)換 (例如使用一個(gè)時(shí)間調(diào)度器)猿挚。Pan是一個(gè)后臺(tái)執(zhí)行的程序咐旧,沒(méi)有圖形界面。

CHEF?允許你創(chuàng)建任務(wù)(Job)绩蜻。 任務(wù)通過(guò)允許每個(gè)轉(zhuǎn)換铣墨,任務(wù),腳本等等办绝,更有利于自動(dòng)化更新數(shù)據(jù)倉(cāng)庫(kù)的復(fù)雜工作伊约。任務(wù)通過(guò)允許每個(gè)轉(zhuǎn)換,任務(wù)孕蝉,腳本等等屡律。任務(wù)將會(huì)被檢查,看看是否正確地運(yùn)行了降淮。

KITCHEN?允許你批量使用由Chef設(shè)計(jì)的任務(wù) (例如使用一個(gè)時(shí)間調(diào)度器)超埋。KITCHEN也是一個(gè)后臺(tái)運(yùn)行的程序。

我們主要講解spoon佳鳖。

一霍殴、配置倉(cāng)庫(kù)管理

? ? 點(diǎn)擊右上角配置數(shù)據(jù)存儲(chǔ)位置


點(diǎn)擊Repository Manager…


數(shù)據(jù)庫(kù)存儲(chǔ)則是將所創(chuàng)建的文件保存到數(shù)據(jù)庫(kù),這樣可以保證數(shù)據(jù)的安全性系吩。(長(zhǎng)時(shí)間的傳輸可能出現(xiàn)數(shù)據(jù)庫(kù)連接超時(shí))来庭。

文件存儲(chǔ)則是將文件保存到本地磁盤(pán),兩種可視情況而定穿挨。

二月弛、轉(zhuǎn)換的使用

配置BD連接肴盏,必須先把數(shù)據(jù)庫(kù)連接的jar包放在kettle安裝目錄下的lib包。如:mysql-connector-java-5.1.38.jar

如下:配置了一個(gè)oracle和一個(gè)mysql的數(shù)據(jù)庫(kù)

新建一個(gè)轉(zhuǎn)換: 文件 —> 新建 —> 轉(zhuǎn)換

簡(jiǎn)單的數(shù)據(jù)轉(zhuǎn)換最常用的就是CSV文件輸入和表輸入兩種了帽衙,其他的可以在作業(yè)中用到叁鉴。

輸出有以上幾種,下面我們示范一個(gè)從數(shù)據(jù)庫(kù)讀取數(shù)據(jù)佛寿,輸出一個(gè)csv文件幌墓。

寫(xiě)完后點(diǎn)擊預(yù)覽查看是否正確

下面看文本文件輸出

點(diǎn)擊執(zhí)行,生成csv文本

三冀泻、作業(yè)

比如說(shuō)我們要同時(shí)同步五張表的數(shù)據(jù)則可以新建一個(gè)作業(yè)常侣,多線(xiàn)程去同步五張表的數(shù)據(jù)


四、定時(shí)執(zhí)行任務(wù)

我們將作業(yè)保存在數(shù)據(jù)庫(kù)中弹渔,windows下一般用任務(wù)調(diào)度來(lái)執(zhí)行胳施,linux可以用crotable實(shí)現(xiàn)

新建一個(gè)bat文件

然后將這個(gè)bat文件添加到windows定時(shí)任務(wù)中就可以了

五、java代碼

kettle也支持java代碼及js腳本等

假設(shè)有表person,有字段id,name,code,若code為空肢专,則取name,若不為空加上999舞肆,然后更新原表數(shù)據(jù)。


表輸入如下:

Java代碼如下:


更新如下:


執(zhí)行成功后查看數(shù)據(jù)庫(kù)數(shù)據(jù):

六博杖、性能優(yōu)化

Oracle:

????defaultRowPrefetch = 20000 (可以根據(jù)內(nèi)存情況定)

????????預(yù)取條數(shù)默認(rèn)值,oracle默認(rèn)為10椿胯,可以增加該值來(lái)減少數(shù)據(jù)庫(kù)請(qǐng)求以提高查詢(xún)效率

Mysql:

defaultFetchSize:設(shè)置一次讀取多少條數(shù)據(jù),不設(shè)置讀大表可能會(huì)出現(xiàn)OOM問(wèn)題

rewriteBatchedStatements:批量插入剃根,可以提高插入數(shù)據(jù)的性能

useServerPrepStmts:如果服務(wù)器支持哩盲,是否使用服務(wù)器端預(yù)處理語(yǔ)句? 默認(rèn)值為“真”(如果數(shù)據(jù)類(lèi)型不一? ? ? ?致狈醉,可能會(huì)出現(xiàn)丟失精度問(wèn)題)

useCursorFetch:使用FetchSize必須啟用

useCompression:與服務(wù)器進(jìn)行通信時(shí)采用zlib壓縮(真/假)廉油? 默認(rèn)值為“假”。

更多參數(shù)配置可以見(jiàn):mysql配置


提交數(shù)量可以根據(jù)內(nèi)存情況盡量給大苗傅,最大5W條抒线。

根據(jù)電腦內(nèi)存修改spoon.bat

???????? PENTAHO_DI_JAVA_OPTIONS="-Xms8192m""-Xmx8192m" "-XX:MaxPermSize=4096m"

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市渣慕,隨后出現(xiàn)的幾起案子嘶炭,更是在濱河造成了極大的恐慌,老刑警劉巖摇庙,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件旱物,死亡現(xiàn)場(chǎng)離奇詭異遥缕,居然都是意外死亡卫袒,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)单匣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)夕凝,“玉大人宝穗,你說(shuō)我怎么就攤上這事÷氡” “怎么了逮矛?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)转砖。 經(jīng)常有香客問(wèn)我须鼎,道長(zhǎng),這世上最難降的妖魔是什么府蔗? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任晋控,我火速辦了婚禮,結(jié)果婚禮上姓赤,老公的妹妹穿的比我還像新娘赡译。我一直安慰自己,他們只是感情好不铆,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布蝌焚。 她就那樣靜靜地躺著,像睡著了一般誓斥。 火紅的嫁衣襯著肌膚如雪只洒。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,182評(píng)論 1 299
  • 那天劳坑,我揣著相機(jī)與錄音红碑,去河邊找鬼。 笑死泡垃,一個(gè)胖子當(dāng)著我的面吹牛析珊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蔑穴,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼忠寻,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了存和?” 一聲冷哼從身側(cè)響起奕剃,我...
    開(kāi)封第一講書(shū)人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎捐腿,沒(méi)想到半個(gè)月后纵朋,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡茄袖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年操软,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片宪祥。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡聂薪,死狀恐怖家乘,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情藏澳,我是刑警寧澤仁锯,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站翔悠,受9級(jí)特大地震影響业崖,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蓄愁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一腻要、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧涝登,春花似錦雄家、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至咽笼,卻和暖如春顷编,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背剑刑。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工媳纬, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人施掏。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓钮惠,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親七芭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子素挽,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • //[kettle官方首頁(yè)]Data Integration | Pentaho Communityhttp://...
    葡萄喃喃囈語(yǔ)閱讀 5,081評(píng)論 0 21
  • Kettle 1.Kettle的介紹: Kettle是一款國(guó)外開(kāi)源...
    有你就行閱讀 739評(píng)論 0 1
  • 背景 最近因公司項(xiàng)目原因,接觸到了Kettle這樣一款ETL工具狸驳。計(jì)劃在這段學(xué)習(xí)與使用的過(guò)程中预明,將自己的心得體會(huì),...
    熊頎閱讀 26,492評(píng)論 11 41
  • 關(guān)于Mongodb的全面總結(jié) MongoDB的內(nèi)部構(gòu)造《MongoDB The Definitive Guide》...
    中v中閱讀 31,928評(píng)論 2 89
  • 數(shù)據(jù)整合是吧在不同數(shù)據(jù)源的數(shù)據(jù)收集耙箍、整理撰糠、清洗、轉(zhuǎn)換(有點(diǎn)像ETL)后辩昆,加載到一個(gè)新的數(shù)據(jù)源阅酪,為數(shù)據(jù)使用者提供統(tǒng)一...
    開(kāi)心跳蚤閱讀 2,033評(píng)論 0 5