1逢并、下載 安裝 運行
下載 kettle最新下載地址:http://community.pentaho.com/projects/data-integration/
安裝 需求環(huán)境:
kettle需要jre1.5及以上版本,可以通過oracle官網(wǎng)免費下載拉一;
kettle無需安裝政勃,直接解壓zip文件到指定的文件夾唧龄。在Lunix操作系統(tǒng)上,需要執(zhí)行以下腳本:
cd Kettle
chmod +x*.sh
運行 kettle中的一個圖形用戶界面叫spoon奸远,spoon可以設(shè)計和運行轉(zhuǎn)換和作業(yè)既棺。
在windows中執(zhí)行spoon.bat讽挟,在lunix中執(zhí)行spoon.sh;
spoon是一個圖形設(shè)計工具丸冕,用來設(shè)計和測試數(shù)據(jù)交換處理流程耽梅,也可以通過命令行(終端)執(zhí)行處理流程。
在spoon中設(shè)計作業(yè)和轉(zhuǎn)換胖烛,kettle提供兩種方式存儲:資源庫和文件眼姐;
如果你選擇資源庫,spoon第一次啟動時需要創(chuàng)建資源庫佩番;選擇文件方法众旗,作業(yè)保存文件時的擴展名是kjb,轉(zhuǎn)換文件的擴展名是ktr趟畏。
2贡歧、示例
1)創(chuàng)建一個新的transformation,點擊保存到本地路徑拱镐,
D:\hxm_test\轉(zhuǎn)換1.ktr艘款;
2)創(chuàng)建一個新的job持际,點擊保存到本地路徑沃琅,D:\hxm_test\作業(yè)1.kjb;
建立轉(zhuǎn)換:
文件->新建轉(zhuǎn)換蜘欲。
新建轉(zhuǎn)換后在左邊的主對象樹中建立DB連接用以連接數(shù)據(jù)庫益眉。
建立數(shù)據(jù)庫連接的過程與其他數(shù)據(jù)庫管理軟件連接數(shù)據(jù)庫類似。
注意:在數(shù)據(jù)庫連接的過程中姥份,可能會報錯 某個數(shù)據(jù)庫連接找不到郭脂。那是因為你沒有對應(yīng)的數(shù)據(jù)庫連接驅(qū)動,需要下載對應(yīng)的驅(qū)動澈歉,放入kettle的lib文件夾展鸡。
-
簡單的數(shù)據(jù)表插入\更新
(1)新建表插入
在左邊的面板中選擇“核心對象”,在核心對象里面選擇“輸入->表輸入”埃难,用鼠標拖動到右邊面板莹弊。如圖所示:
image.png
雙擊拖過來的表,可以編輯表輸入涡尘。
選擇數(shù)據(jù)庫連接和編輯sql語句忍弛,在這一步可以點擊預覽,查看自己是否連接正確考抄。
image.png
(2)通過插入\更新輸出到表
在左邊面板中選擇核心對象细疚,選擇“輸出->插入\更新”,如圖所示:
image.png
編輯插入更新:
首先:表輸入連接插入更新川梅。(選中表輸入疯兼,按住shift鍵然遏,拖向插入更新。)
然后吧彪,雙擊插入更新啦鸣,進行編輯。
最后来氧,點擊運行查看效果诫给。先保存再運行。
-
建立作業(yè)
使用作業(yè)可以定時或者周期性的執(zhí)行轉(zhuǎn)換啦扬,新建一個作業(yè)中狂。從左邊面板拖入start和轉(zhuǎn)換。
image.png
雙擊start可以編輯扑毡,可以設(shè)置執(zhí)行時間等等
image.png
點開轉(zhuǎn)換胃榕,可以設(shè)置需要執(zhí)行的轉(zhuǎn)換任務(wù)。
image.png
最后瞄摊,點擊運行即可勋又。