Kettle Hello World

上一篇:etl-bigdata
更多信息查看:https://blue-shadow.top

下載调煎,使用Kettle

  • 下載地址: https://sourceforge.net/projects/pentaho/files/Data%20Integration/

  • 必備條件:安裝了Java環(huán)境,并配置了路徑攻旦;將從Kettle壓縮包解壓后即可用

  • 打開方式: 針對Windows系統(tǒng)劝萤,在調(diào)用 Spoon.bat ; 在Linux系統(tǒng)上,調(diào)用 Spoon.sh

  • Kettle是什么 :Java編寫的開源ETL工具

1-start kettle

Hello World

通過制作一個(gè)Hello World例子,進(jìn)行對Kettle的操作流程說明攘宙,認(rèn)識Kettle處理中的整體過程。

  • 創(chuàng)建一個(gè)Transformation : File --> New --> Transformation
  • 使用Generate Rows Step: Design --> Input --> Generate Rows
  • 設(shè)置Generate Rows Step:左鍵雙擊或右鍵點(diǎn)擊在窗口中選擇Edit拐迁;進(jìn)行命名和設(shè)置要輸出的信息
創(chuàng)建Transformation和設(shè)置Generate Rows
  • 使用Dummy Step : Design --> Flow --> Dummy
  • 設(shè)置Dummy Step :通過Hop連接 Generate Rows Step 和 Dummy Step ; 認(rèn)識Step的工具欄 ; 預(yù)覽查看 ; 查看執(zhí)行信息
使用Dummy Step并預(yù)覽數(shù)據(jù)
  • 設(shè)置Kettle腳本說明: 右鍵工作區(qū)空白處 -- > New Note
  • 設(shè)置Kettle腳本信息:菜單Edit --> Settings
標(biāo)注說明和保存
  • 通過工具欄 : 執(zhí)行蹭劈、預(yù)覽 、調(diào)試线召、分析
  • 通過View窗口 : 查看Kettle工程的結(jié)構(gòu)
工具欄和View

說明

以上的操作中主要目的就是為了熟悉Kettle操作界面铺韧、演示Kettle主要使用方法、將需要說明的概念可視化的演示缓淹。

這里提出4個(gè)最重要的概念: Transformation 哈打、 Job 、 Step 讯壶、 Hop 前酿。在上面的操作,其實(shí)可以隱約的發(fā)現(xiàn)這些關(guān)鍵字鹏溯。

  • Transformation : ETL中的主要部分罢维,負(fù)責(zé)抽取、轉(zhuǎn)換丙挽、加載各階段中對數(shù)據(jù)的操作肺孵,轉(zhuǎn)換中包含一個(gè)或多個(gè)步驟(Step)。轉(zhuǎn)換中的步驟通過跳連接
    這樣就允許數(shù)據(jù)從一個(gè)Step流向另一個(gè)Step
  • Job : 一個(gè)作業(yè)由多個(gè)作業(yè)項(xiàng)構(gòu)成颜阐,這些作業(yè)項(xiàng)按先后順序依次執(zhí)行平窘,作業(yè)項(xiàng)相當(dāng)于轉(zhuǎn)換中的Step。在作業(yè)中也使用跳連接兩個(gè)作業(yè)項(xiàng)凳怨。
  • Step : 在轉(zhuǎn)換中的基本單元瑰艘,用于完成不同改的數(shù)據(jù)處理
  • Hop : 連接Step或作業(yè)項(xiàng)

作業(yè)是步驟流,轉(zhuǎn)換是數(shù)據(jù)流肤舞。這是作業(yè)和轉(zhuǎn)換最大的區(qū)別 紫新。
作業(yè)的每一個(gè)步驟,必須等到前面的步驟都跑完了李剖,后面的步驟才會執(zhí)行芒率;而轉(zhuǎn)換會一次性把所有控件全部先啟動(一個(gè)控件對應(yīng)啟動一個(gè)線程),然后數(shù)據(jù)流會從第一個(gè)控件開始篙顺,一條記錄偶芍、一條記錄地流向最后的控件

在本次的演示中充择,使用到的是Transformation轉(zhuǎn)換,Transformation是通過Hop將Step連接成的實(shí)體匪蟀,而Step和Hop也就描述出數(shù)據(jù)流的路徑椎麦。
在Step中進(jìn)行數(shù)據(jù)創(chuàng)建或轉(zhuǎn)換,隨后通過Hop的指引流向其他的Step材彪。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末铃剔,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子查刻,更是在濱河造成了極大的恐慌,老刑警劉巖凤类,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件穗泵,死亡現(xiàn)場離奇詭異,居然都是意外死亡谜疤,警方通過查閱死者的電腦和手機(jī)佃延,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來夷磕,“玉大人履肃,你說我怎么就攤上這事∽” “怎么了尺棋?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長绵跷。 經(jīng)常有香客問我膘螟,道長,這世上最難降的妖魔是什么碾局? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任荆残,我火速辦了婚禮,結(jié)果婚禮上净当,老公的妹妹穿的比我還像新娘内斯。我一直安慰自己,他們只是感情好像啼,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布俘闯。 她就那樣靜靜地躺著,像睡著了一般忽冻。 火紅的嫁衣襯著肌膚如雪备徐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天甚颂,我揣著相機(jī)與錄音蜜猾,去河邊找鬼秀菱。 笑死,一個(gè)胖子當(dāng)著我的面吹牛蹭睡,可吹牛的內(nèi)容都是我干的衍菱。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼肩豁,長吁一口氣:“原來是場噩夢啊……” “哼脊串!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起清钥,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤琼锋,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后祟昭,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缕坎,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年篡悟,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了谜叹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,102評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡搬葬,死狀恐怖荷腊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情急凰,我是刑警寧澤女仰,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站抡锈,受9級特大地震影響董栽,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜企孩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一锭碳、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧勿璃,春花似錦擒抛、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至莲组,卻和暖如春诊胞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工撵孤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留迈着,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓邪码,卻偏偏與公主長得像裕菠,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子闭专,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評論 2 355