Oozie

為什么要有Oozie耘拇?

在數(shù)據(jù)業(yè)務(wù)場(chǎng)景,對(duì)于數(shù)據(jù)的處理往往是分階段處理笛谦,而不同的階段可能采用了不同的技術(shù)框架去完成這個(gè)業(yè)務(wù)需求碗暗,且可能在不同的階段要干不同的事颈将。

炒飯(鍋) à 吃飯(碗) à 筷子(動(dòng)手)

要吃飯就要等炒飯先用鍋炒好,要用筷子動(dòng)手吃飯就要等碗里裝了飯言疗,這是一個(gè)流水線(xiàn)式的過(guò)程晴圾,如果用設(shè)定時(shí)間的方式,到了什么時(shí)候就拿完去裝飯噪奄,但如果今天兼職的人特別多疑务,那么炒的飯必然就多了沾凄,時(shí)間也長(zhǎng)了,但是設(shè)定時(shí)間到了知允,還沒(méi)炒好撒蟀,可是有一堆人擠在廚房喊要飯,問(wèn)題就出現(xiàn)了温鸽。

于是有的人會(huì)想保屯,如果有一個(gè)監(jiān)督人幫我去這個(gè)監(jiān)控、通知涤垫、控制好整個(gè)流程姑尺,那樣多好啊,廚房就不會(huì)給天天催了蝠猬,也不會(huì)發(fā)生擁擠的情況切蟋。

????? 小結(jié):一個(gè)完整的數(shù)據(jù)分析系統(tǒng)通常是由大量的任務(wù)單元組成,Shell腳本榆芦、Java程序柄粹、MapReduce程序、Hive腳本等等匆绣,各個(gè)任務(wù)單元之間存在時(shí)間先后及前后依賴(lài)關(guān)系驻右。

????? 為了很好的組織這樣的復(fù)雜執(zhí)行計(jì)劃,需要一個(gè)工作流調(diào)度系統(tǒng)來(lái)調(diào)用執(zhí)行崎淳。

????? 簡(jiǎn)單的工作流調(diào)度:Liunx的crontab來(lái)定義

????? 復(fù)雜的工作流調(diào)度:Oozie堪夭、Azakaban等。拣凹。森爽。



主流幾款工作流調(diào)度框架

特性HamakeOozieAzkabanCascading

工作流描述語(yǔ)言XMLXML (xPDL based)text file with key/value? pairsJava API

依賴(lài)機(jī)制data-drivenexplicitexplicitexplicit

是否要web容器NoYesYesNo

進(jìn)度跟蹤console/log messagesweb pageweb pageJava API

Hadoop job調(diào)度支持noyesyesyes

運(yùn)行模式command line utilitydaemondaemonAPI

Pig支持yesyesyesyes

事件通知nononoyes

需要安裝noyesyesno

支持的hadoop版本0.18+0.20+currently unknown0.18+

重試支持noworkflownode? evelyesyes

運(yùn)行任意命令yesyesyesyes

Amazon EMR支持yesnocurrently unknownyes



什么是Oozie?

????? Oozie(馴象人)是一個(gè)基于工作流引擎的開(kāi)源框架嚣镜,由Cloudera公司貢獻(xiàn)給Apache的爬迟,用在一個(gè)工作流內(nèi)以一個(gè)特定順序運(yùn)行一組工作或流程。

????? Oozie在集群中扮演的是定時(shí)調(diào)度任務(wù)祈惶,多任務(wù),并開(kāi)源按照業(yè)務(wù)邏輯順序調(diào)度扮匠。



組成

Workflow順序執(zhí)行流程節(jié)點(diǎn)捧请,執(zhí)行分支多節(jié)點(diǎn)或合并多分點(diǎn)為一個(gè)分支。

Coordinator定時(shí)觸發(fā)Workflow

BundleJob綁定多個(gè)Coordinator


Oozie節(jié)點(diǎn)

????? 控制流節(jié)點(diǎn)(Control Flow Nodes):一般都是定義在工作流開(kāi)始或結(jié)束棒搜,比如start疹蛉、end、kill等力麸,以及提供工作流的執(zhí)行路徑可款。

????? 動(dòng)作節(jié)點(diǎn)(Action Nodes):執(zhí)行具體動(dòng)作的節(jié)點(diǎn)育韩。



案例

job.properties

#NameNode地址

nameNode=hdfs://hadoop-senior00-levi.com:8082

#ResourceManager地址,默認(rèn)端口8032

jobTracker=hadoop-senior00-levi.com:8032

#內(nèi)部的Event隊(duì)列名稱(chēng)

queueName=default

examplesRoot=oozie-apps

#程序位置

oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/shell

#執(zhí)行這個(gè)腳本

EXEC1=test1.sh

EXEC2=test2.sh


workflow.xml

???

???

???????????????

???????????????????????${jobTracker}

???????????????????????${nameNode}

???????????????????????

???????????????????????????????

???????????????????????????????????????mapred.job.queue.name

???????????????????????????????????????${queueName}



??????????????????????? ${EXEC1}


???????????????????????/user/admin/oozie-apps/shell/${EXEC1}#${EXEC1}


???????????????????????


???????????????

???????????????


??????????? ?

???????????????

???????????????????????${jobTracker}

???????????????????????${nameNode}

???????????????????????

???????????????????????????????

???????????????????????????????????????mapred.job.queue.name

???????????????????????????????????????${queueName}



??????????????????????? ${EXEC2}


???????????????????????/user/admin/oozie-apps/shell/${EXEC2}#${EXEC2}


???????????????????????


???????????????

???????????????


???

???????

???????????

???????????????${wf:actionData('shell-node')['my_output'] eq 'Hello Oozie'}


???????????



???

???????Shell action failed, errormessage[${wf:errorMessage(wf:lastErrorNode())}]


???

???????Incorrect output, expected [Hello Oozie] but was[${wf:actionData('shell-node')['my_output']}]


???



test1.sh

#!/bin/bash

/usr/bin/date > /tmp/test.log

/usr/bin/date > /tmp/test.log


執(zhí)行:

上傳到HDFS:

hdfs dfs -rmr /user/levi/oozie-apps

hdfs dfs -put oozie-apps/ /user/levi


執(zhí)行任務(wù):

bin/oozie job --ooziehttp://hadoop-senior00-levi.com:11000/oozie -config oozie-apps/shell/job.properties-run























使用注意事項(xiàng)

[if !supportLists]1.????[endif]啟動(dòng)不了闺鲸,則到oozie-server/temp查看是否有*.pid文件筋讨,有就刪除后在啟動(dòng)。

[if !supportLists]2.????[endif]如果無(wú)法關(guān)閉oozie則kill掉摸恍。

[if !supportLists]3.????[endif]Mysql配置如果沒(méi)有生效的話(huà)悉罕,默認(rèn)使用derby數(shù)據(jù)庫(kù)

[if !supportLists]4.????[endif]在本地修改完成的job配置,必須重新上傳到HDFS立镶。

[if !supportLists]5.????[endif]Linux用戶(hù)名和Hadoop的用戶(hù)名不一致壁袄。

[if !supportLists]6.????[endif]時(shí)區(qū)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市媚媒,隨后出現(xiàn)的幾起案子嗜逻,更是在濱河造成了極大的恐慌,老刑警劉巖缭召,帶你破解...
    沈念sama閱讀 211,743評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件栈顷,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡恼琼,警方通過(guò)查閱死者的電腦和手機(jī)妨蛹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)晴竞,“玉大人蛙卤,你說(shuō)我怎么就攤上這事∝溃” “怎么了颤难?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,285評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)已维。 經(jīng)常有香客問(wèn)我行嗤,道長(zhǎng),這世上最難降的妖魔是什么垛耳? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,485評(píng)論 1 283
  • 正文 為了忘掉前任栅屏,我火速辦了婚禮,結(jié)果婚禮上堂鲜,老公的妹妹穿的比我還像新娘栈雳。我一直安慰自己,他們只是感情好缔莲,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布哥纫。 她就那樣靜靜地躺著,像睡著了一般痴奏。 火紅的嫁衣襯著肌膚如雪蛀骇。 梳的紋絲不亂的頭發(fā)上厌秒,一...
    開(kāi)封第一講書(shū)人閱讀 49,821評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音擅憔,去河邊找鬼鸵闪。 笑死,一個(gè)胖子當(dāng)著我的面吹牛雕欺,可吹牛的內(nèi)容都是我干的岛马。 我是一名探鬼主播,決...
    沈念sama閱讀 38,960評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼屠列,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼啦逆!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起笛洛,我...
    開(kāi)封第一講書(shū)人閱讀 37,719評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤夏志,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后苛让,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體沟蔑,經(jīng)...
    沈念sama閱讀 44,186評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評(píng)論 2 327
  • 正文 我和宋清朗相戀三年狱杰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了瘦材。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,650評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡仿畸,死狀恐怖食棕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情错沽,我是刑警寧澤簿晓,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布,位于F島的核電站千埃,受9級(jí)特大地震影響憔儿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜放可,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評(píng)論 3 313
  • 文/蒙蒙 一谒臼、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧耀里,春花似錦蜈缤、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,757評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)痪枫。三九已至织堂,卻和暖如春叠艳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背易阳。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,991評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工附较, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人潦俺。 一個(gè)月前我還...
    沈念sama閱讀 46,370評(píng)論 2 360
  • 正文 我出身青樓拒课,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親事示。 傳聞我的和親對(duì)象是個(gè)殘疾皇子早像,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評(píng)論 2 349