Azkaban-開(kāi)源任務(wù)調(diào)度程序(使用篇)

上篇文章說(shuō)到了安裝煮仇,這次說(shuō)說(shuō)使用

登錄

https://localhost:8443
注意是https劳跃,采用的是jetty ssl鏈接。輸入賬號(hào)密碼azkaban/azkanban(如果你之前沒(méi)有更改的話)

首頁(yè)

首頁(yè)有四個(gè)菜單

  • projects:最重要的部分浙垫,創(chuàng)建一個(gè)工程刨仑,所有flows將在工程中運(yùn)行郑诺。
  • scheduling:顯示定時(shí)任務(wù)
  • executing:顯示當(dāng)前運(yùn)行的任務(wù)
  • history:顯示歷史運(yùn)行任務(wù)

主要介紹projects部分
首先創(chuàng)建一個(gè)工程,填寫名稱和描述杉武,比如o2olog辙诞。

o2olog工程

Flows:工作流程,有多個(gè)job組成
Permissions:權(quán)限管理
Project Logs:工程日志

創(chuàng)建工程:

創(chuàng)建之前我們先了解下之間的關(guān)系轻抱,一個(gè)工程包含一個(gè)或多個(gè)flows飞涂,一個(gè)flow包含多個(gè)job。job是你想在azkaban中運(yùn)行的一個(gè)進(jìn)程祈搜,可以是簡(jiǎn)單的linux命令较店,可是java程序,也可以是復(fù)雜的shell腳本容燕,當(dāng)然梁呈,如果你安裝相關(guān)插件,也可以運(yùn)行插件蘸秘。一個(gè)job可以依賴于另一個(gè)job捧杉,這種多個(gè)job和它們的依賴組成的圖表叫做flow。

job創(chuàng)建

創(chuàng)建job很簡(jiǎn)單秘血,只要?jiǎng)?chuàng)建一個(gè)以.job結(jié)尾的文本文件就行了,例如我們創(chuàng)建一個(gè)工作味抖,用來(lái)將日志數(shù)據(jù)導(dǎo)入hive中(關(guān)于大數(shù)據(jù)方面的東西,不在重復(fù)灰粮,可以理解為仔涩,將日志所需數(shù)據(jù)導(dǎo)入的mysql中),我們創(chuàng)建o2o_2_hive.job

type=command
command=echo "data 2 hive"

一個(gè)簡(jiǎn)單的job就創(chuàng)建好了粘舟,解釋下熔脂,type的command,告訴azkaban用unix原生命令去運(yùn)行柑肴,比如原生命令或者shell腳本霞揉,當(dāng)然也有其他類型,后面說(shuō)晰骑。

一個(gè)工程不可能只有一個(gè)job适秩,我們現(xiàn)在創(chuàng)建多個(gè)依賴job,這也是采用azkaban的首要目的硕舆。

flows創(chuàng)建

我們說(shuō)過(guò)多個(gè)jobs和它們的依賴組成flow秽荞。怎么創(chuàng)建依賴,只要指定dependencies參數(shù)就行了抚官。比如導(dǎo)入hive前扬跋,需要進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)清洗前需要上傳凌节,上傳之前需要從ftp獲取日志钦听。
定義5個(gè)job:

  1. o2o_2_hive.job:將清洗完的數(shù)據(jù)入hive庫(kù)
  2. o2o_clean_data.job:調(diào)用mr清洗hdfs數(shù)據(jù)
  3. o2o_up_2_hdfs.job:將文件上傳至hdfs
  4. o2o_get_file_ftp1.job:從ftp1獲取日志
  5. o2o_get_file_fip2.job:從ftp2獲取日志

依賴關(guān)系:
3依賴4和5洒试,2依賴3,1依賴2朴上,4和5沒(méi)有依賴關(guān)系垒棋。

o2o_2_hive.job

type=command
# 執(zhí)行sh腳本,建議這樣做余指,后期只需維護(hù)腳本就行了捕犬,azkaban定義工作流程
command=sh /job/o2o_2_hive.sh
dependencies=o2o_clean_data

o2o_clean_data.job

type=command
# 執(zhí)行sh腳本,建議這樣做酵镜,后期只需維護(hù)腳本就行了碉碉,azkaban定義工作流程
command=sh /job/o2o_clean_data.sh
dependencies=o2o_up_2_hdfs

o2o_up_2_hdfs.job

type=command
#需要配置好hadoop命令,建議編寫到shell中淮韭,可以后期維護(hù)
command=hadoop fs -put /data/*
#多個(gè)依賴用逗號(hào)隔開(kāi)
dependencies=o2o_get_file_ftp1,o2o_get_file_ftp2

o2o_get_file_ftp1.job

type=command
command=wget "ftp://file1" -O /data/file1

o2o_get_file_ftp2.job

type=command
command=wget "ftp:file2" -O /data/file2

可以運(yùn)行unix命令垢粮,也可以運(yùn)行python腳本(強(qiáng)烈推薦)。將上述job打成zip包靠粪。
ps:為了測(cè)試流程蜡吧,我將上述command都改為echo +相應(yīng)命令

上傳:

上傳
上傳完成

點(diǎn)擊o2o_2_hive進(jìn)入流程,azkaban流程名稱以最后一個(gè)沒(méi)有依賴的job定義的占键。

流程

右上方是配置執(zhí)行當(dāng)前流程或者執(zhí)行定時(shí)流程昔善。

流程執(zhí)行

Flow view:流程視圖∨弦遥可以禁用君仆,啟用某些job
Notification:定義任務(wù)成功或者失敗是否發(fā)送郵件
Failure Options:定義一個(gè)job失敗,剩下的job怎么執(zhí)行
Concurrent:并行任務(wù)執(zhí)行設(shè)置
Flow Parametters:參數(shù)設(shè)置牲距。

1.執(zhí)行一次
設(shè)置好上述參數(shù)返咱,點(diǎn)擊execute。

執(zhí)行成功

綠色代表成功牍鞠,藍(lán)色是運(yùn)行咖摹,紅色是失敗∧咽觯可以查看job運(yùn)行時(shí)間萤晴,依賴和日志,點(diǎn)擊details可以查看各個(gè)job運(yùn)行情況龄广。

jobList

2.定時(shí)執(zhí)行

定時(shí)執(zhí)行

這時(shí)候注意到cst了吧硫眯,之前需要將配置中時(shí)區(qū)改為Asia/shanghai。
可以選擇"天/時(shí)/分/月/周"等執(zhí)行頻率择同。

定時(shí)任務(wù)

可以查看下次執(zhí)行時(shí)間。

其他job配置選項(xiàng)

  • 可以定義job依賴另一個(gè)flow净宵,配置

type=flow
flow.name=fisrt_flow

  • 可以設(shè)置每個(gè)job中子命令

type=command
command=echo "hello"
command.1=echo "world"

  • 可以配置job失敗重啟次數(shù)敲才,及間隔時(shí)間,比如裹纳,上述ftp獲取日志,我可以配置重試12次紧武,每隔5分鐘一次剃氧。

type=command
command=wget "ftp://file1" -O /data/file1
retries=12
#單位毫秒
retry.backoff=300000

azkaban還有很多強(qiáng)大的功能,如它開(kāi)放了相關(guān)api阻星,我們將它可以嵌入到自己的app等等朋鞍,有興趣的朋友可以研究。

至此妥箕,azkaban學(xué)習(xí)到此結(jié)束滥酥,本人也是初學(xué)者,如果問(wèn)題畦幢,歡迎指正坎吻。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市宇葱,隨后出現(xiàn)的幾起案子瘦真,更是在濱河造成了極大的恐慌,老刑警劉巖黍瞧,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诸尽,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡印颤,警方通過(guò)查閱死者的電腦和手機(jī)您机,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)膀哲,“玉大人往产,你說(shuō)我怎么就攤上這事∧诚埽” “怎么了仿村?”我有些...
    開(kāi)封第一講書人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)兴喂。 經(jīng)常有香客問(wèn)我蔼囊,道長(zhǎng),這世上最難降的妖魔是什么衣迷? 我笑而不...
    開(kāi)封第一講書人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任畏鼓,我火速辦了婚禮,結(jié)果婚禮上壶谒,老公的妹妹穿的比我還像新娘云矫。我一直安慰自己,他們只是感情好汗菜,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布让禀。 她就那樣靜靜地躺著挑社,像睡著了一般。 火紅的嫁衣襯著肌膚如雪巡揍。 梳的紋絲不亂的頭發(fā)上痛阻,一...
    開(kāi)封第一講書人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音腮敌,去河邊找鬼阱当。 笑死,一個(gè)胖子當(dāng)著我的面吹牛糜工,可吹牛的內(nèi)容都是我干的弊添。 我是一名探鬼主播,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼啤斗,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼表箭!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起钮莲,我...
    開(kāi)封第一講書人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤免钻,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后崔拥,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體极舔,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年链瓦,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拆魏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡慈俯,死狀恐怖渤刃,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情贴膘,我是刑警寧澤卖子,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站刑峡,受9級(jí)特大地震影響洋闽,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜突梦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一诫舅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧宫患,春花似錦刊懈、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)当宴。三九已至畜吊,卻和暖如春泽疆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背玲献。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工殉疼, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人捌年。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓瓢娜,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親礼预。 傳聞我的和親對(duì)象是個(gè)殘疾皇子眠砾,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容