Airflow中的DAG應(yīng)該怎么看

最近在對T-1的數(shù)據(jù)進(jìn)行測試刺下,所以學(xué)會如何看DAG就是非常重要的一個(gè)環(huán)節(jié)了树埠。

1.DAG背景

DAG我們都知道,是一個(gè)有向無環(huán)圖疾呻,任務(wù)都是有順序的除嘹,存在依賴關(guān)系,進(jìn)行一次跑數(shù)據(jù)岸蜗。那為什么要使用這個(gè)DAG呢尉咕?
DAG中主要存在幾層:貼源層、中間層散吵、特征層龙考、數(shù)據(jù)層。每一層都有著先后關(guān)系矾睦,我們需要拿到貼源層的數(shù)據(jù),這個(gè)過程就是通過從各個(gè)業(yè)務(wù)庫中去進(jìn)行抽數(shù)炎功。中間層的數(shù)據(jù)又取決于貼源層的數(shù)據(jù)枚冗,如果貼源層的數(shù)據(jù)沒有抽到,中間層的數(shù)據(jù)基本就無法進(jìn)行跑批蛇损。
后續(xù)的操作基本就無法進(jìn)行運(yùn)行和驗(yàn)證了赁温。在對這些內(nèi)容進(jìn)行處理的時(shí)候,都是通過python語言淤齐,所以我們對DAG中的內(nèi)容就應(yīng)該特別重視了股囊。DAG中的內(nèi)容主要大部分都是通過寫SQL邏輯去進(jìn)行操作。

2.DAG是什么

Airflow:可編程更啄、調(diào)度和監(jiān)控的工作流平臺稚疹,基于有向無環(huán)圖(DAG),airflow可以定義一組有依賴的任務(wù)祭务,按照依賴依次執(zhí)行内狗。airflow提供了豐富的命令行工具用于系統(tǒng)管控怪嫌,而其web管理界面同樣也可以方便的管控調(diào)度任務(wù),并且對任務(wù)運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控柳沙,方便了系統(tǒng)的運(yùn)維和管理岩灭。

airflow最簡單的理解就是一個(gè)高級版的crontab,解決了crontab無法解決的任務(wù)依賴問題。

2.1 DAG整體拓?fù)鋱D

Airflow整體拓?fù)鋱D:外部系統(tǒng)赂鲤、MYSQL噪径、airflow master.

  • 1.外部系統(tǒng):直接調(diào)用airflow的系統(tǒng)只有BGS、oneservice数初。
  • 2.master節(jié)點(diǎn)web ui管理dags熄云、日志等信息,scheduler負(fù)責(zé)調(diào)度以及執(zhí)行具體dag中的task妙真。
  • 3.mysql數(shù)據(jù)庫用來存儲dag執(zhí)行的相關(guān)的缴允,記錄dag里的task的依賴關(guān)系。
image.png

2.2 DAG程序目錄結(jié)構(gòu)

airflow 程序目錄結(jié)構(gòu)一般有dags珍德、shell练般、etl-shell、confFile锈候、logs薄料、batch、airflow.cfg泵琳、airflow-scheduler.err摄职、airflow-scheduler.log、airflow-scheduler.out获列、airflow-scheduler.pid谷市。
dags:dag任務(wù)存放目錄。
shell:抽數(shù)shell腳本存放目錄击孩。
confFile:抽數(shù)的配置文件目錄迫悠。
logs:dag任務(wù)執(zhí)行的日志文件存放目錄。
batch:dag生成的數(shù)據(jù)文件目錄(一般要推送到sftp)
airflow.cfg:airflow的配置文件巩梢,如連接mysql的連接配置创泄,各個(gè)目錄的功能定義等。
airflow-scheduler.err:airflow調(diào)度器錯(cuò)誤日志括蝠,每次重啟會清空鞠抑。
airflow-scheduler.log:airflow由初始安裝至今的所有運(yùn)行日志。
airflow-scheduler.out:airflow每次重啟后運(yùn)行日志忌警。
airflow-scheduler.pid:記錄pid的文件搁拙。
stop_start.sh:airflow的停啟腳本(包括scheduler、web)。

3.如何看DAG

Airflow中的DAG有一個(gè)規(guī)則感混,起碼你可以通過這個(gè)結(jié)構(gòu)去明白DAG有哪些固定的模塊端幼。固定的模塊知道然后記住就可以了,這樣至少可以從一眼中找到你所需要的邏輯弧满。學(xué)會看DAG也很重要婆跑。
DAG初認(rèn)識,可以參考網(wǎng)址:
我們最重要的時(shí)需要了解我們所知道的那一部分內(nèi)容庭呜。也需要技巧滑进,比如搜索FROM或者SELECT關(guān)鍵字,根據(jù)這些關(guān)鍵字去找到自己的邏輯部分募谎。我比較喜歡用from關(guān)鍵字去看后面的來源表扶关,這樣大致你就可以知道是哪幾個(gè)表,這幾個(gè)表之間是如何通過sql語句去進(jìn)行關(guān)聯(lián)的数冬。
看DAG步驟:

  • 1.找到你的DAG
  • 2.通過from關(guān)鍵字定位到你的SQL邏輯
  • 3.復(fù)制select...from...這段語句就知道被插入到特定表的數(shù)據(jù)來源
  • 4.分析select...from...這段語句里面的邏輯是否是你想要的數(shù)據(jù)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末节槐,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子拐纱,更是在濱河造成了極大的恐慌铜异,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秸架,死亡現(xiàn)場離奇詭異揍庄,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)东抹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門蚂子,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人缭黔,你說我怎么就攤上這事食茎。” “怎么了试浙?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵董瞻,是天一觀的道長。 經(jīng)常有香客問我田巴,道長,這世上最難降的妖魔是什么挟秤? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任壹哺,我火速辦了婚禮,結(jié)果婚禮上艘刚,老公的妹妹穿的比我還像新娘管宵。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布箩朴。 她就那樣靜靜地躺著岗喉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪炸庞。 梳的紋絲不亂的頭發(fā)上钱床,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天,我揣著相機(jī)與錄音埠居,去河邊找鬼查牌。 笑死,一個(gè)胖子當(dāng)著我的面吹牛滥壕,可吹牛的內(nèi)容都是我干的纸颜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼绎橘,長吁一口氣:“原來是場噩夢啊……” “哼胁孙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起称鳞,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤涮较,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后胡岔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體法希,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年靶瘸,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了苫亦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,133評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡怨咪,死狀恐怖屋剑,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情诗眨,我是刑警寧澤唉匾,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站匠楚,受9級特大地震影響巍膘,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜芋簿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一峡懈、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧与斤,春花似錦肪康、人聲如沸荚恶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽谒撼。三九已至,卻和暖如春雾狈,著一層夾襖步出監(jiān)牢的瞬間廓潜,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工箍邮, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留茉帅,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓锭弊,卻偏偏與公主長得像堪澎,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子味滞,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容