DataWorks實(shí)戰(zhàn)2-業(yè)務(wù)流程的模塊規(guī)劃

數(shù)據(jù)倉(cāng)庫主要包含數(shù)據(jù)集成砰逻、數(shù)據(jù)計(jì)算泛鸟、數(shù)據(jù)服務(wù)北滥、數(shù)據(jù)質(zhì)量再芋、數(shù)據(jù)資產(chǎn)等模塊。在數(shù)倉(cāng)建設(shè)中济赎,對(duì)數(shù)據(jù)開發(fā)者說最主要工作在數(shù)據(jù)集成和數(shù)據(jù)計(jì)算记某,這2塊在Dataworks中都需要?jiǎng)?chuàng)建業(yè)務(wù)流程完成液南。正如一般流程開發(fā)一樣,雜亂的業(yè)務(wù)流程會(huì)導(dǎo)致后期維護(hù)困難叭喜,如何規(guī)范業(yè)務(wù)流程的模塊化贺拣,可以從以下幾個(gè)點(diǎn)考慮:

1、數(shù)據(jù)通用角度捂蕴。數(shù)倉(cāng)的表分為維度表和事實(shí)表譬涡,維度作為度量的環(huán)境,在數(shù)倉(cāng)中是一份基礎(chǔ)的通用數(shù)據(jù)啥辨,一旦前期的維度表字段規(guī)劃好后基本不會(huì)發(fā)生變化涡匀。

2、流程功能角度溉知。業(yè)務(wù)流程從功能上可以分為數(shù)據(jù)集成陨瘩、數(shù)據(jù)計(jì)算等。數(shù)據(jù)集成可以從接入方式级乍、接入方法舌劳、接入周期、合并方式甚淡、合并方法、合并周期等角度去詮釋撵割,數(shù)據(jù)計(jì)算可以從數(shù)據(jù)域沸手、業(yè)務(wù)過程等角度去詮釋。

3捐晶、任務(wù)發(fā)布角度山上。Dataworks里的業(yè)務(wù)流程里需要配置"流程參數(shù)",該流程參數(shù)是作用于業(yè)務(wù)流程全局的妄帘,一旦發(fā)生修改肿仑,業(yè)務(wù)流程下的所有"數(shù)據(jù)任務(wù)"都需要全部提交馏锡,造成很多業(yè)務(wù)節(jié)點(diǎn)被動(dòng)上線,加大任務(wù)審核人員的工作量蕉饼。

基于以上考慮及實(shí)際工作實(shí)踐创肥,將業(yè)務(wù)流程劃分為3大模塊叹侄,并納入到實(shí)際解決方案中:

1丰辣、公共維度

2飘哨、數(shù)據(jù)計(jì)算(按數(shù)據(jù)域劃分)

3浊服、數(shù)據(jù)集成

實(shí)際Dataworks界面大致如下:

? ? 1述呐、公共維度:包含所有維度表的計(jì)算流程。解決方案中也命名為"公共維度"进肯。

? ? 2、數(shù)據(jù)計(jì)算:{數(shù)據(jù)域}_{業(yè)務(wù)需求}。相同{數(shù)據(jù)域}的數(shù)據(jù)計(jì)算流程歸入同一解決方案中,解決方案命名為{數(shù)據(jù)域}。

? ? 3钙畔、數(shù)據(jù)集成:分為數(shù)據(jù)同步挥下、數(shù)據(jù)合并愉烙。一般使用binlog日志+首次直連全量同步方式完成數(shù)據(jù)同步禀苦,再通過增量數(shù)據(jù)+全量數(shù)據(jù)合并的方式完成數(shù)據(jù)合并。解決方案中也命名為"數(shù)據(jù)集成"。

數(shù)據(jù)同步:源端數(shù)據(jù)庫數(shù)據(jù)通過binlog或直連的方式耻矮,數(shù)據(jù)同步到數(shù)倉(cāng)裆装,

命名:{數(shù)據(jù)同步}_{同步方式}_{接入方式}_{同步頻度}_[同步工具]。

同步方式:增量、全量。

接入方式:RI(實(shí)時(shí)接入)、DI(離線接入)。

同步頻度:小時(shí)蔬浙、天俱病。

同步工具:DW(Dataworks)垢夹、DTS等噪漾。

數(shù)據(jù)同步_全量_DI_DW:一般只有首次通過離線方式完成數(shù)據(jù)的全量同步到數(shù)倉(cāng)豹障,同步完畢后會(huì)將任務(wù)調(diào)度改為暫停缓熟。后續(xù)發(fā)生數(shù)據(jù)不一致時(shí)作為備用方案使用梯投。

數(shù)據(jù)同步_增量_DI_小時(shí)_DW:通過離線接入增量日志终娃,將離線日志接入到"小時(shí)分區(qū)"中。

數(shù)據(jù)同步_增量_RI_小時(shí)_DW:通過實(shí)時(shí)接入binlog日志,將binlog日志接入到"小時(shí)"分區(qū)中痢甘。

數(shù)據(jù)同步_增量_DI_天_DW作烟、數(shù)據(jù)同步_增量_RI_天_DW:理論上也可以有這2類業(yè)務(wù)流程压恒,但從擴(kuò)展性來說小時(shí)的增量同步后期擴(kuò)展性更強(qiáng),建議不存在這類業(yè)務(wù)流程。

數(shù)據(jù)合并:將MaxCompute中的增量表、全量表按小時(shí)狈癞、天合并到全量表最新的分區(qū)里真竖。

命名: {數(shù)據(jù)合并}_{同步方式}_{同步頻度}

數(shù)據(jù)合并_增量_天:適合全量按天分區(qū)表脂信。

數(shù)據(jù)合并_增量_小時(shí):適合全量按小時(shí)分區(qū)表。



喜歡的朋友請(qǐng)幫忙點(diǎn)贊,謝謝大家谁撼!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市海洼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖球化,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件考余,死亡現(xiàn)場(chǎng)離奇詭異衅胀,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)茄唐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人纬傲,你說我怎么就攤上這事净嘀。” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵瑞凑,是天一觀的道長(zhǎng)贺待。 經(jīng)常有香客問我,道長(zhǎng)偎捎,這世上最難降的妖魔是什么祭钉? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上扒接,老公的妹妹穿的比我還像新娘碱呼。我一直安慰自己姑裂,他們只是感情好察皇,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布咐吼。 她就那樣靜靜地躺著晚碾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪喂急。 梳的紋絲不亂的頭發(fā)上格嘁,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音廊移,去河邊找鬼糕簿。 笑死,一個(gè)胖子當(dāng)著我的面吹牛狡孔,可吹牛的內(nèi)容都是我干的懂诗。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼苗膝,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼殃恒!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起辱揭,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤离唐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后问窃,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體侯繁,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年泡躯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片丽焊。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡较剃,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出技健,到底是詐尸還是另有隱情写穴,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布雌贱,位于F島的核電站啊送,受9級(jí)特大地震影響偿短,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜馋没,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一昔逗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧篷朵,春花似錦勾怒、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至腮猖,卻和暖如春鉴扫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背澈缺。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工坪创, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人谍椅。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓误堡,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親雏吭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子锁施,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容