數(shù)據(jù)血緣

數(shù)據(jù)血緣的定義

數(shù)據(jù)血緣即數(shù)據(jù)的來龍去脈,主要包含數(shù)據(jù)的來源齿兔、數(shù)據(jù)的加工方式橱脸、映射關(guān)系以及數(shù)據(jù)出口础米。
數(shù)據(jù)血緣屬于元數(shù)據(jù)的一部分,清晰的數(shù)據(jù)血緣是數(shù)據(jù)平臺維持穩(wěn)定的基礎(chǔ)添诉,更有利于數(shù)據(jù)變更影響分析以及數(shù)據(jù)問題排查屁桑。

數(shù)據(jù)血緣的范圍

數(shù)據(jù)血緣單純的數(shù)據(jù)角度來看包含的維度有數(shù)據(jù)庫、表栏赴、字段蘑斧、系統(tǒng)、應(yīng)用程序须眷,即數(shù)據(jù)存儲在什么數(shù)據(jù)庫的什么表竖瘾,對應(yīng)的字段是什么以及字段的屬性,數(shù)據(jù)所屬的系統(tǒng)以及與數(shù)據(jù)有關(guān) 的應(yīng)用程序花颗。
數(shù)據(jù)血緣從業(yè)務(wù)角度來看包含的維度主要是數(shù)據(jù)所屬業(yè)務(wù)線捕传,涉及到業(yè)務(wù)便要梳理清楚數(shù)據(jù)的產(chǎn)生邏輯、數(shù)據(jù)的使用邏輯以及業(yè)務(wù)線之間的關(guān)聯(lián)關(guān)系扩劝。

數(shù)據(jù)血緣獲取

數(shù)據(jù)血緣的獲取主要有程序解析與人工采集兩種方式庸论。
1.程序解析
程序解析主要是面向存儲過程、sql今野、視圖以及已有的ETL過程葡公。
以一個(gè)數(shù)據(jù)加工的完整流程為例,每個(gè)數(shù)據(jù)加工的流程都通過一個(gè)唯一的標(biāo)識進(jìn)行標(biāo)記条霜,流程中的每一個(gè)環(huán)節(jié)都記錄其前后依賴關(guān)系催什,程序?qū)⒚恳粋€(gè)環(huán)節(jié)的邏輯解析以后 根據(jù)依賴關(guān)系和流程便可以生成全流程的數(shù)據(jù)血緣。

  1. 人工采集
    人工采集可以是程序解析的一種輔助宰睡,也可以單獨(dú)以這種方式發(fā)揮作用蒲凶。
    與程序解析不同的是,人工采集的結(jié)果可以更準(zhǔn)確與詳實(shí)拆内,即使是在程序解析可以實(shí)現(xiàn)極高的準(zhǔn)確率的情況下也需要以人工的方式進(jìn)行一次審核是比較合理的做法旋圆。

數(shù)據(jù)血緣的表現(xiàn)形式

數(shù)據(jù)血緣在表現(xiàn)關(guān)聯(lián)關(guān)系時(shí)其實(shí)與知識圖譜非常的類似。
下圖為使用neo4j生成用來表示血緣的圖:


血緣.png

(為了讓展示方式清晰麸恍,故隱去了圖中節(jié)點(diǎn)的一些屬性)
如上圖所示灵巧,兩個(gè)橘黃色分別表示ods和dwd層的兩張表,藍(lán)色的代表字段抹沪,dwd_vol有一個(gè)字段fund_account刻肄,其數(shù)據(jù)來源為將ods_vol表中的fund_account求和。
以上的表現(xiàn)方式在使用程序解析時(shí)可以非常方便的生成融欧,但是對于手工采集敏弃,則需要先通過其他形式進(jìn)行記錄,如下表格所示:


血緣梳理.png

(以上表格中的內(nèi)容僅供參考噪馏,命名方面可能不是太規(guī)整)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末麦到,一起剝皮案震驚了整個(gè)濱河市绿饵,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瓶颠,老刑警劉巖拟赊,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異步清,居然都是意外死亡要门,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門廓啊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來欢搜,“玉大人,你說我怎么就攤上這事谴轮〕次粒” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵第步,是天一觀的道長疮装。 經(jīng)常有香客問我,道長粘都,這世上最難降的妖魔是什么廓推? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮翩隧,結(jié)果婚禮上樊展,老公的妹妹穿的比我還像新娘。我一直安慰自己堆生,他們只是感情好专缠,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著淑仆,像睡著了一般涝婉。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蔗怠,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天墩弯,我揣著相機(jī)與錄音,去河邊找鬼寞射。 笑死最住,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的怠惶。 我是一名探鬼主播,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼轧粟,長吁一口氣:“原來是場噩夢啊……” “哼策治!你這毒婦竟也來了脓魏?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤通惫,失蹤者是張志新(化名)和其女友劉穎茂翔,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體履腋,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡珊燎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了遵湖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片悔政。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖延旧,靈堂內(nèi)的尸體忽然破棺而出谋国,到底是詐尸還是另有隱情,我是刑警寧澤迁沫,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布芦瘾,位于F島的核電站,受9級特大地震影響集畅,放射性物質(zhì)發(fā)生泄漏近弟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一挺智、第九天 我趴在偏房一處隱蔽的房頂上張望祷愉。 院中可真熱鬧,春花似錦逃贝、人聲如沸谣辞。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽泥从。三九已至,卻和暖如春沪摄,著一層夾襖步出監(jiān)牢的瞬間躯嫉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工杨拐, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留祈餐,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓哄陶,卻偏偏與公主長得像帆阳,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子屋吨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348

推薦閱讀更多精彩內(nèi)容