1 為什么需要數(shù)據(jù)治理兴溜?
-
通過(guò)數(shù)據(jù)治理實(shí)現(xiàn)企業(yè)數(shù)據(jù)的標(biāo)準(zhǔn)化、提高數(shù)據(jù)質(zhì)量哑梳、提升業(yè)務(wù)處理的效率劲阎,為數(shù)據(jù)分析提供準(zhǔn)確的數(shù)據(jù)支撐,賦能業(yè)務(wù)鸠真,助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型悯仙。
大數(shù)據(jù)的數(shù)據(jù)管理
2 數(shù)據(jù)治理的本質(zhì)
- 數(shù)據(jù)要產(chǎn)生價(jià)值,需要一個(gè)合理的“業(yè)務(wù)目標(biāo)”吠卷,數(shù)據(jù)治理的所有活動(dòng)應(yīng)該圍繞真實(shí)的業(yè)務(wù)目標(biāo)而開(kāi)展锡垄,建立數(shù)據(jù)標(biāo)準(zhǔn)、提升數(shù)據(jù)質(zhì)量只是手段祭隔,而不是目標(biāo)货岭。因此數(shù)據(jù)治理的第一步不是分析數(shù)據(jù)問(wèn)題,而是分析業(yè)務(wù)問(wèn)題疾渴,找到企業(yè)的核心業(yè)務(wù)訴求千贯,定義數(shù)據(jù)治理的目標(biāo)和范圍。
3 數(shù)據(jù)治理架構(gòu)
DAMA-DMBOK2.0 數(shù)據(jù)管理車輪圖
- 在DAMA 數(shù)據(jù)管理知識(shí)體系指南中搞坝,數(shù)據(jù)治理位于數(shù)據(jù)管理“車輪圖”的正中央搔谴,是數(shù)據(jù)架構(gòu)、數(shù)據(jù)建模桩撮、數(shù)據(jù)存儲(chǔ)敦第、數(shù)據(jù)安全峰弹、數(shù)據(jù)質(zhì)量、元數(shù)據(jù)管理芜果、主數(shù)據(jù)管理等10大數(shù)據(jù)管理領(lǐng)域的總綱鞠呈,為各項(xiàng)數(shù)據(jù)管理活動(dòng)提供總體指導(dǎo)策略。
4 數(shù)據(jù)治理的數(shù)據(jù)管理 - 元數(shù)據(jù)
- 元數(shù)據(jù)分類 支持對(duì)元數(shù)據(jù)進(jìn)行分類管理师幕,例如個(gè)人信息粟按,敏感信息等
- 元數(shù)據(jù)檢索 可按照元數(shù)據(jù)類型、元數(shù)據(jù)分類進(jìn)行檢索霹粥,支持全文檢索
- 血緣依賴 支持表到表和字段到字段之間的血緣依賴灭将,便于進(jìn)行問(wèn)題回溯和影響分析等
- Apache Atlas為組織提供開(kāi)放式元數(shù)據(jù)管理和治理功能,用以構(gòu)建其數(shù)據(jù)資產(chǎn)目錄后控,對(duì)這些資產(chǎn)進(jìn)行分類和管理庙曙,并為數(shù)據(jù)分析師和數(shù)據(jù)治理團(tuán)隊(duì),提供圍繞這些數(shù)據(jù)資產(chǎn)的協(xié)作功能浩淘。
4.1 Atlas架構(gòu)
Atlas架構(gòu)
4.2 元數(shù)據(jù)分析
血緣依賴
- 影響分析
元數(shù)據(jù)影響性分析指的是評(píng)估數(shù)據(jù)變更對(duì)數(shù)據(jù)應(yīng)用的影響捌朴。影響性分析能幫助用戶迅速了解分析當(dāng)前元數(shù)據(jù)對(duì)象的下游數(shù)據(jù)信息,快速識(shí)別元數(shù)據(jù)的價(jià)值张抄,掌握元數(shù)據(jù)變更可能造成的影響砂蔽,以便更有效的評(píng)估變化帶來(lái)的風(fēng)險(xiǎn)。 - 血緣分析:
血緣分析是建立在元數(shù)據(jù)整合的基礎(chǔ)上署惯,記錄數(shù)據(jù)治理過(guò)程中的血緣關(guān)系左驾,基于這些血緣關(guān)系信息,可以進(jìn)行以數(shù)據(jù)流向?yàn)橹骶€的血緣追溯功能极谊,可以一直追溯到數(shù)據(jù)的產(chǎn)生诡右。 - 血緣分析的輸出結(jié)果包括回溯過(guò)程中所找到的所有相關(guān)元數(shù)據(jù)對(duì)象,以及這些元數(shù)據(jù)對(duì)象之間的關(guān)系轻猖。這些元數(shù)據(jù)對(duì)象可能是指標(biāo)帆吻、接口文件、報(bào)表咙边、數(shù)據(jù)庫(kù)表猜煮、數(shù)據(jù)庫(kù)視圖、數(shù)據(jù)立方體實(shí)體败许、數(shù)據(jù)處理過(guò)程和數(shù)據(jù)源接口等友瘤。
- 數(shù)據(jù)資產(chǎn)地圖
大數(shù)據(jù)平臺(tái)內(nèi)的元數(shù)據(jù)種類繁多、形式各異檐束,元數(shù)據(jù)查詢、血緣分析束倍、影響性分析等功能被丧,是面向元數(shù)據(jù)細(xì)節(jié)信息的使用需求盟戏,更適用于具體的人員,各部門(mén)基于元數(shù)據(jù)開(kāi)展相關(guān)工作甥桂,對(duì)于領(lǐng)導(dǎo)柿究、管理人員等高層用戶,由于關(guān)注層次更高黄选,范圍更廣泛蝇摸,大量的細(xì)節(jié)信息不能有效的滿足該類用戶的需要。
4.3 元數(shù)據(jù)分類管理
元數(shù)據(jù)分類與檢索
- 元數(shù)據(jù)查詢
自助式元數(shù)據(jù)查詢?yōu)橛脩籼峁┲庇^簡(jiǎn)潔的界面办陷,用戶根據(jù)自定義搜索條件貌夕,查詢符合該用戶訪問(wèn)權(quán)限的所有元數(shù)據(jù)信息,以列表的形式展現(xiàn)出來(lái)民镜,支持模糊查詢 - 元數(shù)據(jù)統(tǒng)計(jì)
用于統(tǒng)計(jì)各類元數(shù)據(jù)的數(shù)量啡专,如各部門(mén)提供的各類數(shù)據(jù)的種類,各部門(mén)數(shù)據(jù)被使用的冷制圈、熱度等们童,方便用戶掌握大數(shù)據(jù)平臺(tái)中元數(shù)據(jù)的匯總信息。元數(shù)據(jù)統(tǒng)計(jì)的展現(xiàn)方式有報(bào)表鲸鹦,圖形等直觀的方式慧库。 - 元數(shù)據(jù)版本管理
元數(shù)據(jù)版本管理用于管理元數(shù)據(jù)的版本發(fā)布,以及基于版本的元數(shù)據(jù)查看馋嗜、比對(duì)等操作齐板,通過(guò)版本管理功能,用戶可以更清晰了解元數(shù)據(jù)的版本變更歷史嵌戈,掌握元數(shù)據(jù)生命周期覆积,提升了后續(xù)使用元數(shù)據(jù)的可靠性。 - 元數(shù)據(jù)變更管理
主要是在線對(duì)元數(shù)據(jù)進(jìn)行變更熟呛,如對(duì)屬性值進(jìn)行修改宽档,對(duì)變更歷史和變更明細(xì)進(jìn)行查詢,對(duì)變更前后進(jìn)行差異比對(duì)庵朝。