為了便于理解權(quán)威的數(shù)據(jù)管理體系镊叁,計(jì)劃對(duì)DMBOK2進(jìn)行拆解學(xué)習(xí),按照原有章節(jié)進(jìn)行梳理兄春;
本文僅僅為學(xué)習(xí)交流使用,全部摘錄于DMBOK2(原版第二版)锡溯,如有版權(quán)問(wèn)題將即時(shí)撤稿赶舆!
備注:下文的引用數(shù)據(jù)被我改為了字典數(shù)據(jù)哑姚,以便于理解,因?yàn)槲覀兊南到y(tǒng)里的引用數(shù)據(jù)統(tǒng)一叫字典芜茵;
組織內(nèi)部叙量,需要跨業(yè)務(wù)領(lǐng)域、跨流程和跨系統(tǒng)使用的數(shù)據(jù)九串,也就是需要一致化的共享數(shù)據(jù)绞佩,稱之為“主數(shù)據(jù)”;
在數(shù)據(jù)體系里字典和主數(shù)據(jù)都具備這類特征猪钮,所以MDM核心是管理字典和主數(shù)據(jù)品山;
對(duì)于字典來(lái)說(shuō),MDM系統(tǒng)管理期定義和值域烤低,以確保組織能夠訪問(wèn)一套準(zhǔn)確且最新的值肘交;
對(duì)于主數(shù)據(jù)來(lái)說(shuō),MDM系統(tǒng)管理主數(shù)據(jù)的值和標(biāo)識(shí)符扑馁,以確保當(dāng)前值的準(zhǔn)確性和可用性酸些;
字典管理:數(shù)據(jù)源標(biāo)識(shí)、標(biāo)準(zhǔn)管理檐蚜、映射管理魄懂、人工修正、可信數(shù)據(jù)下發(fā)闯第;
主數(shù)據(jù)管理:數(shù)據(jù)源標(biāo)識(shí)市栗、主數(shù)據(jù)管理、映射管理咳短、人工修正填帽、可信數(shù)據(jù)下發(fā);
主數(shù)據(jù)管理是一個(gè)全生命周期的管理過(guò)程咙好,關(guān)鍵活動(dòng)包括:
1. 建立主數(shù)據(jù)實(shí)體的上下文篡腌,包括相關(guān)屬性的定義及其使用條件,并加以治理勾效;
2. 識(shí)別出在單個(gè)數(shù)據(jù)源內(nèi)以及多個(gè)數(shù)據(jù)源中代表同一實(shí)體的多個(gè)實(shí)例嘹悼;構(gòu)建并維護(hù)標(biāo)識(shí)符和交叉引用,以支持信息整合层宫;
3. 協(xié)調(diào)和整合不同來(lái)源的數(shù)據(jù)杨伙,以提供提供主記錄或事實(shí)的最佳版本。合并記錄提供了跨系統(tǒng)的信息合并視圖萌腿,并視圖解決屬性命名和數(shù)據(jù)值不一致的問(wèn)題限匣;
4. 識(shí)別出那些未被正確匹配或合并的實(shí)例,確保他們得到修正毁菱,并關(guān)聯(lián)到正確的標(biāo)識(shí)符米死;
5. 通過(guò)直接存取锌历、使用數(shù)據(jù)服務(wù),或通過(guò)復(fù)制反饋到交易系統(tǒng)峦筒、數(shù)據(jù)倉(cāng)庫(kù)或其他分析型數(shù)據(jù)存儲(chǔ)系統(tǒng)辩涝,實(shí)現(xiàn)可信數(shù)據(jù)的跨程序訪問(wèn);
6. 在組織內(nèi)強(qiáng)制使用主數(shù)據(jù)勘天。該過(guò)程還需要數(shù)據(jù)治理和變更管理的支持怔揩,以確保共享的企業(yè)視角。
主數(shù)據(jù)管理的關(guān)鍵處理步驟:
1. 數(shù)據(jù)模型管理:定義一致性的邏輯數(shù)據(jù)和其屬性脯丝;
2. 數(shù)據(jù)采集:
(1)接收并應(yīng)對(duì)新的數(shù)據(jù)源的采集需求商膊;
(2)使用數(shù)據(jù)清理和數(shù)據(jù)分析工具進(jìn)行快速、即時(shí)宠进、匹配和高級(jí)的數(shù)據(jù)質(zhì)量評(píng)估晕拆;
(3)評(píng)估數(shù)據(jù)并將數(shù)據(jù)整合的復(fù)雜性傳遞給請(qǐng)求者,以幫助他們進(jìn)行成本效益分析材蹬;
(4)試點(diǎn)數(shù)據(jù)采集及其對(duì)匹配規(guī)則的影響实幕;
(5)為新數(shù)據(jù)源確定數(shù)據(jù)質(zhì)量指標(biāo);
(6)確定由誰(shuí)負(fù)責(zé)監(jiān)控和維護(hù)新數(shù)據(jù)源數(shù)據(jù)的質(zhì)量堤器;
(7)完成與整體數(shù)據(jù)管理環(huán)境的集成昆庇;
3. 數(shù)據(jù)驗(yàn)證、標(biāo)準(zhǔn)化和數(shù)據(jù)豐富:目的是實(shí)現(xiàn)輸入數(shù)據(jù)的一致性闸溃,減少關(guān)聯(lián)記錄的風(fēng)險(xiǎn)和錯(cuò)誤:
(1)驗(yàn)證整吆,識(shí)別那些被證明是錯(cuò)誤的或可能是不正確或默認(rèn)的數(shù)據(jù);
(2)標(biāo)準(zhǔn)化辉川,確保數(shù)據(jù)內(nèi)容符合取值范圍表蝙、標(biāo)準(zhǔn)的格式(如電話號(hào)碼)或字段(如地址);
(3)數(shù)據(jù)豐富乓旗,添加可以改進(jìn)實(shí)體解析服務(wù)的屬性府蛇;
例如如下 標(biāo)化了地址、電話:
4. 實(shí)體解析和標(biāo)識(shí)符管理:包括實(shí)例提取屿愚、實(shí)例準(zhǔn)備汇跨、實(shí)例解析、身份管理渺鹦、關(guān)系分析扰法;
(1)通過(guò)匹配識(shí)別不同記錄如何與單個(gè)實(shí)體相關(guān)聯(lián)蛹含,有可能造成假陽(yáng)性和假陰性毅厚;可以通過(guò)確定性匹配和概率性匹配進(jìn)行算法判斷;
(2)身份解析浦箱,通過(guò)多字段進(jìn)行數(shù)據(jù)匹配吸耿;
(3)匹配類型包括特定數(shù)據(jù)的重復(fù)去輔助人工判斷祠锣、鏈接、合并咽安,規(guī)則會(huì)隨著新數(shù)據(jù)的引入而變化伴网,可信度也是,所以需要定期重新評(píng)估匹配合并規(guī)則和匹配鏈接規(guī)則妆棒,最好提供數(shù)據(jù)值的統(tǒng)計(jì)相關(guān)性澡腾,以幫助建立置信級(jí)別;
(4)主數(shù)據(jù)ID管理:全局標(biāo)識(shí)符和交叉引用信息糕珊。
(5)主數(shù)據(jù)之間的關(guān)系管理动分,父子關(guān)系、從屬關(guān)系等红选;
盡管算法可以實(shí)現(xiàn)大部分主數(shù)據(jù)的自動(dòng)化澜公,但是仍需要一些管理工作來(lái)解決數(shù)據(jù)錯(cuò)誤匹配的情況,并不斷改進(jìn)匹配算法從而減少人工工作喇肋;
5. 數(shù)據(jù)共享和管理工作坟乾;
從全局來(lái)看,主數(shù)據(jù)管理步驟:
(1)識(shí)別驅(qū)動(dòng)因素和需求蝶防;
(2)評(píng)估和評(píng)價(jià)數(shù)據(jù)源甚侣;
(3)定義架構(gòu)方法;
(4)主數(shù)據(jù)建模间学;
(5)定義管理職責(zé)和維護(hù)過(guò)程渺绒;
(6)建立治理制度,推動(dòng)主數(shù)據(jù)使用菱鸥;
主數(shù)據(jù)治理核心過(guò)程關(guān)注點(diǎn):
(1)要整合的數(shù)據(jù)源宗兼;
(2)要落實(shí)的數(shù)據(jù)質(zhì)量規(guī)則;
(3)遵守使用規(guī)則的條件氮采;
(4)要監(jiān)控的行動(dòng)和監(jiān)控頻率殷绍;
(5)優(yōu)先級(jí)和數(shù)據(jù)工作響應(yīng)等級(jí);
(6)如何展示信息以滿足利益相關(guān)方的需求鹊漠;
(7)字典和主數(shù)據(jù)管理部署的標(biāo)準(zhǔn)授權(quán)和預(yù)期主到;
主數(shù)據(jù)管理度量指標(biāo):
?(1)數(shù)據(jù)質(zhì)量和遵從性,通過(guò)數(shù)據(jù)質(zhì)量?jī)x表盤描述數(shù)據(jù)質(zhì)量躯概,說(shuō)明主題域?qū)嶓w或相關(guān)屬性的置信度(百分比)登钥,以及他在整個(gè)組織中符合實(shí)際需求的使用價(jià)值;
(2)數(shù)據(jù)變更活動(dòng)娶靡,審核可信數(shù)據(jù)的血緣牧牢,展示數(shù)據(jù)值的變化率,幫助大家理解,并用于調(diào)整算法塔鳍;
(3)數(shù)據(jù)獲取和消費(fèi)伯铣,通過(guò)指標(biāo)展示數(shù)據(jù)的上游供應(yīng)系統(tǒng)、下游的消費(fèi)系統(tǒng)和流程轮纫;
(4)服務(wù)水平協(xié)議SLA腔寡;
(5)數(shù)據(jù)管理專員覆蓋率,識(shí)別對(duì)數(shù)據(jù)內(nèi)容負(fù)責(zé)的個(gè)人或團(tuán)隊(duì)掌唾,展示評(píng)估頻率放前;
(6)維護(hù)的總成本;
(7)數(shù)據(jù)共享量和使用情況糯彬,指標(biāo)展示數(shù)據(jù)共享環(huán)境中流入和流出數(shù)據(jù)的定義犀斋、納入和訂閱的數(shù)量和速率;