導(dǎo)讀:國(guó)際數(shù)據(jù)管理協(xié)會(huì)DAMA在DMBOK2中定義了11個(gè)數(shù)據(jù)管理職能領(lǐng)域伏穆,數(shù)據(jù)建模與設(shè)計(jì)就是其中的一個(gè)關(guān)鍵領(lǐng)域局扶。數(shù)據(jù)模型作為數(shù)據(jù)建模與設(shè)計(jì)的核心產(chǎn)出物恨统,勢(shì)必與其他各個(gè)領(lǐng)域都有著千絲萬(wàn)縷的聯(lián)系。我嘗試著將這些關(guān)系總結(jié)整理成這篇文章三妈,與大家一同分享畜埋。
如上圖,在DAMBOK2中畴蒲,數(shù)據(jù)管理包含了11個(gè)職能領(lǐng)域悠鞍,這11個(gè)領(lǐng)域分別是數(shù)據(jù)治理、數(shù)據(jù)架構(gòu)模燥、數(shù)據(jù)建模與設(shè)計(jì)咖祭、數(shù)據(jù)存儲(chǔ)與操作、數(shù)據(jù)安全蔫骂、數(shù)據(jù)集成與互操作么翰、文檔與內(nèi)容管理、參考數(shù)據(jù)與主數(shù)據(jù)管理纠吴、數(shù)據(jù)倉(cāng)庫(kù)與BI硬鞍、元數(shù)據(jù)慧瘤、數(shù)據(jù)質(zhì)量戴已。
?各個(gè)領(lǐng)域的定義和作用書(shū)中已經(jīng)介紹得很清楚,所以我在這里就不贅述了锅减,下圖是我從數(shù)據(jù)模型出發(fā)糖儡,總結(jié)出的數(shù)據(jù)模型與各領(lǐng)域產(chǎn)出物之間的關(guān)系圖:
各領(lǐng)域之間的這些輸入輸出關(guān)系讓數(shù)據(jù)管理各個(gè)領(lǐng)域之間形成了一張關(guān)系復(fù)雜的網(wǎng)。其中數(shù)據(jù)模型處于一個(gè)關(guān)鍵位置怔匣。我將數(shù)據(jù)模型與各領(lǐng)域的關(guān)系總結(jié)成了以下9點(diǎn):
1握联、數(shù)據(jù)模型是承載著數(shù)據(jù)需求的元數(shù)據(jù)集合
從一定程度上講桦沉,我個(gè)人認(rèn)為數(shù)據(jù)模型是真正立足于企業(yè)數(shù)據(jù)需求創(chuàng)建出來(lái)的元數(shù)據(jù)集合。其中包括實(shí)體名金闽、屬性名等豐富的技術(shù)元數(shù)據(jù)纯露,還包括業(yè)務(wù)規(guī)則等業(yè)務(wù)元數(shù)據(jù),主外鍵等關(guān)系是元數(shù)據(jù)血緣分析主要來(lái)源之一代芜。同時(shí)埠褪,數(shù)據(jù)模型也為元數(shù)據(jù)管理提供了元數(shù)據(jù)標(biāo)準(zhǔn)和元數(shù)據(jù)質(zhì)量評(píng)分的指標(biāo)參考。
2挤庇、數(shù)據(jù)模型是數(shù)據(jù)質(zhì)量校驗(yàn)的對(duì)象钞速,是形成數(shù)據(jù)質(zhì)量規(guī)則的基礎(chǔ)
數(shù)據(jù)模型為數(shù)據(jù)質(zhì)量管理提供關(guān)鍵元數(shù)據(jù)與業(yè)務(wù)規(guī)則輸入,以便針對(duì)性地根據(jù)企業(yè)現(xiàn)狀制定數(shù)據(jù)質(zhì)量檢核標(biāo)準(zhǔn)與數(shù)據(jù)質(zhì)量檢核規(guī)則嫡秕。同時(shí)數(shù)據(jù)模型本身也需要符合數(shù)據(jù)質(zhì)量管理標(biāo)準(zhǔn)渴语,需要通過(guò)數(shù)據(jù)質(zhì)量管理的檢核。
3昆咽、數(shù)據(jù)模型是數(shù)據(jù)集成與互操作的起點(diǎn)
為了在數(shù)據(jù)集成時(shí)創(chuàng)建一個(gè)單一驾凶、一致的數(shù)據(jù)版本,在數(shù)據(jù)集成時(shí)充分分析現(xiàn)有數(shù)據(jù)模型就顯得尤為重要掷酗。保證數(shù)據(jù)模型中關(guān)鍵元素的一致是數(shù)據(jù)集成時(shí)需要首要考慮的問(wèn)題狭郑。
4、數(shù)據(jù)模型是數(shù)據(jù)存儲(chǔ)和操作的結(jié)構(gòu)保障
數(shù)據(jù)模型精確標(biāo)準(zhǔn)的定義為數(shù)據(jù)提供了一個(gè)規(guī)范的結(jié)構(gòu)汇在,這種比較精確化的結(jié)構(gòu)和約束成為數(shù)據(jù)存儲(chǔ)和操作的一層基本結(jié)構(gòu)保障翰萨,減少了數(shù)據(jù)存儲(chǔ)和操作時(shí)發(fā)生數(shù)據(jù)異常的可能性。
5糕殉、數(shù)據(jù)模型是數(shù)據(jù)安全管控的對(duì)象
數(shù)據(jù)模型是數(shù)據(jù)安全管控的對(duì)象之一亩鬼,數(shù)據(jù)模型中往往需要根據(jù)具體的數(shù)據(jù)安全需求標(biāo)注出敏感字段/表,企業(yè)也需要參考著數(shù)據(jù)模型來(lái)制定具體的數(shù)據(jù)安全技術(shù)實(shí)現(xiàn)需求與業(yè)務(wù)規(guī)則阿蝶,判斷出那些字段可以被哪些人查看雳锋,哪些字段需要脫敏等。
6羡洁、數(shù)據(jù)模型通過(guò)文檔和內(nèi)容管理實(shí)現(xiàn)可復(fù)用
在初始數(shù)據(jù)建模階段玷过,有效的文檔和內(nèi)容管理可以為數(shù)據(jù)建模提供以往數(shù)據(jù)建模過(guò)程的詳細(xì)參考。在建模完成時(shí)筑煮,數(shù)據(jù)建模過(guò)程中的各種模型設(shè)計(jì)文檔辛蚊,可以通過(guò)文檔和內(nèi)容管理模塊實(shí)現(xiàn)合理存儲(chǔ),形成企業(yè)數(shù)據(jù)模型記憶庫(kù)真仲,供未來(lái)其他部分?jǐn)?shù)據(jù)建模參考袋马,或供數(shù)據(jù)模型維護(hù)階段參考,實(shí)現(xiàn)數(shù)據(jù)建模的可復(fù)用秸应。
7虑凛、數(shù)據(jù)模型是數(shù)據(jù)倉(cāng)庫(kù)和BI的核心
數(shù)據(jù)模型能為數(shù)據(jù)倉(cāng)庫(kù)建設(shè)提供全面的業(yè)務(wù)梳理和整體的數(shù)據(jù)視角碑宴,通過(guò)數(shù)據(jù)模型,業(yè)務(wù)人員桑谍、開(kāi)發(fā)人員能夠很容易在數(shù)據(jù)倉(cāng)庫(kù)需求延柠、范圍以及長(zhǎng)遠(yuǎn)建設(shè)規(guī)劃上達(dá)成共識(shí),真正形成業(yè)務(wù)到數(shù)據(jù)倉(cāng)庫(kù)的映射锣披。通過(guò)專門(mén)為BI數(shù)據(jù)分析而設(shè)計(jì)的維度模型捕仔,更好地分析立足于數(shù)據(jù)分析的數(shù)據(jù)需求∮蓿可以說(shuō)沒(méi)有數(shù)據(jù)模型榜跌,數(shù)據(jù)倉(cāng)庫(kù)與BI就無(wú)從談起。
8盅粪、數(shù)據(jù)模型為參考數(shù)據(jù)與主數(shù)據(jù)提供一致性指導(dǎo)
參考數(shù)據(jù)與主數(shù)據(jù)管理是通過(guò)管理共享數(shù)據(jù)钓葫,去滿足組織目標(biāo)、減少數(shù)據(jù)冗余風(fēng)險(xiǎn)票顾、保證更高的數(shù)據(jù)質(zhì)量础浮、減少數(shù)據(jù)集成成本的過(guò)程。(DAMA-DMBOK2奠骄,DAMA International)豆同。
在全面的MDM環(huán)境中,邏輯數(shù)據(jù)模型將在多個(gè)平臺(tái)中進(jìn)行物理實(shí)例化含鳞,邏輯數(shù)據(jù)模型為主數(shù)據(jù)管理提供了清晰影锈、一致的數(shù)據(jù)定義,它指導(dǎo)MDM解決方案的實(shí)施蝉绷,并提供了數(shù)據(jù)集成服務(wù)的基礎(chǔ)鸭廷。
9、數(shù)據(jù)模型為數(shù)據(jù)科學(xué)與AI提供數(shù)據(jù)保證
數(shù)據(jù)科學(xué)與AI離不開(kāi)數(shù)據(jù)熔吗,而數(shù)據(jù)模型恰恰就是為數(shù)據(jù)科學(xué)與AI后續(xù)算法與分析過(guò)程提供數(shù)據(jù)的基本保障辆床。數(shù)據(jù)模型的建立能夠讓各個(gè)數(shù)據(jù)管理領(lǐng)域有著力點(diǎn),從而能夠?yàn)閿?shù)據(jù)科學(xué)家們的業(yè)務(wù)分析工作提供更準(zhǔn)確的數(shù)據(jù)桅狠,讓AI算法得出更準(zhǔn)確的結(jié)果讼载。
總結(jié)
可以說(shuō),數(shù)據(jù)模型在數(shù)據(jù)管理中處于向上承接業(yè)務(wù)中跌,向下引導(dǎo)數(shù)據(jù)的關(guān)鍵地位咨堤。它是承載著數(shù)據(jù)需求的元數(shù)據(jù)、是數(shù)據(jù)質(zhì)量校驗(yàn)的對(duì)象晒他、是形成數(shù)據(jù)質(zhì)量規(guī)則的基礎(chǔ)吱型、是數(shù)據(jù)集成與互操作的起點(diǎn)逸贾、是數(shù)據(jù)存儲(chǔ)和操作的結(jié)構(gòu)保障陨仅、是數(shù)據(jù)安全管控的對(duì)象津滞、是數(shù)據(jù)倉(cāng)庫(kù)和BI的核心、是參考數(shù)據(jù)與主數(shù)據(jù)的一致性指導(dǎo)灼伤。做好數(shù)據(jù)模型的管理触徐,企業(yè)數(shù)據(jù)管理將會(huì)事半功倍。
參考
[1]DAMA International.DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition)[M].Technics Publications:BASKING RIDGE, NEW JERSEY,2017:123.