前言
? ? ? ?數(shù)據(jù)管理領(lǐng)域是信息技術(shù)發(fā)展中的一個新興領(lǐng)域捺氢,隨著互聯(lián)網(wǎng)惜姐、全球化和信息化的快速發(fā)展,數(shù)據(jù)管理的重要性日益顯現(xiàn)胡岔。數(shù)據(jù)管理是把業(yè)務(wù)和信息技術(shù)融合起來所必需的一整套技術(shù)法希、方法及相應的管理和治理過程。它的特殊定位決定了它涉及的知識體系面廣且深靶瘸,而要把其中各知識領(lǐng)域和它們之間的相互關(guān)系梳理和解釋清楚并不是一件容易的事情苫亦。DAMA國際通過對業(yè)界數(shù)據(jù)管理最佳實踐的分析總結(jié),出版了《DAMA-DMBOK2數(shù)據(jù)管理知識體系指南(第2版)》怨咪,本書給出數(shù)據(jù)管理的職能屋剑、術(shù)語和最佳實踐方法的標準行業(yè)解釋,提供數(shù)據(jù)管理總體框架诗眨,為數(shù)據(jù)管理發(fā)展提供了重要的理論基礎(chǔ)唉匾。
一
本書背景及概要介紹
國際數(shù)據(jù)管理協(xié)會(Data Management Association ,又名DAMA International,以下簡稱“DAMA”)是一個全球性數(shù)據(jù)管理和業(yè)務(wù)專業(yè)志愿人士組成的非營利協(xié)會,致力于數(shù)據(jù)管理的研究和實踐匠楚。DAMA國際自1980年成立以來巍膘,一直致力于數(shù)據(jù)管理的理論研究厂财、實踐、教訓及相關(guān)知識體系的建設(shè)峡懈,在數(shù)據(jù)管理領(lǐng)域累積了極為深厚的知識沉淀和豐富經(jīng)驗璃饱。
幾十年來,DAMA組織眾多數(shù)據(jù)管理領(lǐng)域的國際級資深專家編著逮诲,深入闡述數(shù)據(jù)管理各領(lǐng)域的完整知識體系帜平。作為最終體現(xiàn),DAMA的數(shù)據(jù)管理知識體系[DAMA-DMBOK2:Data Management Body of Knowledge.2 nd Edition],中文版為《DAMA數(shù)據(jù)管理知識體系指南(第2版)》梅鹦,第二版英文版在2017年出版裆甩。
《DAMA數(shù)據(jù)管理知識體系指南(第2版)》一書中文版由機械工業(yè)出版社在國內(nèi)出版,即將于5月底上市齐唆。全書由國際數(shù)據(jù)管理協(xié)會中國分會多名會員志愿共同翻譯完成嗤栓,這是一項里程碑式的工作。
本書是國際數(shù)據(jù)管理協(xié)會(DAMA International)對過去30多年數(shù)據(jù)管理領(lǐng)域知識和實踐的一個總結(jié)箍邮,由會員們花了多年時間和業(yè)界專家反復討論撰寫而成茉帅。
它是市場上唯一綜合了數(shù)據(jù)管理方方面面的一部權(quán)威性著作。目前市場上有關(guān)數(shù)據(jù)某一專門領(lǐng)域的著作并不鮮見锭弊,但把數(shù)據(jù)管理各領(lǐng)域作為一個完整的知識體系來討論的據(jù)我所知卻僅此一本堪澎,而這正是本書的一個主要獨特之處。
DAMA-DMBOK2理論框架由車輪圖(由11個數(shù)據(jù)管理職能領(lǐng)域)和環(huán)境因素六邊形圖(由7個基本環(huán)境要素)”共同構(gòu)成“DAMA數(shù)據(jù)管理知識體系”(縱軸為數(shù)據(jù)管理的11個職能領(lǐng)域味滞,橫軸為7個環(huán)境要素)樱蛤,每項數(shù)據(jù)職能領(lǐng)域都在7個基本環(huán)境要素約束下開展工作。
《DAMA-DMBOK2 職能框架》定義了 11 個主要的數(shù)據(jù)管理職能剑鞍,并通過 7 個環(huán)境元素對每個職能進行描述昨凡。如下的矩陣以圖示方式給出此框架。
數(shù)據(jù)管理職能包括數(shù)據(jù)治理蚁署、數(shù)據(jù)架構(gòu)便脊、數(shù)據(jù)建模和設(shè)計、數(shù)據(jù)存儲和操作光戈、數(shù)據(jù)安全哪痰、數(shù)據(jù)集成和互操作、文檔和內(nèi)容管理久妆、參考數(shù)據(jù)和主數(shù)據(jù)管理妒御、數(shù)據(jù)倉庫與商務(wù)智能、元數(shù)據(jù)管理镇饺、數(shù)據(jù)質(zhì)量管理。
基本環(huán)境要素:目標與原則送讲、組織與文化奸笤、工具惋啃、活動、角色和職責监右、交付成果边灭、技術(shù)。
《DAMA-DMBOK2 指南》的每 一章介紹一個數(shù)據(jù)管理職能健盒,討論此職能的 7 個環(huán)境元素绒瘦。根據(jù)所討論的具體問題, 每章的討論深入程度有所不同扣癣。每一章都遵循如下的統(tǒng)一結(jié)構(gòu)惰帽,包括:
(1)對該職能的簡要介紹,包括關(guān)鍵術(shù)語的定義父虑、關(guān)聯(lián)圖和業(yè)務(wù)目標列表该酗。
(2)概念和活動的描述:包括相關(guān)的交付成果,負責的角色和組織士嚎,最佳實踐呜魄,常用程序和方法,配套技術(shù)等莱衩。有一些章節(jié)中會為每一個子職能單獨定義概念和活動爵嗅。
(3)一段綜述:包括一個重申指導原則的列表,一個重述該職能相關(guān)活動笨蚁、交付成果和責任角色的表格睹晒,以及關(guān)于組織和文化問題的簡要討論。
(4)推薦讀物列表:給出了可選讀的書籍和文章赚窃,以供參考册招。
二
本書用途及讀者群體
2.1? ?本指南的用途和目標
《DAMA-DMBOk2數(shù)據(jù)管理知識體系指南》(即《DAMA—DMBOK2指南》)一書,進一步推動數(shù)據(jù)管理行業(yè)的發(fā)展勒极。本指南的目的是為數(shù)據(jù)管理科學提供明確的概述是掰,并不試圖成為數(shù)據(jù)管理的百科全書,或是就所有數(shù)據(jù)管理相關(guān)事情的全面論述辱匿。相反键痛,本指南簡要介紹了數(shù)據(jù)管理相關(guān)概念,并確定了數(shù)據(jù)的管理目標匾七、職能和活動的主要交付成果絮短、角色、原則昨忆、技術(shù)和組織文化方面的問題丁频。它簡要介紹了被人們普遍接受的良好規(guī)范以及重要的可選方法。
《DAMA數(shù)據(jù)管理知識體系指南(第2版)》的主要10大用途和目標是:
對數(shù)據(jù)管理職能,達成一個普遍適用的看法共識席里,讓不同的讀者了解有關(guān)數(shù)據(jù)管理的本質(zhì)和重要性叔磷。
提供常用的數(shù)據(jù)管理職能、交付成果奖磁、角色和相關(guān)術(shù)語標準的定義改基,幫助數(shù)據(jù)管理專員和數(shù)據(jù)管理專業(yè)人士了解自己的角色和職責。
幫助機構(gòu)制定企業(yè)數(shù)據(jù)戰(zhàn)略咖为。確定數(shù)據(jù)管理的指導原則秕狰,幫助建立數(shù)據(jù)管理領(lǐng)域的共識。
指導實施和改進數(shù)據(jù)管理職能的工作躁染、廣泛采用的方法和技術(shù)以及重要的可選辦法鸣哀,指南中不涉及具體的技術(shù)供應商或產(chǎn)品。
簡明扼要地識別共同的組織和文化問題褐啡。
澄清數(shù)據(jù)管理的范圍和界限诺舔。
引導讀者接觸更多的資源來加強對數(shù)據(jù)管理的理解。
提供數(shù)據(jù)管理有效性和成熟度評估的基礎(chǔ)备畦。
指導高等教育系統(tǒng)開發(fā)和提供數(shù)據(jù)管理課程內(nèi)容低飒。
幫助數(shù)據(jù)管理專業(yè)人士準備 CDMP 考試。
2.2? ?本書的適合的讀者群體
筆者認為懂盐,以下12大讀者群體適合閱讀該書:
????企事業(yè)單位信息化主管領(lǐng)導(CIO)褥赊。
????企事業(yè)單位數(shù)據(jù)管理主管領(lǐng)導(CDO)。
????企事業(yè)單位IT人員莉恼。
????企事業(yè)單位數(shù)據(jù)管理團隊及專拌喉、兼職數(shù)據(jù)管理人員、數(shù)據(jù)相關(guān)項目的解決方案提供者俐银。
????企事業(yè)單位各業(yè)務(wù)職能部門數(shù)據(jù)管理專員尿背。
????會計事務(wù)師所的從業(yè)人員
????咨詢公司的風險、合規(guī)捶惜、管理田藐、數(shù)據(jù)治理從業(yè)人員。
????律師事務(wù)所在合規(guī)吱七、權(quán)益等方面的律師及從業(yè)人員汽久。
????經(jīng)過認證的和有抱負的數(shù)據(jù)管理專業(yè)人士
????負責開發(fā)和提供數(shù)據(jù)管理課程的教育工作者。
????MBA和信息管理專業(yè)本科及以上學生踊餐。
????政府領(lǐng)域數(shù)據(jù)管理領(lǐng)域的研究人員景醇。
同時,《DAMA數(shù)據(jù)管理知識體系指南(第2版)》切入點比較全面和系統(tǒng)吝岭,適合于高校MBA或者計算機專業(yè)本科或者以上的教科書三痰。
三
MBOK1與DMBOK2主要變化和新增加內(nèi)容
DMBOK2相對DMBOK1有8方面的變化吧寺,詳細闡述如下:
3.1??章節(jié)的變化
DMBOK1去掉了“數(shù)據(jù)開發(fā)”章節(jié),增加了“數(shù)據(jù)建模和設(shè)計”和“數(shù)據(jù)集成和互操作”酒觅,同時增加“數(shù)據(jù)處理倫理規(guī)范”撮执、“大數(shù)據(jù)和數(shù)據(jù)科學”、“數(shù)據(jù)管理成熟度評估”舷丹、“數(shù)據(jù)管理組織和角色期望”、“數(shù)據(jù)管理和組織變革管理”章節(jié)
3.2? 數(shù)據(jù)治理嵌入各知識領(lǐng)域
(1)數(shù)據(jù)治理不僅獨立作為一章進行介紹蜓肆,更是在每個知識領(lǐng)域章節(jié)中颜凯,專門增加一節(jié)介紹該領(lǐng)域內(nèi)涉及到治理的內(nèi)容。
(2)強調(diào)數(shù)據(jù)治理融入系統(tǒng)設(shè)計和開發(fā)過程中仗扬,讓數(shù)據(jù)治理成為保證系統(tǒng)質(zhì)量和數(shù)據(jù)質(zhì)量的有力保障,其貫徹系統(tǒng)建設(shè)全過程症概,數(shù)據(jù)治理落地性更強。
3.3? 知識體系發(fā)生變化
數(shù)據(jù)架構(gòu)早芭,數(shù)據(jù)建模和設(shè)計兩部分內(nèi)容重要性加強了彼城,數(shù)據(jù)標準包括在數(shù)據(jù)模型設(shè)計中。強調(diào)數(shù)據(jù)設(shè)? 計及在設(shè)計過程中落標退个。
3.4? 數(shù)據(jù)治理理念發(fā)生變化
(1)從事后治理向事先管控轉(zhuǎn)變募壕,從被動治理向主動治理轉(zhuǎn)變,從理論向?qū)崙?zhàn)落地轉(zhuǎn)變语盈,從單純的治理向治理+服務(wù)擴展舱馅,從傳統(tǒng)數(shù)據(jù)向大數(shù)據(jù)轉(zhuǎn)變。
(2)強調(diào)風險管理和企業(yè)文化因素刀荒,每個知識領(lǐng)域增加“實施指南”一節(jié),包括風險評估各個領(lǐng)域?qū)嵺`過程中可能遇到的風險和應對建議代嗤。
3.5? 落地性更強
(1)數(shù)據(jù)治理嵌入到業(yè)務(wù)開展、系統(tǒng)建設(shè)缠借、數(shù)據(jù)應用流程中干毅,治理概念脫虛向?qū)崱?/b>
(2)在介紹11個知識體系過程中,每個部分都分別詳細介紹了落地方法及工具情況泼返,便于落地硝逢。
(3)每個知識領(lǐng)域增加“實施指南”一節(jié),針對現(xiàn)狀的評估、企業(yè)文化變革方面提供了建議和思考符隙。
3.6? 六邊形內(nèi)容變化
“實戰(zhàn)和方法”趴捅,“主要交付物”兩部分內(nèi)容? 合并為交付管理,增設(shè)工具內(nèi)容霹疫;
圖上增加顯示了人拱绑、過程和技術(shù)分類;
“實踐和方法”替換為“工具”丽蝎;
六邊形內(nèi)容變化“實戰(zhàn)和方法”猎拨,“主要交付物”兩部分內(nèi)容? 合并為交付管理膀藐,增設(shè)工具內(nèi)容。DMBOK1以理論知識體系為主红省,在“實戰(zhàn)和方法” “主要交付物”兩部分额各,強調(diào)的是方法論,而DMBOK2強調(diào)交付和工具的重要性吧恃;
3.7??數(shù)據(jù)管理框架的進化
該框架從數(shù)據(jù)管理的指導目標開始獲取價值虾啦,因此與數(shù)據(jù)全生命周期相關(guān),派生價值需要生命周期管理痕寓。從數(shù)據(jù)生命周期出發(fā)傲醉,數(shù)據(jù)治理貫穿于整個數(shù)據(jù)開發(fā)過程。
3.8??技術(shù)和流程性更強
數(shù)據(jù)治理必須嵌入到業(yè)務(wù)開展呻率、系統(tǒng)建設(shè)硬毕、數(shù)據(jù)應? 用流程中,并通過工具來支撐使用礼仗,工具的介紹篇章及份額明顯增加吐咳。
四
核心內(nèi)容介紹
對數(shù)據(jù)管理專業(yè)人士也可用作業(yè)務(wù)參考。全書共17章元践。分別是:
??數(shù)據(jù)治理(Data Governance):通過建立一個能夠滿足企業(yè)需求的數(shù)據(jù)決策體系韭脊,為數(shù)據(jù)管理提供指導和監(jiān)督。這些權(quán)限和責任的建立應該考慮到組織的整體需求卢厂。(參見第3章)
?數(shù)據(jù)架構(gòu)(Data Architecture):定義了與組織戰(zhàn)略協(xié)調(diào)的管理數(shù)據(jù)資產(chǎn)的“藍圖”乾蓬,指導基于組織的戰(zhàn)略目標,指定符合戰(zhàn)略需求的數(shù)據(jù)架構(gòu)慎恒。(參見第4章)
數(shù)據(jù)建模和設(shè)計(Data Modeling and Design):以數(shù)據(jù)模型(data model.)的精確形式任内,進行發(fā)現(xiàn)、分析融柬、展示和溝通數(shù)據(jù)需求的過程死嗦。(參見第5章)
數(shù)據(jù)存儲和操作(Data Storage and Operations):以數(shù)據(jù)價值最大化為目標,包括存儲數(shù)據(jù)的設(shè)計粒氧、實現(xiàn)和支持活動越除,以及在整個數(shù)據(jù)生命周期中,從計劃到銷毀的各種操作活動外盯。(參見第6章)
?數(shù)據(jù)安全(Data Security):這一活動確保數(shù)據(jù)隱私和安全摘盆,數(shù)據(jù)的獲得和使用必須要有安全的保障。(參見第7章)
數(shù)據(jù)集成和互操作(Data Integration and Interoperability):包括與數(shù)據(jù)存儲饱苟、應用程序和組織之間的數(shù)據(jù)移動和整合相關(guān)的過程孩擂。(參見第8章)
文檔和內(nèi)容管理(Document and Content Management):用于管理非結(jié)構(gòu)化媒體的數(shù)據(jù)和信息的生命周期過程,包括計劃箱熬、實施和控制活動类垦,尤其是指支持法律法規(guī)遵從性要求所需的文檔狈邑。(參見第9章)
參考數(shù)據(jù)和主數(shù)據(jù)管理(Reference and Master Data Management):包括核心共享數(shù)據(jù)的持續(xù)協(xié)調(diào)和維護,使關(guān)鍵業(yè)務(wù)實體的真實信息蚤认,以準確米苹、及時和相關(guān)聯(lián)的方式在各系統(tǒng)間得到一致使用。(參見第10章)
數(shù)據(jù)倉庫和商務(wù)智能(Data Warehousing and Business Intelligence):包括計劃砰琢、實施和控制流程蘸嘶,來管理決策支持數(shù)據(jù),并使知識工作者通過分析報告從數(shù)據(jù)中獲得價值陪汽。(參見第11章)
元數(shù)據(jù)管理(Metadata Management):包括規(guī)劃亏较、實施和控制活動,以便能夠訪問高質(zhì)量的集成元數(shù)據(jù)掩缓,包括定義、模型遵岩、數(shù)據(jù)流和其他至關(guān)重要的信息(對理解數(shù)據(jù)及其創(chuàng)建你辣、維護和訪問系統(tǒng)有幫助)。(參見第12章)
數(shù)據(jù)質(zhì)量管理(Data Quality Management):包括規(guī)劃和實施質(zhì)量管理技術(shù)尘执,以測量舍哄、評估和提高數(shù)據(jù)在組織內(nèi)的適用性。(參見第13章)
除了有關(guān)知識領(lǐng)域的章節(jié)外DAMA-DMBOK誊锭,車輪圖以外的內(nèi)容表悬,包含以下主題章節(jié):
數(shù)據(jù)處理倫理(Data Handling Ethics):描述了關(guān)于數(shù)據(jù)及其應用過程中,數(shù)據(jù)倫理規(guī)范在促進信息透明丧靡、社會責任決策中的核心作用蟆沫。數(shù)據(jù)采集、分析和使用過程中的倫理意識對所有數(shù)據(jù)管理專業(yè)人士有指導作用温治。(參見第2章)
大數(shù)據(jù)和數(shù)據(jù)科學(Big Data and Data Science):描述了針對大型的饭庞、多樣化數(shù)據(jù)集收集和分析能力的提高而出現(xiàn)的技術(shù)和業(yè)務(wù)流程。(參見第14章)
數(shù)據(jù)管理成熟度評估(Data Management Maturity Assessment):概述了評估和改進組織數(shù)據(jù)管理能力的方法熬荆。(參見第15章)
數(shù)據(jù)管理組織和角色期望(Data Management Organization and Role Expectations):為組建數(shù)據(jù)管理團隊舟山、實現(xiàn)成功的數(shù)據(jù)管理活動提供了實踐提供和參考因素。(第16章)
數(shù)據(jù)管理和組織變革管理(Data Management and Organizational Change Management ):描述了如何計劃和成功地推動企業(yè)文化變革卤恳,文化的變革是將數(shù)據(jù)管理實踐有效地嵌入組織中必然結(jié)果累盗。(第17章)
第一章、數(shù)據(jù)管理主要內(nèi)容
(1)數(shù)據(jù)管理9大核心原則
數(shù)據(jù)是有獨立屬性的資產(chǎn):數(shù)據(jù)是一種資產(chǎn)突琳,但相比其他資產(chǎn)若债,其在管理方式的某些方面有很大差異。對比金融和實物資產(chǎn)本今,其中最明顯的一個特點是數(shù)據(jù)資產(chǎn)在使用過程中不會產(chǎn)生消耗拆座。
數(shù)據(jù)價值能夠并且應該通過經(jīng)濟術(shù)語來表達:將數(shù)據(jù)稱為資產(chǎn)意味著它有價值主巍。雖然有技術(shù)手段可以測量數(shù)據(jù)的數(shù)量和質(zhì)量,但還未形成這樣做的標準來衡量其價值挪凑。想要對其數(shù)據(jù)做出更好決策的組織應該開發(fā)一致的方法來量化該價值孕索。他們還應該衡量低質(zhì)量數(shù)據(jù)的成本和高質(zhì)量數(shù)據(jù)的好處。
管理數(shù)據(jù)意味著管理數(shù)據(jù)的質(zhì)量:確保數(shù)據(jù)符合應用的要求是數(shù)據(jù)管理的首要目標躏碳。為了管理質(zhì)量搞旭,組織必須確保他們了解利益相關(guān)者對質(zhì)量的要求,并根據(jù)這些要求度量數(shù)據(jù)菇绵。
管理數(shù)據(jù)需要元數(shù)據(jù):管理任何資產(chǎn)都需要首先擁有該項資產(chǎn)的數(shù)據(jù)(員工人數(shù)肄渗,賬戶號碼等)。用于管理和如何使用的數(shù)據(jù)都叫元數(shù)據(jù)咬最。因為數(shù)據(jù)無法拿在手中或觸摸到翎嫡,要理解它是什么以及如何使用它,需要以元數(shù)據(jù)的形式定義這些知識永乌。元數(shù)據(jù)源于與數(shù)據(jù)創(chuàng)建惑申、處理和使用相關(guān)的一系列流程,包括架構(gòu)翅雏、建模圈驼、管理、治理望几、數(shù)據(jù)質(zhì)量管理绩脆、系統(tǒng)開發(fā)、IT和業(yè)務(wù)運營以及分析橄抹。
管理數(shù)據(jù)需要計劃:即便是小型組織也可能有復雜的技術(shù)和業(yè)務(wù)流程藍圖靴迫。數(shù)據(jù)在多個地方被創(chuàng)建,且因為使用需要在很多存儲位置間移動害碾。需要一些協(xié)調(diào)工作來保持最終結(jié)果的一致矢劲,需要從架構(gòu)和流程的角度進行規(guī)劃。
管理數(shù)據(jù)是跨職能的工作:它需要一系列的技能和專業(yè)知識慌随,因此單個團隊無法管理組織的所有數(shù)據(jù)芬沉。數(shù)據(jù)管理需要技術(shù)能力、非技術(shù)技能以及協(xié)作能力阁猜。
數(shù)據(jù)管理需要企業(yè)級視角:雖然數(shù)據(jù)管理存在很多本地應用程序丸逸,但它必須能夠有效地被應用于整個企業(yè)。
數(shù)據(jù)是流動的剃袍,數(shù)據(jù)管理必須不斷發(fā)展演進黄刚,以跟上數(shù)據(jù)創(chuàng)建的方式、應用的方式和消費者的變化民效。
數(shù)據(jù)管理是全生命周期的管理:數(shù)據(jù)是有生命周期的憔维,因此數(shù)據(jù)管理需要管理它的生命周期涛救。因為數(shù)據(jù)又將產(chǎn)生更多的數(shù)據(jù),所以數(shù)據(jù)生命周期本身可能非常復雜业扒。數(shù)據(jù)管理實踐活動需要考慮數(shù)據(jù)的整個生命周期检吆。
(2)知識領(lǐng)域語境關(guān)系圖
描述了知識領(lǐng)域的細節(jié),包括與人員程储、流程和技術(shù)相關(guān)的細節(jié)蹭沛。它們基于產(chǎn)品管理(供應者、輸入章鲤、活動摊灭、交付成果和消費者)的SIPOC圖的概念。
語境關(guān)系圖將活動放在中心败徊,這些活動生產(chǎn)了滿足利益相關(guān)者需求的可交付成果帚呼。每個語境關(guān)系圖都以知識領(lǐng)域的定義和目標開始。
驅(qū)動目標(中心)的活動分為四個階段:計劃(P)皱蹦、開發(fā)(D)萝挤、操作(O)和控制(C)。
在左側(cè)流入活動中是輸入和供應商根欧。右側(cè)從活動中流出是交付成果和消費者。參與者列在活動下方端蛆。
底層是影響知識領(lǐng)域各個方面的工具凤粗、技術(shù)和度量標準。
(3)DAMA金字塔
第1階段:組織購買包含數(shù)據(jù)庫功能的應用程序今豆。這意味著組織以此作為數(shù)據(jù)建模嫌拣、設(shè)計、數(shù)據(jù)存儲和數(shù)據(jù)安全的起點呆躲。要使系統(tǒng)在其數(shù)據(jù)環(huán)境中運行异逐,還需要做數(shù)據(jù)集成和交互操作方面的工作。
第2階段:一旦他們開始使用應用程序插掂,他們將發(fā)現(xiàn)數(shù)據(jù)質(zhì)量方面的挑戰(zhàn)灰瞻。但獲得更高質(zhì)量的數(shù)據(jù)取決于可靠的元數(shù)據(jù)和一致的數(shù)據(jù)架構(gòu)。它們說明了來自不同系統(tǒng)的數(shù)據(jù)是如何協(xié)同工作的辅甥。
第3階段:管理數(shù)據(jù)質(zhì)量酝润、元數(shù)據(jù)和架構(gòu)需要嚴格地實踐數(shù)據(jù)治理,為數(shù)據(jù)管理活動提供體系性支持璃弄。數(shù)據(jù)治理還支持戰(zhàn)略計劃的實施要销,如文檔和內(nèi)容管理、參考數(shù)據(jù)管理延塑、主數(shù)據(jù)管理壕鹉、數(shù)據(jù)倉庫和商務(wù)智能,這些黃金金字塔中的高級應用都會得到充分地支持凫佛。
第4階段:該組織充分利用了良好管理數(shù)據(jù)的好處浑塞,并提高了其分析能力借跪。
2
第二章、數(shù)據(jù)處理倫理
(1)數(shù)據(jù)處理倫理語境關(guān)系圖
描述構(gòu)成數(shù)據(jù)管理倫理的基本原則缩举;闡述數(shù)據(jù)倫理處理方法如何幫助組織避免數(shù)據(jù)的非正常使用及由此帶來的對客戶垦梆、聲譽或更廣大群體的危害。
(2)數(shù)據(jù)倫理準則
? ??尊重他人:?這個準則反映了對待人類最基本的倫理要求仅孩,即尊重個人尊嚴和自主權(quán)托猩。
? ??行善原則:這條準則有兩個要素:第一,不傷害辽慕;第二京腥,將利益最大化、傷害最小化溅蛉。
? ??公正:這一準則認為待人公平和公正
(3)建立合乎倫理道德的數(shù)據(jù)處理文化
建立合乎倫理道德的數(shù)據(jù)處理文化需要理解現(xiàn)有實踐公浪,定義預期行為,將它們編入策略和道德規(guī)范船侧,并提供培訓和進行監(jiān)督欠气,以強制執(zhí)行預期行為,與管理數(shù)據(jù)和改變文化相關(guān)的其他舉措一樣镜撩,這一過程需要強有力的領(lǐng)導層的推動预柒。
合乎倫理道德的數(shù)據(jù)處理顯然包括遵守法律。它也會影響組織內(nèi)部和外部對數(shù)據(jù)的分析袁梗、 解釋和利用方式宜鸯,重視倫理道德行為的組織文化不僅 要有行為準則,還要確保有清晰的溝通和治理機制遮怜,以支持那些意識到不道德行為或風險的員工淋袖。
(4)主要觀點
組織需要以合乎倫理道德的方式處理數(shù)據(jù),否則就有風險锯梁,就有可能失去客戶即碗、員工、合作伙伴和其他利益相關(guān)方的信任陌凳;
數(shù)據(jù)倫理植根于社會的基本原則和倫理道德的基本述求拜姿;
與數(shù)據(jù)相關(guān)的監(jiān)管基于這些相同的原則和要求,但監(jiān)管不能涵蓋所有意外情況冯遂。因此蕊肥,組織必須考慮到自己行為的倫理道德規(guī)范;
組織應該為它們處理數(shù)據(jù)培養(yǎng)道德責任文化,這不僅是為了符合合規(guī)要求壁却,同時也是本來就應該做的正確的事批狱;
合乎倫理道德的數(shù)據(jù)處理最終將為組織提供競爭優(yōu)勢,因為它是信任的基礎(chǔ)展东。
3
第三章赔硫、數(shù)據(jù)建模和設(shè)計
(1)數(shù)據(jù)建模與設(shè)計語境關(guān)系圖
數(shù)據(jù)建模與設(shè)計:數(shù)據(jù)建模是發(fā)現(xiàn)、分析和確定數(shù)據(jù)需求的過程盐肃,然后用一種用稱為數(shù)據(jù)模型的精確形式表示和傳遞這些數(shù)據(jù)需求爪膊。這個過程是循環(huán)迭代的,可能包括概念砸王、邏輯和物理模型推盛。
4
第八章、數(shù)據(jù)集成和互操作
定義:管理和整合在應用系統(tǒng)和組織內(nèi)部谦铃,或者應用系統(tǒng)與組織之間傳輸?shù)臄?shù)據(jù)耘成。
5
第十四章、大數(shù)據(jù)和數(shù)據(jù)科學
大數(shù)據(jù)不僅是指數(shù)據(jù)量大驹闰,也包括數(shù)據(jù)的種類(結(jié)構(gòu)化的和非結(jié)構(gòu)化的瘪菌,文檔(documnents)、文件(files)嘹朗、音頻师妙、視頻、流數(shù)據(jù)等), 以及數(shù)據(jù)產(chǎn)生的速度屹培。那些從數(shù)據(jù)中探究并研發(fā)預測模型疆栏、機器學習模型、規(guī)范性模型和分析方法惫谤、并將研發(fā)結(jié)果部署供相關(guān)方進行分析的人,被稱為數(shù)據(jù)科學家珠洗。
大數(shù)據(jù)和數(shù)據(jù)科學:多種不同類型的數(shù)據(jù)集合(大數(shù)據(jù))和分析(數(shù)據(jù)科學溜歪,解析,可視化)许蓖,都是為了洞察和解決分析初始時未知的問題蝴猪。
隨著大數(shù)據(jù)被加載到數(shù)據(jù)倉庫和商務(wù)智能環(huán)境中,數(shù)據(jù)科學技術(shù)被用來為組織提供前瞻性的視圖(“擋風玻璃”)膊爪。使用不同種類的數(shù)據(jù)源自阱,實現(xiàn)預測能力、基于模型的實時分析能力米酬,能夠為組織未來的發(fā)展方向提供更深刻的洞察能力沛豌。
要想利用大數(shù)據(jù),就需要改變數(shù)據(jù)的管理方式。大多數(shù)數(shù)據(jù)倉庫都基于關(guān)系模型加派,而大數(shù)據(jù)一般不采用關(guān)系模型組織數(shù)據(jù)叫确。大多數(shù)數(shù)據(jù)倉庫依賴于ETL(提取、轉(zhuǎn)換和加載)的概念芍锦。大數(shù)據(jù)解決方案竹勉,如數(shù)據(jù)湖,則依賴于ELT的概念——先加載后轉(zhuǎn)換娄琉。更加重要的是次乓,數(shù)據(jù)的生產(chǎn)速度和容量帶來了挑戰(zhàn),需要在數(shù)據(jù)管理的各個關(guān)鍵領(lǐng)域中采用不同的方法孽水,如集成票腰、元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量評估。
6
第十五章匈棘、數(shù)據(jù)管理成熟度評估
成熟度模型通過描述各階段能力特點來定義成熟度的級別丧慈。當一個組織滿足某階段能力特征時,就可以評估其成熟度等級主卫,并制定一個提高能力的計劃逃默。它還可以幫助組織在等級評估的指導下進行改進,與競爭對手或合作伙伴進行比較簇搅。在每一個新等級完域,能力評估會變得更加一致、可預測和可靠瘩将。當能力呈現(xiàn)出與等級不符的特征時吟税,等級會得到提升。但能力水平有既定順序姿现,不能跳過任何等級肠仪。
CMM通常定義五至六個成熟度級別,每個級別有各自的特性备典,從初始級到優(yōu)化級异旧。數(shù)據(jù)管理成熟度評估框架被劃分為離散的數(shù)據(jù)管理主題,框架焦點和內(nèi)容取決于它們是用于通用行業(yè)還是特定行業(yè)提佣。
7
第十六章吮蛹、數(shù)據(jù)管理組織和角色期望
大多數(shù)組織正面臨著越來越多的數(shù)據(jù)。這些數(shù)據(jù)格式多樣化拌屏、數(shù)量龐大潮针,并來源于不同的渠道。由于數(shù)據(jù)的數(shù)量和種類的增加倚喂,加劇了數(shù)據(jù)管理的復雜性每篷。與此同時,數(shù)據(jù)消費者要求更快速、更方便地訪問數(shù)據(jù)雳攘,他們希望理解并使用數(shù)據(jù)带兜,以便及時地解決關(guān)鍵業(yè)務(wù)問題。數(shù)據(jù)管理和數(shù)據(jù)治理組織需要足夠靈活吨灭,才能在不斷發(fā)展的環(huán)境中有效地工作刚照。因此,需要澄清關(guān)于所有權(quán)喧兄、協(xié)作无畔、責任和決策的基本問題。
本章將描述在組建數(shù)據(jù)管理或數(shù)據(jù)治理組織時吠冤,應該考慮的一組原則浑彰。它同時涉及數(shù)據(jù)治理和數(shù)據(jù)管理,因為數(shù)據(jù)治理為數(shù)據(jù)管理組織執(zhí)行活動提供指導和業(yè)務(wù)背景拯辙。兩者都沒有完美的組織結(jié)構(gòu)郭变。雖然數(shù)據(jù)治理和數(shù)據(jù)管理組織應該遵循一些公共原則,但是很多細節(jié)依賴于組織所在行業(yè)的驅(qū)動因素和組織自身的企業(yè)文化涯保。
運營模式是改進數(shù)據(jù)管理和數(shù)據(jù)治理實踐的起點诉濒。引入運營模式之前,需要了解它如何影響當前組織以及它可能會如何發(fā)展夕春。由于運營模式將幫助政策和流程的定義未荒、批準和執(zhí)行,因此確定最適合組織的運營模式是至關(guān)重要的及志。
評估當前的組織結(jié)構(gòu)是集中的片排、分散的,還是混合的速侈、層級化的或相對扁平的率寡?描述相關(guān)部門或區(qū)域的獨立性。他們的運作幾乎是自給自足的倚搬?他們的要求和目標是否有很大的差異冶共?最重要的是,嘗試確定決策是如何做出的(例如潭枣,民主或強制性指令),以及如何實施這些決策幻捏?
8
第十七章盆犁、數(shù)據(jù)管理和組織變革管理
成功的數(shù)據(jù)管理實踐需要:
根據(jù)信息價值鏈調(diào)整數(shù)據(jù)責任制度,以此來學習橫向管理篡九。
將垂直的(筒倉)數(shù)據(jù)責任制度轉(zhuǎn)變?yōu)楣蚕淼男畔⒐芾砉ぷ鳌?/p>
將局部業(yè)務(wù)關(guān)注點或IT部門工作中的信息質(zhì)量演變?yōu)檎麄€組織的核心價值谐岁。
將對信息質(zhì)量的思考從"數(shù)據(jù)清洗與數(shù)據(jù)質(zhì)量記分卡”提升轉(zhuǎn)變?yōu)榻M織的基本能力。
對不良數(shù)據(jù)管理引發(fā)的代價和規(guī)范化數(shù)據(jù)管理帶來的價值進行衡量。
組織變革管理專家約翰·科特(John P. Kotter)總結(jié)了一套基本的“變革法則”伊佃,這些法則描述了為什么變革并不容易窜司。在變革過程之初就認識到這些問題有助于取得成功。
組織不變革航揉,人就變: 不是因為新組織宣布成立或新系統(tǒng)實施上線就要變革塞祈。人們認識到變革帶來的價值而發(fā)生行為變化時,變革就會發(fā)生帅涂。改進數(shù)據(jù)管理實踐和實施正式數(shù)據(jù)治理流程將對組織產(chǎn)生深遠的影響议薪。人們需要改變數(shù)據(jù)處理的方式,以及在數(shù)據(jù)相關(guān)活動中的互動方式媳友。
人們不會抗拒變革斯议,但抵制被改變:人們無法接受看起來武斷或獨裁的變革。如果他們始終參與變革醇锚、定義變革哼御,并且他們理解推動變革愿景,以及知道變革發(fā)生的時間和方式焊唬,他們就更有可能愿意進行變革恋昼。數(shù)據(jù)相關(guān)舉措的變革管理部分涉及到團隊合作,以在組織層面建立起對數(shù)據(jù)管理實踐改進后價值的理解求晶。
事情之所以存在是慣性所致:事情的現(xiàn)狀可能是因為好的歷史原因焰雕。在過去某個節(jié)點,有人定義了業(yè)務(wù)需求芳杏、定義了流程矩屁、設(shè)計了系統(tǒng)、編寫了策略爵赵、或者確立了當前恰好需要變革的商業(yè)模式吝秕。了解當前數(shù)據(jù)管理實踐的起源,將有助于組織規(guī)避歷史錯誤空幻。
除非有人推動變革烁峭,否則很可能止步不前:如果想有所改進,就必須采取新措施秕铛。
如果不考慮人的因素约郁,變革將很容易:?變革在"技術(shù)"層面上的實現(xiàn)通常是很容易的。挑戰(zhàn)來自于如何處理人與人之間的自然差異但两。
結(jié)束語
大數(shù)據(jù)時代的到來鬓梅,讓“數(shù)據(jù)即資產(chǎn)”成為最核心的產(chǎn)業(yè)趨勢。在這個“數(shù)據(jù)為王”的時代谨湘,企業(yè)發(fā)展興衰的決定性因素绽快,已不是一城一池的爭奪芥丧,也不是土地、人力坊罢、技術(shù)续担、資本這些傳統(tǒng)意義上的生產(chǎn)要素,而是曾經(jīng)被一度忽視的"數(shù)據(jù)資產(chǎn)"活孩。
數(shù)據(jù)成為資產(chǎn)的關(guān)鍵在于數(shù)據(jù)挖掘分析物遇,需要以資產(chǎn)化的方式進行數(shù)據(jù)治理,實現(xiàn)“應用和管理”穩(wěn)步前進诱鞠。只有通過數(shù)據(jù)的整合挎挖,達到企業(yè)數(shù)據(jù)的上下貫通,橫向融合航夺,才能更好的做好數(shù)據(jù)資產(chǎn)的運營蕉朵。
數(shù)據(jù)治理已成為企事業(yè)單位精細化管理不可或缺的基礎(chǔ),只有切實落實好數(shù)據(jù)治理工作阳掐,才能提升企業(yè)數(shù)據(jù)質(zhì)量始衅、實現(xiàn)數(shù)據(jù)價值升華,真正成為企業(yè)應對市場挑戰(zhàn)的助推力缭保。
源鏈接:深度解讀數(shù)據(jù)管理葵花寶典-《DAMA-DMBOK2數(shù)據(jù)管理知識體系指南(第2版)》