1单料、摘要
數(shù)據(jù)是一種重要的資源,已經(jīng)成為一種社會生產(chǎn)要素点楼,被提升為和勞動扫尖、土地和資本同等重要的地位。數(shù)據(jù)科學(xué)家和權(quán)威專家維克托.邁爾.舍恩伯格在其《大數(shù)據(jù)時(shí)代》中指出:雖然大數(shù)據(jù)還沒有被列入企業(yè)的資產(chǎn)負(fù)債表掠廓,但這只是一個(gè)時(shí)間問題换怖。由此可見,這個(gè)時(shí)間越來越近了蟀瞧。事實(shí)上狰域,最近幾年,許多人認(rèn)為數(shù)據(jù)是一種資產(chǎn)黄橘,但是究竟什么是數(shù)據(jù)資產(chǎn)兆览?如何管理數(shù)據(jù)資產(chǎn)?數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)管理有什么不同塞关?盡管出現(xiàn)了很多專家和專著抬探,但真正理解這個(gè)概念的人并不多,懂得如何實(shí)操數(shù)據(jù)資產(chǎn)管理的更寥寥無幾帆赢。筆者作為第一批數(shù)據(jù)資產(chǎn)管理的探索者小压,有幸參與了國內(nèi)幾個(gè)典型項(xiàng)目,想借本文從數(shù)據(jù)資產(chǎn)全生命周期這個(gè)角度和業(yè)界同仁們分享一點(diǎn)自己的思考和心得椰于。
數(shù)據(jù)資產(chǎn)全生命周期管理模型是設(shè)計(jì)良好的用于組織數(shù)據(jù)資產(chǎn)的框架怠益,有許多工作要根據(jù)數(shù)據(jù)資產(chǎn)全生命周期管理模型來提出新的數(shù)據(jù)管理要求。截止目前瘾婿,國內(nèi)外還沒有數(shù)據(jù)資產(chǎn)全生命周期管理的相關(guān)模型蜻牢,如同任何其它資產(chǎn)一樣烤咧,數(shù)據(jù)資產(chǎn)也具有生命周期,管理數(shù)據(jù)資產(chǎn)就是管理數(shù)據(jù)全生命周期抢呆。本文借鑒資產(chǎn)全生命周期管理理念和數(shù)據(jù)生命周期管理模型煮嫌,根據(jù)大數(shù)據(jù)的特點(diǎn),提出一種適用于數(shù)據(jù)資產(chǎn)管理的全生命周期模型抱虐,從而推動數(shù)據(jù)生產(chǎn)昌阿、使用、治理恳邀,實(shí)現(xiàn)效益最大化懦冰。
2、什么是資產(chǎn)全生命周期管理谣沸?
假設(shè)數(shù)據(jù)是一種資產(chǎn)刷钢,那么是不是可以借鑒傳統(tǒng)資產(chǎn)全生命周期管理的理論呢?首先鳄抒,讓我們一起來看看什么是資產(chǎn)全生命周期管理闯捎。
資產(chǎn)全生命周期管理是指資產(chǎn)從構(gòu)思、決策许溅、設(shè)計(jì)瓤鼻、建造、使用贤重,經(jīng)過有形磨損茬祷,直至在技術(shù)上或經(jīng)濟(jì)上不宜繼續(xù)使用,需要進(jìn)行更新所經(jīng)歷的時(shí)間并蝗,開展資產(chǎn)全生命周期管理的目的就是加強(qiáng)資產(chǎn)管理祭犯。降低資產(chǎn)維護(hù)檢修成本,延長資產(chǎn)使用時(shí)間滚停,提高資產(chǎn)利用率沃粗。
以典型的設(shè)備資產(chǎn)為例,其全生命周期一般包括以下六個(gè)環(huán)節(jié):
從設(shè)備設(shè)計(jì)键畴、采購開始最盅,直至設(shè)備運(yùn)行、維護(hù)起惕、報(bào)廢進(jìn)行全生命周期管理涡贱;將基建期圖紙、采購惹想、資料信息帶到設(shè)備臺賬中问词,實(shí)現(xiàn)對設(shè)計(jì)數(shù)據(jù)、采購數(shù)據(jù)嘀粱、施工數(shù)據(jù)激挪、安裝數(shù)據(jù)辰狡、調(diào)試數(shù)據(jù)等后期移交和設(shè)備系統(tǒng)生產(chǎn)運(yùn)維所需要的完整數(shù)據(jù)平滑過渡,實(shí)現(xiàn)基建灌灾、生產(chǎn)一體化搓译,提升企業(yè)資產(chǎn)利用率悲柱,增強(qiáng)企業(yè)投資回報(bào)率锋喜。同時(shí)結(jié)合成本管理、財(cái)務(wù)管理豌鸡,既實(shí)現(xiàn)對資產(chǎn)過程管控嘿般,更實(shí)現(xiàn)對資產(chǎn)價(jià)值的管理。
由此可見涯冠,資產(chǎn)全生命周期管理是從長期效益出發(fā)炉奴,以設(shè)備全生命周期整體最優(yōu)為管理目標(biāo),打破部門界限蛇更,將規(guī)劃瞻赶、基建、運(yùn)行等不同階段的成本統(tǒng)籌考慮派任,追求設(shè)備資產(chǎn)經(jīng)濟(jì)效益最大化砸逊,在最佳的可靠性水平和有效地利用資產(chǎn)之間尋求平衡。
3掌逛、數(shù)據(jù)全生命周期管理模型研究
數(shù)據(jù)全生命周期管理模型定義了一個(gè)宏觀的框架师逸,它是從生產(chǎn)階段到消費(fèi)階段的數(shù)據(jù)生命的全景視圖。數(shù)據(jù)全生命周期管理模型的目標(biāo)是優(yōu)化數(shù)據(jù)管理豆混,提高效率篓像,降低成本,以提供適合最終用戶使用的數(shù)據(jù)產(chǎn)品皿伺,滿足預(yù)期的質(zhì)量要求员辩,這和資產(chǎn)全生命周期管理的目標(biāo)是一致的。但是鸵鸥,因?yàn)閿?shù)據(jù)有很多自身的特點(diǎn)奠滑,又不完全相同。在數(shù)據(jù)管理領(lǐng)域脂男,學(xué)術(shù)界和企業(yè)界的許多研究人員提出了不同的數(shù)據(jù)全生命周期管理模型养叛。
3.1 CSA模型
云安全聯(lián)盟(CSA)是管理安全云計(jì)算環(huán)境的世界領(lǐng)先組織。CSA為云環(huán)境中的數(shù)據(jù)安全提出了一個(gè)數(shù)據(jù)生命周期模型宰翅。提供的數(shù)據(jù)模型有六個(gè)階段弃甥,分別是創(chuàng)建、存儲汁讼、使用淆攻、共享阔墩、存檔和銷毀,如圖2所示瓶珊。因此啸箫,這個(gè)模型解決了云計(jì)算環(huán)境中的一個(gè)特殊問題,安全性伞芹。
研究結(jié)論:此模型涵蓋的內(nèi)容并不全面忘苛,因?yàn)樗菫樵朴?jì)算模型中的數(shù)據(jù)安全而設(shè)計(jì)的。因此唱较,并未考慮數(shù)據(jù)質(zhì)量扎唾、數(shù)據(jù)處理和數(shù)據(jù)分析等概念。
3.2 DataONE模型
地球數(shù)據(jù)觀測網(wǎng)是由美國國家科學(xué)基金會(NSF)資助的一個(gè)名為“數(shù)據(jù)一號”的組織南缓。他們的數(shù)據(jù)模型旨在為生物和環(huán)境科學(xué)研究提供數(shù)據(jù)保存和再利用胸遇。擬議的數(shù)據(jù)生命周期包括收集、保證汉形、描述纸镊、存放、保存概疆、發(fā)現(xiàn)逗威、集成和分析,如圖3所示届案。因此庵楷,該模型可以用于存儲和檢索長期使用的信息。
研究結(jié)論:該模型是專門為數(shù)據(jù)保存和復(fù)用而開發(fā)的楣颠,不能看作是一個(gè)綜合模型尽纽。此外,對數(shù)據(jù)安全也沒有任何關(guān)注童漩。
3.3 DDI模型
數(shù)據(jù)文件倡議(DDI)是大學(xué)間政治和社會研究聯(lián)合會(ICPSR)的一個(gè)項(xiàng)目弄贿。DDI試圖為社會科學(xué)數(shù)據(jù)資源的描述生成元數(shù)據(jù)規(guī)范。所提供的模型包括八個(gè)元素矫膨,它們是研究概念差凹、數(shù)據(jù)收集、數(shù)據(jù)處理侧馅、數(shù)據(jù)存檔危尿、數(shù)據(jù)分發(fā)、數(shù)據(jù)發(fā)現(xiàn)馁痴、數(shù)據(jù)分析和重新調(diào)整用途谊娇,如圖4所示。
研究結(jié)論:這幾乎是一個(gè)全面的模型罗晕,因?yàn)樗晒Φ亟鉀Q了數(shù)據(jù)生命周期中從收集到使用的大多數(shù)步驟济欢。但是赠堵,似乎沒有對數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全有任何關(guān)注。
3.4 DigitalNZ模型
DigitalNZ來自數(shù)字新西蘭法褥。他們的目標(biāo)是為用戶收集和增加數(shù)字內(nèi)容的數(shù)量茫叭,而數(shù)據(jù)模型是為存檔和使用數(shù)字信息而設(shè)計(jì)的。該模型包括選擇半等、創(chuàng)建揍愁、描述、管理酱鸭、保存吗垮、發(fā)現(xiàn)垛吗、使用和復(fù)用等步驟凹髓,如圖5所示。該模型旨在管理數(shù)據(jù)利益相關(guān)者之間的數(shù)字信息交換怯屉。
研究結(jié)論:此模型的設(shè)計(jì)只關(guān)注存檔和使用目的蔚舀,因此不能將其視為一個(gè)全面的模型。此外锨络,該模型不提供數(shù)據(jù)分析赌躺、數(shù)據(jù)集成、數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量羡儿。
3.5 生態(tài)信息學(xué)模型
生態(tài)信息學(xué)是幫助科學(xué)家處理相關(guān)生物梧兼、環(huán)境和社會經(jīng)濟(jì)數(shù)據(jù)和信息的框架裂允。該模型旨在通過發(fā)現(xiàn)、管理、集成唧喉、分析、可視化和保存相關(guān)數(shù)據(jù)和信息的創(chuàng)造性工具和方法來構(gòu)建新知識槽棍。如圖6所示冀自,計(jì)劃、收集厨相、保證领曼、描述、保存蛮穿、發(fā)現(xiàn)庶骄、集成和分析是該模型的步驟。因此践磅,該模型提供了一個(gè)框架单刁,以實(shí)現(xiàn)對某些特定科學(xué)的數(shù)據(jù)和信息的新見解。
研究結(jié)論:此框架設(shè)計(jì)幾乎是一個(gè)全面的模型音诈,因?yàn)樗菫閿?shù)據(jù)收集幻碱、數(shù)據(jù)保存绎狭、數(shù)據(jù)發(fā)現(xiàn)和一些數(shù)據(jù)操作(如數(shù)據(jù)集成和數(shù)據(jù)分析)而設(shè)計(jì)的。然而褥傍,數(shù)據(jù)安全仍然沒有包括在內(nèi)儡嘶,所以它實(shí)際上也不是一個(gè)綜合模型。此模型看起來與DataONE模型非常相似恍风,但在第一步中它們有所不同蹦狂。
3.6 一般科學(xué)模型
通用科學(xué)模型由科學(xué)機(jī)構(gòu)提供,用于管理科學(xué)數(shù)字?jǐn)?shù)據(jù)朋贬。此模型可用于管理用于存檔或處理數(shù)據(jù)的數(shù)據(jù)收集方法凯楔。
通用科學(xué)數(shù)據(jù)模型將計(jì)劃、收集锦募、集成和轉(zhuǎn)換摆屯、發(fā)布、發(fā)現(xiàn)和通知以及存檔或丟棄作為生命周期的六個(gè)階段糠亩。這個(gè)模型虐骑,如圖7所示,可以用數(shù)據(jù)管理計(jì)劃使用的特定技術(shù)來預(yù)測下一組數(shù)據(jù)采集赎线。
研究結(jié)論:此模型不是整個(gè)數(shù)據(jù)生命周期的綜合模型廷没,因?yàn)樗菍iT為數(shù)據(jù)存檔和處理而設(shè)計(jì)的。該模型不關(guān)心數(shù)據(jù)分析垂寥、數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量颠黎。
3.7 地理空間模型
地理空間數(shù)據(jù)生命周期模型由聯(lián)邦地理數(shù)據(jù)委員會(FGDC)支持。該模型旨在為地理和相關(guān)空間數(shù)據(jù)活動探索和保存有價(jià)值的信息滞项。圖8總結(jié)了地理空間數(shù)據(jù)生命周期的各個(gè)階段狭归,包括定義、清點(diǎn)/評估蓖扑、獲取唉铜、訪問、維護(hù)律杠、使用/評估和歸檔潭流。處理此模型是為了發(fā)現(xiàn)具有可接受的質(zhì)量和業(yè)務(wù)需求的數(shù)據(jù)以供將來使用。
研究結(jié)論:此模型不能用作綜合模型柜去,因?yàn)樗菍iT為搜索和存檔信息而設(shè)計(jì)的灰嫉。另外,這個(gè)模型沒有涉及到循環(huán)中的數(shù)據(jù)分析和數(shù)據(jù)集成嗓奢。此外讼撒,質(zhì)量保證和質(zhì)量控制包括在每個(gè)階段。
3.8 德烏斯托大學(xué)模型
西班牙德烏斯托大學(xué)的一組研究人員提出了一種用于智能城市數(shù)據(jù)管理的數(shù)據(jù)生命周期模型。如圖9所示根盒,該模型的不同階段是發(fā)現(xiàn)钳幅、捕獲、管理炎滞、存儲敢艰、發(fā)布、鏈接册赛、利用和可視化钠导。此模型是一個(gè)用于在智能城市中發(fā)現(xiàn)、存儲和發(fā)布數(shù)據(jù)的選項(xiàng)森瘪。
研究結(jié)論:該模型不能被視為綜合模型牡属,因?yàn)樗侵悄艹鞘袛?shù)據(jù)管理的專用模型。此外扼睬,模型中沒有對數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量(包括QA和QC)的關(guān)注逮栅。
3.9 JISC模型
管理研究數(shù)據(jù)方案下的聯(lián)合信息系統(tǒng)委員會(JISC)致力于英國高等教育和研究的良好研究數(shù)據(jù)管理和共享。所提出的研究模型是為用戶之間的數(shù)據(jù)共享而設(shè)計(jì)的痰驱。該模型包括七個(gè)步驟:計(jì)劃证芭、創(chuàng)建、使用担映、評估、發(fā)布叫潦、發(fā)現(xiàn)和復(fù)用蝇完,如圖10所示。所提供的模型是一個(gè)數(shù)據(jù)共享和發(fā)現(xiàn)框架矗蕊,作為其全局?jǐn)?shù)據(jù)管理起始點(diǎn)的一部分短蜕。
研究結(jié)論:此模型也不是綜合模型,因?yàn)樗菫閿?shù)據(jù)共享和發(fā)現(xiàn)而設(shè)計(jì)的傻咖。此模型不提供任何數(shù)據(jù)處理朋魔、數(shù)據(jù)集成和數(shù)據(jù)分析階段。此外卿操,該模型涵蓋了“評估”步驟下的質(zhì)量控制概念警检,但未提供質(zhì)量保證。
3.10 英國數(shù)據(jù)存檔模型
英國數(shù)據(jù)檔案館是英國最大的數(shù)字?jǐn)?shù)據(jù)(包括社會和經(jīng)濟(jì)數(shù)據(jù))收集機(jī)構(gòu)之一害淤。英國的數(shù)據(jù)存檔模式側(cè)重于數(shù)字?jǐn)?shù)據(jù)的獲取扇雕、管理和存檔。該模型包括創(chuàng)建數(shù)據(jù)窥摄、處理數(shù)據(jù)镶奉、分析數(shù)據(jù)、保存數(shù)據(jù)、訪問數(shù)據(jù)和復(fù)用數(shù)據(jù)哨苛,并將它們組織為一個(gè)周期鸽凶,如圖11所示。因此建峭,該模型對于跨數(shù)字?jǐn)?shù)據(jù)的存檔和發(fā)現(xiàn)是一個(gè)很好的選擇吱瘩。
研究結(jié)論:該模型可以假設(shè)為一個(gè)綜合模型,因?yàn)樗峁┝送暾臄?shù)據(jù)生命周期迹缀,包括采集使碾、管理和保存。但是祝懂,此模型不包括數(shù)據(jù)質(zhì)量票摇。
3.11 USGS模型
美國地質(zhì)調(diào)查局(USGS)數(shù)據(jù)集成社區(qū)(CDI)致力于處理與美國地質(zhì)局科學(xué)研究相關(guān)的數(shù)據(jù)和信息管理問題。USGS數(shù)據(jù)模型提供了一個(gè)框架砚蓬,用于評估和改進(jìn)管理科學(xué)數(shù)據(jù)的政策和實(shí)踐矢门,并確定需要新工具和標(biāo)準(zhǔn)的領(lǐng)域。該模型包括主要的和橫切的模型元素灰蛙,如圖12所示祟剔。主要的模型元素是計(jì)劃、獲取摩梧、處理物延、分析、保存和發(fā)布/共享仅父。此外叛薯,橫切模型元素還附帶了描述、管理質(zhì)量笙纤、備份和安全等步驟耗溜。因此,該模型可以為科學(xué)數(shù)據(jù)的管理提供參考省容,以獲得更好的標(biāo)準(zhǔn)和工具抖拴。
研究結(jié)論:這個(gè)模型可以被認(rèn)為是一個(gè)綜合的模型,因?yàn)樗鼮椴杉冉贰⒄砗捅4娼ㄗh了數(shù)據(jù)周期阿宅。然而,該模型不包括數(shù)據(jù)安全寞酿,因?yàn)椤按鎯桶踩痹刂械陌踩x是指物理風(fēng)險(xiǎn)家夺,例如硬件和軟件故障。
3.12 北京郵電大學(xué)模型
該模型隸屬于北京郵電大學(xué)的一個(gè)研究小組伐弹。此模型用于云計(jì)算環(huán)境中的數(shù)據(jù)安全拉馋。圖13所示的基于圖的模型有五個(gè)階段榨为,分別是創(chuàng)建、存儲煌茴、使用和共享随闺、存檔和銷毀。該模型適用于云環(huán)境中的安全性蔓腐。
研究結(jié)論:這個(gè)模型不能被認(rèn)為是一個(gè)全面的模型矩乐,因?yàn)樗脑O(shè)計(jì)只支持云中的數(shù)據(jù)安全。此外回论,它不包括數(shù)據(jù)質(zhì)量散罕、數(shù)據(jù)分析和數(shù)據(jù)發(fā)布等階段。
3.13 PII模型
個(gè)人身份信息生命周期模型涵蓋了從創(chuàng)建到存儲的PII數(shù)據(jù)傀蓉。它從個(gè)人信息保護(hù)的視角欧漱,將生命周期劃分為采集、處理葬燎、存儲误甚、轉(zhuǎn)移和維護(hù),如圖14所示谱净。
研究結(jié)論:雖然這個(gè)生命周期是封閉的窑邦,但它包含銷毀過時(shí)數(shù)據(jù)的步驟。在這個(gè)周期的每一個(gè)步驟中壕探,我們都注意到添加了額外的信息來保持信息的可跟蹤性冈钦。
3.14 DAMA模型
DAMA(國際數(shù)據(jù)管理協(xié)會)認(rèn)為有效的數(shù)據(jù)數(shù)據(jù)管理開始于數(shù)據(jù)獲取之前,企業(yè)應(yīng)先制定數(shù)據(jù)規(guī)劃浩蓉,定義數(shù)據(jù)規(guī)范派继,然后再進(jìn)行開發(fā)實(shí)施、創(chuàng)建和獲取捻艳、維護(hù)和使用、存檔和檢索庆猫,最后是清除认轨。
研究結(jié)論:DAMA數(shù)據(jù)生命周期模型也不能看作是一個(gè)全面的模型,因?yàn)樗]有考慮數(shù)據(jù)安全月培、數(shù)據(jù)質(zhì)量和數(shù)據(jù)共享分布等內(nèi)容嘁字,而且它只給出了階段劃分,并沒有詳細(xì)說明每一階段的具體內(nèi)容杉畜,只是一個(gè)理論模型纪蜒。
3.15 對比分析
為了進(jìn)行分析,我選擇了20個(gè)階段:定義此叠、計(jì)劃纯续、開發(fā)實(shí)施、創(chuàng)建/接收、處理猬错、保證窗看、描述、管理倦炒、存儲显沈、分發(fā)、發(fā)現(xiàn)逢唤、集成拉讯、維護(hù)、使用鳖藕、可視化魔慷、評估、復(fù)用吊奢、共享/發(fā)布和歸檔盖彭。通過對比分析可以發(fā)現(xiàn)有些階段是每個(gè)模型共同的;比如創(chuàng)建/接收,有些階段則是獨(dú)有的页滚,比如可視化召边。令我感到意外的是數(shù)據(jù)歸檔和銷毀居然很少有模型涉及,這說明很多模型并沒有把數(shù)據(jù)當(dāng)作資產(chǎn)來看待裹驰,并沒有考慮數(shù)據(jù)管理的效益最大化隧熙,這也正是設(shè)計(jì)數(shù)據(jù)資產(chǎn)全生命周期模型的必要。為了使我的比較客觀且直觀呈現(xiàn)幻林,我制作了一個(gè)分析圖表贞盯。
之后,根據(jù)統(tǒng)計(jì)分析沪饺,結(jié)合大數(shù)據(jù)的特點(diǎn)已經(jīng)企業(yè)實(shí)踐經(jīng)驗(yàn)保留了11個(gè)階段躏敢,包括計(jì)劃、定義整葡、創(chuàng)建/接收件余、處理、集成遭居、存儲啼器、運(yùn)維、共享俱萍、發(fā)現(xiàn)端壳、使用和復(fù)用、歸檔&銷毀枪蘑。
然后损谦,我為每個(gè)生命周期分配一個(gè)分?jǐn)?shù)岖免,以便于評估模型。
這個(gè)排名也證實(shí)了DAMA在數(shù)據(jù)管理領(lǐng)域的專業(yè)地位成翩,這是一個(gè)模型觅捆,幾乎包含了我在分析中保留的所有階段。我們在這個(gè)周期中唯一的缺點(diǎn)是數(shù)據(jù)集成麻敌、共享和發(fā)現(xiàn)階段仍然沒有栅炒,這幾個(gè)階段在數(shù)據(jù)使用過程中很重要。因此术羔,我將此生命周期模型作為基礎(chǔ)赢赊,同時(shí)利用USGS、生態(tài)信息學(xué)模型和DCI等模型來彌補(bǔ)DAMA模型中的缺項(xiàng)级历。接下來释移,我將介紹一種適用于數(shù)據(jù)資產(chǎn)管理全生命周期管理的模型。
4寥殖、數(shù)據(jù)資產(chǎn)全生命周期模型
我分析并描述了大多數(shù)數(shù)據(jù)生命周期模型玩讳。數(shù)據(jù)生命周期模型的出現(xiàn)表明,對數(shù)據(jù)管理和移動性的新要求給傳統(tǒng)的數(shù)據(jù)生命周期模型增加了一些具體的步驟嚼贡,如數(shù)據(jù)質(zhì)量熏纯、數(shù)據(jù)安全、數(shù)據(jù)復(fù)用等粤策。此外樟澜,許多模型都是為解決數(shù)據(jù)管理中的一個(gè)特定問題或特定目的而設(shè)計(jì)的。當(dāng)然叮盘,每個(gè)模型對于他們的研究或項(xiàng)目需求來說都是一個(gè)合適的設(shè)計(jì)秩贰,而且,它們可能會留下一些挑戰(zhàn)需要解決柔吼,因?yàn)檫@些挑戰(zhàn)超出了他們的目標(biāo)范圍毒费。基于這個(gè)原因愈魏,我想知道是否有一個(gè)綜合的模型能夠成功地滿足數(shù)據(jù)資產(chǎn)管理的需求蝗罗。數(shù)據(jù)資產(chǎn)全生命周期模型(Data Asset
Life Cycle Model,簡稱DALCM)主要貢獻(xiàn)是消除企業(yè)或組織在為任何新項(xiàng)目設(shè)計(jì)新模型時(shí)的認(rèn)知差異和浪費(fèi)蝌戒。
數(shù)據(jù)資產(chǎn)全生命周期分為4大期間和11階段。4大期間包括數(shù)據(jù)資產(chǎn)生成的“入”期沼琉、數(shù)據(jù)資產(chǎn)保存的“存”期北苟、數(shù)據(jù)資產(chǎn)應(yīng)用的“用”期和數(shù)據(jù)資產(chǎn)退出的“出”期。四大期間下包含11個(gè)階段打瘪,有效的數(shù)據(jù)資產(chǎn)管理始于數(shù)據(jù)的產(chǎn)生之前開始友鼻,首先應(yīng)該做好規(guī)劃和計(jì)劃傻昙,包括數(shù)據(jù)資產(chǎn)盤點(diǎn)、數(shù)據(jù)治理計(jì)劃彩扔、數(shù)據(jù)需求計(jì)劃等妆档;然后對數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行定義,制定數(shù)據(jù)管理規(guī)范虫碉,確保數(shù)據(jù)按照標(biāo)準(zhǔn)產(chǎn)生贾惦,從源頭抓起,有句古詩說得特別好:“問渠那得清如許敦捧?為有源頭活水來须板。”兢卵。在“存”的期間內(nèi)习瑰,處理和存儲都沒什么好說的,比較容易理解秽荤,在這里把“集成”放進(jìn)來主要是考慮到數(shù)據(jù)資產(chǎn)管理需要打通數(shù)據(jù)孤島甜奄,數(shù)據(jù)只有集成起來才能發(fā)揮更大的價(jià)值。只有實(shí)現(xiàn)了數(shù)據(jù)集成窃款,數(shù)據(jù)倉庫才能稱之為數(shù)據(jù)倉庫课兄,否則即使把數(shù)據(jù)集中起來存儲,也只能叫做數(shù)據(jù)垃圾堆雁乡〉谠“用”這個(gè)期間是真正產(chǎn)生價(jià)值的周期,其他周期都是成本踱稍,數(shù)據(jù)因使用而生值曲饱,用處越多價(jià)值越大。在“用”這個(gè)期間要特別強(qiáng)調(diào)“數(shù)據(jù)復(fù)用”這個(gè)階段珠月,時(shí)下比較流行的數(shù)據(jù)中臺架構(gòu)扩淀,我認(rèn)為最大的一個(gè)價(jià)值就是數(shù)據(jù)復(fù)用和服務(wù)復(fù)用,這對于節(jié)省成本啤挎,提高效率非常重要驻谆。未來企業(yè)或組織在評估一個(gè)數(shù)據(jù)產(chǎn)品值不值得開發(fā)很重要的一個(gè)指標(biāo)應(yīng)該看能不能復(fù)用。當(dāng)然庆聘,如果不能復(fù)用胜臊,單個(gè)項(xiàng)目的收益足夠大的時(shí)候,也是可以投入的伙判∠蠖裕“出”也非常重要,雖然現(xiàn)在存儲的價(jià)格越來越低宴抚,但是如果不加以管理也會產(chǎn)生很大的負(fù)擔(dān)勒魔,對于數(shù)據(jù)資產(chǎn)整體效益不利甫煞。另外,如不加以區(qū)分冠绢,本該歸檔或者清除的數(shù)據(jù)和活躍的數(shù)據(jù)存放在一起抚吠,將嚴(yán)重影響效率。
數(shù)據(jù)運(yùn)維提供保障弟胀,主要負(fù)責(zé)對數(shù)據(jù)庫進(jìn)行日常維護(hù)楷力,對數(shù)據(jù)進(jìn)行備份、恢復(fù)邮利。確保數(shù)據(jù)完整性弥雹、一致性、及時(shí)性延届,保證數(shù)據(jù)質(zhì)量剪勿。還要提供數(shù)據(jù)安全方面的防護(hù),進(jìn)行用戶授權(quán)方庭、身份認(rèn)證和訪問行為監(jiān)控等厕吉,并保密級別較高的數(shù)據(jù)進(jìn)行數(shù)據(jù)加密、脫敏械念、匿名化等操作头朱。
數(shù)據(jù)資產(chǎn)運(yùn)營是DALCM區(qū)別于數(shù)據(jù)生命周期不同之處。數(shù)據(jù)資產(chǎn)運(yùn)營以數(shù)據(jù)資產(chǎn)效益最大化為目標(biāo)龄减,包括數(shù)據(jù)資產(chǎn)全生命周期成本核算项钮、數(shù)據(jù)資產(chǎn)價(jià)值評估、數(shù)據(jù)資產(chǎn)變現(xiàn)希停、數(shù)據(jù)資產(chǎn)活性分析和數(shù)據(jù)資產(chǎn)投資收益分析等內(nèi)容烁巫。
5 、企業(yè)實(shí)踐
筆者發(fā)現(xiàn)很多人在談數(shù)據(jù)生命周期管理的時(shí)候宠能,只是提出了一個(gè)概念或者大概知道劃分哪些階段亚隙,但是并不知道具體怎么做,或者每個(gè)階段從管理上和技術(shù)上怎么操作违崇。
下面阿弃,筆者就以數(shù)據(jù)銷毀階段為例,簡單介紹一下我在實(shí)踐中的具體做法羞延。
首先渣淳,根據(jù)數(shù)據(jù)的血緣關(guān)系,繪制出整個(gè)數(shù)據(jù)調(diào)用的關(guān)系鏈伴箩,如下圖所示:
父級數(shù)據(jù)節(jié)點(diǎn)(如上圖水由,父表是兒子表和兒媳表的父級節(jié)點(diǎn))的活性等于自身的調(diào)用次數(shù)加上所有子節(jié)點(diǎn)的調(diào)用次數(shù)。
舉例:比如上圖中父表的活性=父節(jié)點(diǎn)自身的調(diào)用次數(shù)+兒子節(jié)點(diǎn)的調(diào)用次數(shù)+兒媳節(jié)點(diǎn)的調(diào)用次數(shù)+孫子節(jié)點(diǎn)的調(diào)用次數(shù)。
將活性等級劃分為4個(gè)區(qū)間砂客,分別為:死透、半死不活呵恢、活的一般鞠值、活得很好。
根據(jù)數(shù)據(jù)活性評估模型評估數(shù)據(jù)資產(chǎn)所處在的區(qū)間渗钉。通過一個(gè)月不間斷的評估彤恶,根據(jù)每天評估結(jié)果的算術(shù)平均值。每月出具數(shù)據(jù)活性分析報(bào)告鳄橘,為數(shù)據(jù)管理提供決策支持声离,比如:對死透的數(shù)據(jù)選擇進(jìn)行銷毀、遷移到低成本存儲設(shè)備或者想辦法激活瘫怜。有的數(shù)據(jù)雖然不在活動术徊,也不能直接銷毀,比如國家或行業(yè)監(jiān)管有要求保存期限的鲸湃。對于半死不活的數(shù)據(jù)可以考慮怎么樣激活赠涮,讓其被更多的利用,以創(chuàng)造更大的價(jià)值暗挑。
最后笋除,還是得借助IT支撐工具實(shí)現(xiàn)自動化管理。通過數(shù)據(jù)資產(chǎn)全生命周期管理系統(tǒng)炸裆,可視化呈現(xiàn)Top100數(shù)據(jù)活性最高的數(shù)據(jù)資產(chǎn)垃它,自動出具數(shù)據(jù)活性分析報(bào)告,列示超過12個(gè)月的死掉的數(shù)據(jù)清單烹看,根據(jù)處理結(jié)果国拇,統(tǒng)計(jì)釋放的存儲空間、節(jié)約的成本以及提升的效率听系,并繪制相應(yīng)的變化趨勢圖贝奇。通過數(shù)據(jù)資產(chǎn)目錄系統(tǒng)展示每一項(xiàng)數(shù)據(jù)資產(chǎn)的活性,以便于數(shù)據(jù)資產(chǎn)管理人員以及數(shù)據(jù)使用人員決策靠胜。
下一步掉瞳,計(jì)劃結(jié)合數(shù)據(jù)資產(chǎn)地圖和數(shù)據(jù)資產(chǎn)活性繪制一份數(shù)據(jù)資產(chǎn)熱力圖(如圖21所示),更加直觀地呈現(xiàn)核心數(shù)據(jù)資產(chǎn)的分布和流向等浪漠。
6陕习、總結(jié)
隨著數(shù)字經(jīng)濟(jì)時(shí)代的到來,數(shù)據(jù)是一種資產(chǎn)被廣泛認(rèn)可址愿,數(shù)據(jù)資產(chǎn)生命周期在各種數(shù)據(jù)管理框架中被提及该镣,但是并沒有一個(gè)權(quán)威的數(shù)據(jù)資產(chǎn)全生命周期模型。筆者首先回顧了傳統(tǒng)資產(chǎn)全生命周期管理模型响谓,然后分析了國內(nèi)外幾種數(shù)據(jù)生命周期模型的優(yōu)缺點(diǎn)损合,再結(jié)合企業(yè)實(shí)踐經(jīng)驗(yàn)省艳,提出了DALCM模型(數(shù)據(jù)資產(chǎn)全生命周期模型)。本文的附加價(jià)值介紹了數(shù)據(jù)銷毀的具體做法嫁审,企業(yè)或組織看完后是立馬可以施行的跋炕。
7、參考
1.DAMA模型.參考資料:DMBOK2.0律适,2017.2.5.9:p.28~29
2.https://cloudsecurityalliance.org/about
3.https://www.dataone.org/about
4.國際數(shù)字管理雜志, 2008.3(1): p. 134-140
5.www.ddialliance.org/system/files/Concept-Model-WD.pdf
6.http://www.digitalnz.org/about
7.http://www.dcc.ac.uk/about-us
8.http://www.dcc.ac.uk/resources/curationlifecycle-model
9.http://www.digitalnz.org/make-it-digital
10.https://.www.fgdc.gov/policyandplanning/a-16
11.http://lod2.eu
12.http://archives.msu.edu/records
13.http://webarchive.nationalarchives.gov.uk/20140702233839
14.http://www.jisc.ac.uk/whatwedo/programmes/mrd.aspx
15.http://www.data-archive.ac.uk/about