數(shù)據(jù)引發(fā)的混亂
數(shù)據(jù)一切都與技術(shù)的集中化有關(guān)。數(shù)據(jù)安全地存儲(chǔ)在企業(yè)大型機(jī)上,只有具備導(dǎo)航預(yù)處理數(shù)據(jù)庫(kù)技能的程序員才能訪問(wèn)它。差不多四十年后诀姚,所有這些都與數(shù)據(jù)民主化和強(qiáng)大的數(shù)據(jù)治理戰(zhàn)略的需求有關(guān)。
在當(dāng)天玷禽,業(yè)務(wù)分析師必須與IT部門聯(lián)手学搜,因?yàn)樗麄儾恢廊绾螌?dǎo)航信息管理系統(tǒng)數(shù)據(jù)庫(kù),即使他們可以也不會(huì)被授予訪問(wèn)權(quán)限论衍,IT部門打印出月度報(bào)告并分發(fā)它們。
隨著個(gè)人計(jì)算機(jī)的出現(xiàn)聚磺,權(quán)力的平衡從根本上發(fā)生了變化坯台。突然之間,商人可以訪問(wèn)電子表格瘫寝,并可以創(chuàng)建自己的計(jì)算和分析蜒蕾,即使數(shù)據(jù)仍然大部分無(wú)法觸及。然后是客戶端/服務(wù)器計(jì)算和急于分散數(shù)據(jù)焕阿,帶來(lái)了新的可能性咪啡,但也因?yàn)椴煌块T使用不同版本的數(shù)據(jù)而產(chǎn)生混淆。分析師爭(zhēng)論誰(shuí)的版本是正確的暮屡。分析現(xiàn)在可以由業(yè)務(wù)分析師完成撤摸,但未就數(shù)據(jù)源的合法性達(dá)成一致,隨之而來(lái)的是混亂褒纲。
數(shù)據(jù)治理帶來(lái)曙光
IT部門使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行響應(yīng)准夷,數(shù)據(jù)倉(cāng)庫(kù)會(huì)在斷開(kāi)連接的交易系統(tǒng)中收集數(shù)據(jù),僅用于分析莺掠。出現(xiàn)了聰明的報(bào)告工具衫嵌,可以更容易地操作,加入和匯總原始交易表彻秆,甚至可以將它們下載到電子表格中楔绞。當(dāng)然结闸,原始數(shù)據(jù)仍然存儲(chǔ)在不同的應(yīng)用程序和格式中,但是通過(guò)足夠的努力酒朵,數(shù)據(jù)倉(cāng)庫(kù)可以被用來(lái)以理解所有這些桦锄,提供客戶,產(chǎn)品耻讽,資產(chǎn)和位置等維度察纯。但是,要實(shí)際生成一致的客戶和產(chǎn)品列表针肥,必須解決底層系統(tǒng)的不一致問(wèn)題饼记。
主數(shù)據(jù)管理(MDM)誕生了,與此同時(shí)慰枕,還需要數(shù)據(jù)治理策略具则。業(yè)務(wù)用戶被鼓勵(lì)或哄騙決定哪些客戶和產(chǎn)品的分類是“黃金記錄”,要在整個(gè)企業(yè)中高舉具帮,哪些將被投入到部門特定的本地術(shù)語(yǔ)的荒野中博肋。這是一個(gè)經(jīng)常激烈的過(guò)程,不同的部門爭(zhēng)論哪個(gè)是分類數(shù)據(jù)的最佳方式蜂厅。一些公司文化比其他文化更適合這種方法匪凡。高度集中的公司習(xí)慣于從高度但分散的方式?jīng)Q定結(jié)構(gòu),并且努力保持在數(shù)據(jù)治理結(jié)構(gòu)中掘猿。這些公司的分析師認(rèn)為自己是自由戰(zhàn)士病游,而中央辦公室的分析人員則認(rèn)為他們是數(shù)據(jù)恐怖分子。
很明顯稠通,至少在很多公司中衬衬,自由戰(zhàn)士現(xiàn)在方興未艾。這標(biāo)志著數(shù)據(jù)準(zhǔn)備工具的市場(chǎng)不斷增長(zhǎng)改橘。這些產(chǎn)品能夠訪問(wèn)來(lái)自各種來(lái)源的數(shù)據(jù)滋尉,包括傳統(tǒng)數(shù)據(jù)庫(kù),應(yīng)用程序包飞主,Excel或企業(yè)防火墻外的應(yīng)用程序狮惜。它們支持一些數(shù)據(jù)質(zhì)量技術(shù),例如分析碌识,并使業(yè)務(wù)用戶能夠設(shè)置數(shù)據(jù)轉(zhuǎn)換讽挟,并通過(guò)可重復(fù)的工作流程自動(dòng)執(zhí)行此類提取,數(shù)據(jù)清理和轉(zhuǎn)換丸冕。這些工具擁有自己的分析工具耽梅,或者可以調(diào)用最新的可視化和數(shù)據(jù)挖掘產(chǎn)品,使分析師能夠根據(jù)自己的內(nèi)容處理數(shù)據(jù)胖烛。
如果企業(yè)數(shù)據(jù)倉(cāng)庫(kù)和MDM正在開(kāi)展工作眼姐,那么這樣的市場(chǎng)就不會(huì)存在诅迷。數(shù)據(jù)準(zhǔn)備,質(zhì)量檢查和轉(zhuǎn)換正是準(zhǔn)備將數(shù)據(jù)輸入數(shù)據(jù)倉(cāng)庫(kù)的準(zhǔn)備众旗。問(wèn)題是公司數(shù)據(jù)倉(cāng)庫(kù)已超出其自然限制罢杉。數(shù)據(jù)現(xiàn)在來(lái)自各種各樣的來(lái)源,其中許多來(lái)自企業(yè)之外贡歧,并且在這樣的數(shù)量中滩租,傳統(tǒng)的數(shù)據(jù)管理方法正在崩潰。
電子商務(wù)系統(tǒng)可以生成如此大小的網(wǎng)絡(luò)流量日志利朵,使得普通數(shù)據(jù)庫(kù)不能處理該處理律想。車輛和機(jī)械上的傳感器現(xiàn)在產(chǎn)生大量的流數(shù)據(jù):波音787每次飛行產(chǎn)生幾乎1TB的數(shù)據(jù)。在其他行業(yè)中也是如此绍弟,汽車技即,家庭智能電表甚至道路上的傳感器都會(huì)產(chǎn)生大量數(shù)據(jù)進(jìn)行分析。所有這些都是傳統(tǒng)企業(yè)數(shù)據(jù)的補(bǔ)充樟遣,以及來(lái)自業(yè)務(wù)合作伙伴和數(shù)據(jù)經(jīng)紀(jì)人的數(shù)據(jù)而叼。有這么多數(shù)據(jù)出現(xiàn)在你面前,誰(shuí)有時(shí)間討論不同客戶分類層次結(jié)構(gòu)的優(yōu)點(diǎn)豹悬?
掌握數(shù)據(jù)質(zhì)量管理
公司需要以某種方式收回對(duì)這種快速流動(dòng)的數(shù)據(jù)流的控制葵陵,如果他們要理解它的話。如果沒(méi)有辦法深入了解并深入了解數(shù)據(jù)湖泊瞻佛,數(shù)據(jù)湖泊將成為數(shù)據(jù)沼澤脱篙。數(shù)據(jù)治理策略可能不是一個(gè)感性的主題,但它是需要發(fā)生的事情的核心涤久。那些使用新工具構(gòu)建自己的提取和轉(zhuǎn)換的分析師需要幫助決定如何管理數(shù)據(jù),因?yàn)槿绻悴荒芫偷讓訑?shù)據(jù)是否值得信任達(dá)成一致忍弛,所有漂亮的圖表和AI工具都沒(méi)有任何意義响迂。
在沒(méi)有某種結(jié)構(gòu)的情況下,我們將回到過(guò)去细疚,分析師互相爭(zhēng)吵蔗彤,并爭(zhēng)論誰(shuí)的數(shù)據(jù)是正確的。將數(shù)據(jù)精靈放回瓶子中將是困難的并且需要紀(jì)律疯兼,但是在所有太多的組織中然遏,現(xiàn)在感覺(jué)混亂而不是管理。它不是要從高層實(shí)施規(guī)則吧彪,而是要在整個(gè)組織層面嵌入分析和數(shù)據(jù)管理規(guī)則待侵。否則,可能會(huì)忽略有價(jià)值的業(yè)務(wù)見(jiàn)解姨裸,并失去競(jìng)爭(zhēng)優(yōu)勢(shì)秧倾。
WHY→HOW
既然我們已經(jīng)知道了數(shù)據(jù)治理對(duì)于現(xiàn)在這樣一個(gè)數(shù)據(jù)大爆炸的時(shí)代有這么重要怨酝,那么其實(shí)作為企業(yè)要想在公司前進(jìn)的每一步都走得穩(wěn)走得準(zhǔn),那么就要求公司在每一個(gè)決策上面都要做好準(zhǔn)備那先,而決策—這樣一個(gè)有著太多不確定因素的決定农猬,要想降低其的不穩(wěn)定性,那么就要將其建立在可靠的數(shù)據(jù)分析上面售淡。試問(wèn)利用“渾濁”的數(shù)據(jù)做出來(lái)的數(shù)據(jù)分析能否支持公司高層斤葱,讓其做出更安全更有效的決策呢?
答案是否定的揖闸!
那么怎么去做數(shù)據(jù)治理呢揍堕?利用公司的研發(fā)部門去在很短的時(shí)間里面上線一款適合自己公司的數(shù)據(jù)治理工具嗎?這種費(fèi)時(shí)費(fèi)力的事情不適合大多數(shù)公司來(lái)進(jìn)行楔壤,因?yàn)閷?duì)于他們來(lái)說(shuō)集中精力于自己公司所屬于的方向是極其重要的鹤啡,那么選擇一款適合企業(yè)自身的數(shù)據(jù)治理工具就極其重要了!
若想獲取更多前沿互聯(lián)網(wǎng)資訊蹲嚣,洞悉數(shù)據(jù)奧秘递瑰,敬請(qǐng)關(guān)注微信公眾號(hào)——西西西語(yǔ),歡迎前來(lái)討論學(xué)習(xí)~