本文我們談?wù)勅绾谓鉀Q暗數(shù)據(jù)問題娩梨。
?什么類型的數(shù)據(jù)可能是暗數(shù)據(jù)铣鹏?
根據(jù)最新的IBM研究成果顯示透典,超過80%的數(shù)據(jù)是非結(jié)構(gòu)化的暗數(shù)據(jù)滤奈。IBM預(yù)計(jì)到2020年這個(gè)比例將上升到93%摆昧。舉例來說,汽車行業(yè)每秒產(chǎn)生350MB的數(shù)據(jù)蜒程,這些數(shù)據(jù)都會沉淀下來绅你。
暗數(shù)據(jù)因業(yè)務(wù)而異,不同的行業(yè)和公司有不同類型的暗數(shù)據(jù)昭躺,但歸納起來以下幾種比較常見:
1. 電子表單(一個(gè)有1500名雇員的公司大約有250萬表單忌锯,其中總計(jì)包含了幾十億單元格的數(shù)據(jù))
2. 多個(gè)舊版本的文檔
3. Email附件和下載完的壓縮文件
4. 閑置的數(shù)據(jù)庫和未被利用的客戶信息
5. 前員工的檔案和其他內(nèi)容(例如項(xiàng)目說明)
6. 分析報(bào)告和調(diào)查數(shù)據(jù)
7. 日志文件、賬戶信息和交易記錄
最終結(jié)果就是窍仰,這些數(shù)據(jù)被遺忘在流程之外汉规,分散在業(yè)務(wù)的各個(gè)層面。
為什么要挖掘暗數(shù)據(jù)驹吮?
就像我們之前所說的针史,暗數(shù)據(jù)指的是平常業(yè)務(wù)流程中產(chǎn)生的非結(jié)構(gòu)化或結(jié)構(gòu)簡單的,但未被有效利用的數(shù)據(jù)碟狞。而被一個(gè)部門認(rèn)為無關(guān)緊要的數(shù)據(jù)啄枕,對另一個(gè)部門來說可能極度有價(jià)值。
舉例來說族沃,在企業(yè)呼叫中心系統(tǒng)日志里一個(gè)訪問者的所在時(shí)區(qū)信息或者企業(yè)微博上產(chǎn)生的用戶互動(dòng)等這類數(shù)據(jù)都屬于暗數(shù)據(jù)频祝。它們可能從未被好好利用,但能幫助企業(yè)判別特定時(shí)區(qū)的有價(jià)值用戶脆淹,或者獲取和企業(yè)品牌在某方面產(chǎn)生互動(dòng)的用戶的有價(jià)值信息常空。
挖掘暗數(shù)據(jù)還能對傳統(tǒng)的一些數(shù)據(jù)源比如銷售報(bào)表或送貨記錄等進(jìn)行補(bǔ)充。例如盖溺,銷售報(bào)表本身很單一漓糙,但如果將微博上的用戶反饋和銷售額的下降相匹配,就能挖掘出很多有價(jià)值的信息烘嘱。
利用暗數(shù)據(jù)能解決很多棘手的問題昆禽,尤其當(dāng)企業(yè)目前所利用的數(shù)據(jù)只是冰山一角時(shí)蝗蛙。光識別暗數(shù)據(jù)還不夠,利用和挖掘其真正的價(jià)值才是挑戰(zhàn)所在醉鳖。
如何點(diǎn)亮暗數(shù)據(jù)捡硅?
在動(dòng)手挖掘暗數(shù)據(jù)前,必須先明確利用暗數(shù)據(jù)是想解決什么問題盗棵,如果這都沒想清楚壮韭,肯定無從下手。
要想清楚這件事情漾根,可以從問自己一個(gè)問題開始泰涂。這個(gè)問題可以很明確很實(shí)際鲫竞,比如季度銷量報(bào)告顯示某客戶群體的購買量無緣由的下降辐怕,背后的原因到底是什么;這個(gè)問題也可以很模糊从绘,例如企業(yè)的產(chǎn)品為什么在某個(gè)市場的表現(xiàn)不佳寄疏。
無論用哪種方式,在開始之前明確自己的目標(biāo)非常重要僵井。暗數(shù)據(jù)應(yīng)該被用來解決業(yè)務(wù)中已經(jīng)出現(xiàn)但通過現(xiàn)成數(shù)據(jù)無法解釋的問題陕截。例如,基礎(chǔ)數(shù)據(jù)能告訴我們某個(gè)月的產(chǎn)品銷量和利潤批什,但要想知道為什么某季度的銷量或利潤下降的主要原因可能就需要從暗數(shù)據(jù)里挖掘出更多信息了农曲。
如果有一個(gè)工具,能幫助我們從各種維度看到數(shù)據(jù)的分布狀態(tài)驻债,我們是不是就實(shí)時(shí)可以掌控暗數(shù)據(jù)乳规?答案是肯定的,利用云途可視化智能BI一體化平臺合呐,點(diǎn)亮暗數(shù)據(jù)只需3步:
STEP 1:全面捕獲數(shù)據(jù)——從邊緣數(shù)據(jù)到云端
點(diǎn)亮暗數(shù)據(jù)的一個(gè)關(guān)鍵步驟是確保擁有一個(gè)全面的歸檔策略暮的。業(yè)務(wù)部門如何才能自我分析數(shù)據(jù)?他們需要一個(gè)有效的IT支撐手段淌实,需要IT部門把暗數(shù)據(jù)透明化冻辩,變成透明的數(shù)據(jù)。實(shí)現(xiàn)數(shù)據(jù)透明化的一個(gè)基礎(chǔ)是數(shù)據(jù)標(biāo)準(zhǔn)化拆祈,建立標(biāo)準(zhǔn)化平臺恨闪。暗數(shù)據(jù)存在于不同系統(tǒng)中,需要重新格式化放坏、解析咙咽、篩選、標(biāo)準(zhǔn)化轻姿、整合以及細(xì)化犁珠, 使其為輸入到任何分析工具和應(yīng)用 程序中做好準(zhǔn)備逻炊。各個(gè)部門在不同應(yīng)用和數(shù)據(jù)庫上存儲的數(shù)據(jù)包含著高價(jià)值的內(nèi)容。為了有效利用暗數(shù)據(jù)犁享,必須從所有生成數(shù)據(jù)的地方采集數(shù)據(jù)余素。
云途可視化輕松連接并同步多種數(shù)據(jù)源,各類數(shù)據(jù)庫炊昆、各類業(yè)務(wù)平臺等一網(wǎng)打盡桨吊;只需一次連接即可實(shí)現(xiàn)數(shù)據(jù)定時(shí)自動(dòng)同步,無需花費(fèi)人力重復(fù)操作凤巨,幫助企業(yè)快速完成多數(shù)據(jù)源整合视乐,建立統(tǒng)一數(shù)據(jù)口徑,實(shí)現(xiàn)可重復(fù)的暗數(shù)據(jù)挖掘流程敢茁。不論是企業(yè)的數(shù)據(jù)專家還是普通業(yè)務(wù)人員佑淀,云途可視化都能為其快速完成數(shù)據(jù)分析前的準(zhǔn)備。
STEP 2:可視化分析——點(diǎn)亮暗數(shù)據(jù)的最后一公里
對于暗數(shù)據(jù)彰檬,一方面企業(yè)需要新的工具才能分析和理解; 另一方面伸刃,企業(yè)最終的目的是利用這些數(shù)據(jù)更好的做商業(yè)決策,并通過數(shù)據(jù)分析能夠最直觀的理解數(shù)據(jù)的含義逢倍。數(shù)據(jù)可視化是達(dá)成這一目標(biāo)的最佳途徑捧颅。
數(shù)據(jù)可視化對企業(yè)挖掘暗數(shù)據(jù)主要有3個(gè)作用:
1. 大規(guī)模的數(shù)據(jù)可視化可以幫助企業(yè)管理者對大量的數(shù)據(jù)有個(gè)迅速的了解,工作更高效较雕。
2. 正確的數(shù)據(jù)可視化可以清晰展現(xiàn)數(shù)據(jù)背后的意義碉哑。
3. 數(shù)據(jù)可視化可以幫助企業(yè)做出準(zhǔn)確的決策。
數(shù)據(jù)串聯(lián)起來所揭示的含義和產(chǎn)生的價(jià)值遠(yuǎn)遠(yuǎn)大于其單獨(dú)存在的意義亮蒋,將不同的散點(diǎn)通過內(nèi)在和外在的聯(lián)系聚合在一起扣典,使得數(shù)據(jù)之間可以通過不同的維度進(jìn)行關(guān)聯(lián),傳遞數(shù)據(jù)的價(jià)值宛蚓。隨著數(shù)據(jù)量的增大激捏,企業(yè)越來越希望搞清楚數(shù)據(jù)背后的意義,云途可視化就是一個(gè)幫助企業(yè)達(dá)成數(shù)據(jù)分析目標(biāo)的一體化平臺凄吏,通過拖放就可快速創(chuàng)建美觀分析視圖远舅,并可隨時(shí)修改,基于Web的操作提供了多種交互痕钢,同時(shí)智能推薦最適合的圖形展示形式图柏,讓數(shù)據(jù)說話。利用云途可視化平臺任连,可以輕松實(shí)現(xiàn)數(shù)據(jù)挖掘和分析蚤吹,幫助企業(yè)快速洞察市場趨勢,發(fā)現(xiàn)業(yè)務(wù)盲點(diǎn)。
STEP 3:分享與協(xié)作——實(shí)時(shí)同步裁着,提升效率
云途可視化平臺支持內(nèi)部繁涂、外部的多種數(shù)據(jù)的無縫整合,并自服務(wù)式創(chuàng)建分析模型二驰。分析結(jié)果通過靈活設(shè)置的賬號體系在企業(yè)級監(jiān)控下平滑的實(shí)現(xiàn)從數(shù)據(jù)到內(nèi)容的交付扔罪,讓用戶能以各種輸出形式和分發(fā)方式對分析內(nèi)容進(jìn)行發(fā)布和共享,擺脫了分析結(jié)果只能是靜態(tài)報(bào)告的窘境桶雀。
真正釋放“暗數(shù)據(jù)”潛能矿酵,讓數(shù)據(jù)見光需要一定的策略變化,其中一個(gè)關(guān)鍵點(diǎn)是啟動(dòng)可重復(fù)利用的 “暗數(shù)據(jù)”流程矗积。大多數(shù)公司所犯的最大錯(cuò)誤是認(rèn)為他們只需對“暗數(shù)據(jù)”進(jìn)行一次深入探究全肮,然而不僅數(shù)據(jù)的規(guī)模、多樣性和價(jià)值在不斷增長棘捣,提供數(shù)據(jù)的應(yīng)用程序的數(shù)量和類型也會不斷變化辜腺。
企業(yè)中定期需要呈現(xiàn)的數(shù)據(jù)報(bào)告制作過程是復(fù)雜且重復(fù)性的操作,制作報(bào)表的用戶需要找到各個(gè)相關(guān)業(yè)務(wù)部門獲得數(shù)據(jù)柱锹,之后進(jìn)行數(shù)據(jù)的整理哪自、清洗丰包、匯總禁熏,然后再生成報(bào)表和數(shù)據(jù)分析報(bào)告,這一過程邑彪,需要占用員工占用幾個(gè)小時(shí)甚至數(shù)天的時(shí)間且這一過程通常是重復(fù)性的瞧毙。
因此,與其一遍又一遍地解決單個(gè)“暗數(shù)據(jù)”項(xiàng)目寄症,應(yīng)該考慮建立一個(gè)可重復(fù)的流程宙彪。這意味著需要采取技術(shù)建立現(xiàn)代化的基礎(chǔ)架構(gòu),以使企業(yè)的所有數(shù)據(jù)隨時(shí)可供訪問并保持一致有巧,使其保持潔凈释漆、安全、互聯(lián)互通篮迎。
云途可視化平臺提供一賬號管理多數(shù)據(jù)源男图,一賬號自動(dòng)推薦式生成報(bào)告等多種自助式數(shù)據(jù)分析功能,您無需再做這些重復(fù)性的操作甜橱,只需要3步逊笆,接入數(shù)據(jù)---分析數(shù)據(jù)---分享報(bào)告即可完成您的日常數(shù)據(jù)報(bào)告需求。通過云途可視化的賬號體系靈活的支持賬戶角色分組和權(quán)限設(shè)置岂傲,企業(yè)能分級分層對數(shù)據(jù)难裆、分析報(bào)告進(jìn)行管理并且同時(shí)實(shí)現(xiàn)數(shù)據(jù)報(bào)告的協(xié)同。
“暗數(shù)據(jù)”并非僅僅表明技術(shù)開支效率低下,它還表明企業(yè)難以利用其積累起來的豐富知識乃戈,“暗數(shù)據(jù)”是一個(gè)有待發(fā)掘的潛在金礦褂痰。在我國當(dāng)前新型工業(yè)化進(jìn)程中,提倡大數(shù)據(jù)的前奏叫數(shù)字化症虑,數(shù)字化能夠貫通各個(gè)環(huán)節(jié)脐恩,把原來可能隱藏在工業(yè)流程當(dāng)中的數(shù)據(jù)釋放出來,用數(shù)據(jù)來描述工業(yè)流程侦讨。
說到這里你已經(jīng)能夠想象到它對企業(yè)的價(jià)值了吧驶冒?那么還等什么,快來點(diǎn)亮您的暗數(shù)據(jù)吧韵卤。
歡迎關(guān)注“云途數(shù)據(jù)”微信公眾號(ID:yuntudata),每日分享大數(shù)據(jù)干貨骗污。