接近年關(guān)仙粱,又到了一年復(fù)盤和規(guī)劃的時(shí)候房交。除了微觀層面上對(duì)自我工作進(jìn)行總結(jié)計(jì)劃,同時(shí)從宏觀層面上看看我們目前在這場Data-Driven?或者Big Data潮流中的所處于的位置伐割,提前為未來的變化做好準(zhǔn)備候味。本篇文章僅僅代表個(gè)人觀點(diǎn),與公司立場無關(guān)隔心。因?yàn)閭€(gè)人視角總會(huì)有所局限白群,也希望和大家有更多討論。
我在這一年里面接觸了各式各樣的企業(yè)硬霍。其中一些企業(yè)已經(jīng)張開雙臂積極迎接從IT-Centric到Business-Centric的轉(zhuǎn)變帜慢;一些企業(yè)仍然在門口徘徊不前,躊躇張望唯卖;當(dāng)然粱玲,也有一些企業(yè)采購了新的工具,但是依新酒瓶裝舊酒拜轨。從整體上來看抽减,我認(rèn)為2016年是自助式分析已在國內(nèi)崛起,這場崛起中機(jī)遇與風(fēng)險(xiǎn)并存橄碾。這篇文章主要會(huì)結(jié)合Garner近幾年里關(guān)于該話題的報(bào)告卵沉,BI領(lǐng)域產(chǎn)品的迭代創(chuàng)新方向等內(nèi)容來談。文章最后會(huì)分享此篇文章內(nèi)引用內(nèi)容的鏈接法牲。
一史汗、自助式分析的崛起
1.1 矛盾越來越強(qiáng)烈,源于業(yè)務(wù)方的需求
越來越多源數(shù)據(jù)拒垃,越來越復(fù)雜多變的業(yè)務(wù)場景停撞,傳統(tǒng)瀑布式的BI開發(fā)流程不能滿足當(dāng)下的業(yè)務(wù)需求。主要的矛盾點(diǎn)體現(xiàn)在三個(gè)方面悼瓮,從業(yè)務(wù)人員角度來說:一方面和IT或者分析師溝通成本高戈毒,一方面需求滿足時(shí)間久。從數(shù)據(jù)分析師的角度來說:因?yàn)闃I(yè)務(wù)的需求不能被IT及時(shí)滿足谤牡,業(yè)務(wù)分析師變?yōu)闃I(yè)務(wù)部門的提數(shù)機(jī)器,沒有精力去探索挖掘更有價(jià)值的數(shù)據(jù)信息姥宝。
1.2 基礎(chǔ)數(shù)據(jù)模型固化與計(jì)算能力提升翅萤,讓自助分析行為成為可能
當(dāng)然市場里僅僅有矛盾和需求還不足夠,仍然需要有供給讓這一行為變得可能。隨著越來越多的基礎(chǔ)數(shù)據(jù)模型固化套么,例如Tableau將人們常用的維度和度量的組合輔之字段類型培己,給到用戶散點(diǎn)圖、折線圖胚泌、樹狀圖的智能推薦省咨;例如alteryx中將R語言常用的算法模型進(jìn)行了打包組件化,使用者只需要拖拽就能夠完成一個(gè)預(yù)測分析玷室。再從計(jì)算能力上來說零蓉,往往我們在本地電腦上打開一個(gè)上十萬的Excel文件就已經(jīng)痛苦不已,到如今你可以在自己電腦上處理到千萬級(jí)別的數(shù)據(jù)穷缤。計(jì)算能力的提升也使得用戶的需求能夠更好被滿足敌蜂。
1.3 權(quán)威第三方的趨勢判斷與評(píng)測
此外津肛,Garner早在2015年2月就在文章里預(yù)測了這一趨勢章喉,說道:“Traditional business intelligence (BI) and analytic models are being disrupted as the balance of power shifts from IT to the business.傳統(tǒng)的BI產(chǎn)品格局在因?yàn)镮T去中心化,以業(yè)務(wù)用戶驅(qū)動(dòng)的轉(zhuǎn)變中發(fā)生劇烈震蕩”身坐,包括在今年年初發(fā)布的BI產(chǎn)品魔力四象評(píng)價(jià)中更突出了該變化秸脱。并且Gartner預(yù)測,到2017年企業(yè)里面絕大部分的業(yè)務(wù)用戶部蛇,將會(huì)使用自助分析工具來處理分析他們的數(shù)據(jù)回答業(yè)務(wù)問題摊唇。
二、自助式分析的機(jī)遇
2.1 對(duì)于企業(yè)的機(jī)遇
更多人:大數(shù)據(jù)平民化
自助式分析將會(huì)促成企業(yè)更多人能夠接觸并從數(shù)據(jù)中挖掘出價(jià)值搪花,換一個(gè)角度說遏片,也就是這些年常提的大數(shù)據(jù)平民化。大到公司戰(zhàn)略小到一個(gè)簡單的推廣渠道判斷撮竿,讓數(shù)據(jù)講話吮便,不再拍腦袋做決策。
更快速:拖拽性操作簡單快速
當(dāng)下的BI產(chǎn)品幢踏,無論是做數(shù)據(jù)準(zhǔn)備還是到可視化髓需,基本上都可以通過簡單拖拽方式進(jìn)行使用,并且產(chǎn)品本身也有一些固化的模型和推薦房蝉,讓用戶的從獲得數(shù)據(jù)到得到洞察變得更快速.
更深入:更深挖掘數(shù)據(jù)價(jià)值
業(yè)務(wù)人員可以自助回答問題后僚匆,將數(shù)據(jù)科學(xué)家和分析師從日常業(yè)務(wù)問題的瑣碎事物中脫身,從而有更多精力放到數(shù)據(jù)探索和挖掘的項(xiàng)目中搭幻。
2.2 對(duì)于個(gè)人的機(jī)遇
那這種自主數(shù)據(jù)分析的崛起咧擂,對(duì)個(gè)人而言的要求有哪些呢?毫無疑問它降低了我們?nèi)藛T的技術(shù)需求檀蹋,但是卻對(duì)于我們識(shí)別松申、判斷問題和解決問題的能力提出了更高要求。拿我比較熟悉的兩個(gè)產(chǎn)品來說,Tableau的使用很容易贸桶,的確是拖拽甚至雙擊就可以把數(shù)據(jù)的計(jì)算結(jié)果以可視化的方式呈現(xiàn)在我們的視野里舅逸。然而,我們卻絕大時(shí)候發(fā)現(xiàn)皇筛,當(dāng)我們把各路的報(bào)表簡單的拽到一個(gè)儀表盤上后琉历,信息依舊是凌亂的散落在一個(gè)個(gè)可視化視圖里。再到Alteryx水醋,它的使用可能更簡單旗笔,就是拖拽組件搭成工作流,產(chǎn)品功能不再是你處理數(shù)據(jù)里需要花很多時(shí)間去學(xué)習(xí)的瓶頸离例,真正的瓶頸是你用一個(gè)怎樣的邏輯搭建這個(gè)工作流换团,同樣一個(gè)input 和output data,可能只需要四五個(gè)組件工作流搞定宫蛆,同樣十幾個(gè)組件的工作流組件也能搞定艘包。我在下方列出了一些能力要求及變化,供大家參考:
技術(shù)能力:SAS耀盗,Python想虎,R等coding語言不再是瓶頸
統(tǒng)計(jì)模型:模型使用不難,不同問題的模型選擇成為瓶頸
業(yè)務(wù)能力:識(shí)別業(yè)務(wù)問題叛拷,判斷優(yōu)先級(jí)是瓶頸
可視化能力:數(shù)據(jù)可視化不難舌厨,但要會(huì)用圖表講故事是瓶頸
解讀與應(yīng)用:最關(guān)鍵的環(huán)節(jié),要求很高
三忿薇、自助式分析的風(fēng)險(xiǎn)
3.1 企業(yè)內(nèi)部缺乏相關(guān)培訓(xùn)
記得以前看過一個(gè)研究說裙椭,企業(yè)的組織、人員能力配備等方面往往總是趕不上技術(shù)的變化署浩。在這場變革中揉燃,我們也發(fā)現(xiàn)了這樣的現(xiàn)象。在引入自助分析上筋栋,第一步就是要找到合適的人群并且組織結(jié)合實(shí)際場景的培訓(xùn)炊汤。在開始階段,業(yè)務(wù)人員需要花費(fèi)額外的精力來掌握自助分析新工具弊攘,如果缺乏合適的引導(dǎo)和培訓(xùn)抢腐,也許因?yàn)楫a(chǎn)品使用場景錯(cuò)誤,例如把可視化產(chǎn)品用作了數(shù)據(jù)處理產(chǎn)品襟交。反而會(huì)在自助分析的推進(jìn)中適得其反迈倍。
3.2 沒有認(rèn)真甄選使用人員
其次,在自助分析文化推進(jìn)的關(guān)鍵捣域,還要特別特別注意甄選前幾批使用人員啼染。業(yè)務(wù)人員總會(huì)在技能醋界,背景素質(zhì),包括對(duì)企業(yè)內(nèi)部數(shù)據(jù)驅(qū)動(dòng)的理解和驅(qū)動(dòng)方面有所差異提完。認(rèn)真甄選第一批種子客戶,小規(guī)模的進(jìn)行推廣做出最佳實(shí)踐丘侠,之后再到公司范圍內(nèi)的推廣會(huì)更加順風(fēng)順?biāo)?/p>
3.3 數(shù)據(jù)管理問題暴露
假設(shè)這樣一個(gè)場景徒欣,一個(gè)剛剛上任的總監(jiān)需要從多個(gè)角度和層次去了解目前公司的銷售問題,而IT部門卻沒有辦法快速提供這樣的報(bào)表內(nèi)容蜗字,于是業(yè)務(wù)運(yùn)營人員使用自助分析工具快速完成了報(bào)表制作打肝,一天后就給到總監(jiān)一個(gè)滿意的答復(fù)。但是一個(gè)月后挪捕,總監(jiān)依舊通過這張報(bào)表了解經(jīng)營狀況粗梭,卻發(fā)現(xiàn)一些數(shù)據(jù)和實(shí)際經(jīng)營情況對(duì)不上,于是叫來業(yè)務(wù)人員追查原因级零。業(yè)務(wù)人員發(fā)現(xiàn)在自助分析端并沒有出現(xiàn)過調(diào)整断医,于是再從數(shù)據(jù)源的角度做問題排查,因?yàn)樗跀?shù)據(jù)源鏈接中使用了Salesforce奏纪,Google Analytics鉴嗤,Excel,MYSQL數(shù)據(jù)庫里面不同的數(shù)據(jù)源序调,也就意味著不同數(shù)據(jù)源需要一一排查醉锅。花了幾天的排查后最終發(fā)現(xiàn)那張從MYSQL數(shù)據(jù)庫里的表已經(jīng)好一陣沒有更新了发绢。原因在于因?yàn)镮T接入了新的業(yè)務(wù)系統(tǒng)后硬耍,創(chuàng)建了新表來替換原始的那張表,但這個(gè)信息并沒有及時(shí)通知到給業(yè)務(wù)部門边酒。換一個(gè)角度经柴,這件事情暴露了企業(yè)的數(shù)據(jù)管理制度安排沒有跟上自助分析推廣的變化。另一方面甚纲,也體現(xiàn)了對(duì)于適用于自助分析下的數(shù)據(jù)管理工具的需求口锭,后文談未來的模塊會(huì)另外介紹。
四介杆、自助式分析的未來
1 數(shù)據(jù)準(zhǔn)備
自助分析最先以數(shù)據(jù)可視化的姿態(tài)進(jìn)入到人們的視野鹃操,業(yè)務(wù)人員拿到處理好的數(shù)據(jù)進(jìn)行可視化分析,一些數(shù)據(jù)準(zhǔn)備的工作仍然掌握在IT部門的手中春哨,或者是業(yè)務(wù)人員自己費(fèi)時(shí)費(fèi)勁的手工處理荆隘。但往往一個(gè)數(shù)據(jù)分析項(xiàng)目里,將近有80%的時(shí)間花費(fèi)在數(shù)據(jù)準(zhǔn)備融合的工作里赴背,如何能夠真正加速這個(gè)環(huán)節(jié)也將成為提升業(yè)務(wù)人員工作效率的關(guān)鍵椰拒。Gartner預(yù)測在2017年將會(huì)越來越多的企業(yè)將把數(shù)據(jù)準(zhǔn)備內(nèi)容納入自助分析的模塊中晶渠,與此同時(shí),各大廠商也開始進(jìn)軍到數(shù)據(jù)準(zhǔn)備的領(lǐng)域燃观。例如:Tableau在2016用戶大會(huì)上正式對(duì)外宣布了自己的數(shù)據(jù)準(zhǔn)備產(chǎn)品項(xiàng)目褒脯,很有可能在明年就和大家見面。Talend也推出了自己做數(shù)據(jù)準(zhǔn)備模塊的產(chǎn)品缆毁。
2 數(shù)據(jù)管理
如上文風(fēng)險(xiǎn)模塊中所說自助分析推廣也將對(duì)企業(yè)內(nèi)部數(shù)據(jù)管理提出更高的要求番川。傳統(tǒng)的數(shù)據(jù)管理以政策法規(guī)驅(qū)動(dòng),IT為中心的來做統(tǒng)一的管理脊框。而在自助分析中颁督,將需要解決的兩個(gè)重要的數(shù)據(jù)管理問題:1.?在各種各樣的數(shù)據(jù)源中如何快速獲取到準(zhǔn)確的數(shù)據(jù)。?2.?IT如何更好的和業(yè)務(wù)協(xié)作浇雹。數(shù)據(jù)管理方面也有一些新興的產(chǎn)品沉御,如自稱要做數(shù)據(jù)查找領(lǐng)域的Google的Alation,將統(tǒng)計(jì)和機(jī)器學(xué)習(xí)運(yùn)用在數(shù)據(jù)搜索之中昭灵,比方說用戶如果需要尋找?shipment date這個(gè)字段吠裆,直接輸入即可,并不需要輸入數(shù)據(jù)庫的字段名字(shp_dte)烂完。同樣硫痰,針對(duì)于不同人群的搜索,可能返回結(jié)果也不同窜护,HR和CRM都輸入comp這四個(gè)字母的時(shí)候效斑,HR得到的提示為compensation,而CRM可能就是Compliant柱徙。在IT和業(yè)務(wù)方面協(xié)作方面缓屠,Tableau用戶經(jīng)常會(huì)在ad-hoc分析時(shí)候創(chuàng)建某些計(jì)算字段,而未來IT可以在背后看到用戶創(chuàng)建計(jì)算行為的數(shù)據(jù)护侮,再通過簡單拖拽或者其他方式將常用的計(jì)算字段固化到原始數(shù)據(jù)源敌完。
3 運(yùn)用更強(qiáng)大的處理能力
提升數(shù)據(jù)處理能力主要從兩方面來提升:一方面是更好利用分布式計(jì)算的能力。例如Bluedata提供了企業(yè)更簡單便捷的大數(shù)據(jù)部署的解決方案羊初,數(shù)據(jù)分析師或者數(shù)據(jù)科學(xué)家可以更自助而簡單的部署計(jì)算任務(wù)滨溉。另一方面是強(qiáng)化自身產(chǎn)品的數(shù)據(jù)引擎處理能力,如Tableau?收購了Hype?data engine长赞。
4. 組織內(nèi)或者行業(yè)性的知識(shí)沉淀
因?yàn)槠髽I(yè)內(nèi)部更多用戶使用自助性的平臺(tái)進(jìn)行數(shù)據(jù)分析洞察晦攒,平臺(tái)性的存在也讓企業(yè)內(nèi)部的知識(shí)沉淀和協(xié)作變得更加可能,想象下你可能是個(gè)新入職的員工得哆,不清楚新公司的數(shù)據(jù)情況脯颜,不清楚自己當(dāng)下部門里使用這些數(shù)據(jù)時(shí)候都在做哪些分析。但是當(dāng)你打開這個(gè)分析平臺(tái)界面贩据,你就能夠看到你們部門都在用哪些數(shù)據(jù)栋操,哪些數(shù)據(jù)有過權(quán)威人士的標(biāo)注闸餐,包括這些數(shù)據(jù)表之間平時(shí)如何關(guān)聯(lián)應(yīng)用,成品儀表板的樣式等等矾芙。
最后舍沙,引用一段Harvard Business Review 對(duì)這一轉(zhuǎn)型趨勢評(píng)價(jià)的一段話:“We’re in the middle of a significant shift in the way organizations blend and analyze data, affecting not only the way decisions are made, but also how businesses operate. Data analysts in the line of business, who formerly had no choice but to rely on highly skilled, highly paid data scientists for data access, can now take advantage of self-service technologies to achieve analytic independence. These technologies enable practically anyone—regardless of their technical proficiency—to be a data analyst and make data-driven business decisions.”
我們當(dāng)下站在一個(gè)企業(yè)使用分析數(shù)據(jù)的轉(zhuǎn)折點(diǎn)上,該轉(zhuǎn)變不僅僅會(huì)影響企業(yè)的決策方式剔宪,也將影響業(yè)務(wù)的運(yùn)轉(zhuǎn)方式场勤。眾所周知,數(shù)據(jù)分析這件事情應(yīng)該和商業(yè)結(jié)合的更緊密歼跟,然而這件事卻因?yàn)樾枰魇礁鳂拥募夹g(shù)使得我們不得將業(yè)務(wù)和分析這樣兩個(gè)環(huán)節(jié)割裂進(jìn)行分工。而現(xiàn)如今格遭,得益于技術(shù)的發(fā)展讓我們每個(gè)人不再會(huì)因?yàn)榧夹g(shù)而成為我們使用數(shù)據(jù)的瓶頸哈街,從而實(shí)現(xiàn)真正的數(shù)據(jù)驅(qū)動(dòng)企業(yè)決策。
本文參考內(nèi)容:
1.http://www.tableau.com/zh-cn/node/63220?from=timeline&isappinstalled=0
2.http://mp.weixin.qq.com/s/AlgTI1gPg9_apXsREFJ8bg
3.https://www.tableau.com/sites/default/files/whitepapers/enabling_governance_for_insight_0.pdf
4.http://www.gartner.com/newsroom/id/2970917
5.http://blogs.gartner.com/merv-adrian/2016/10/19/symposium-notes-day-two-jumps-in-the-data-lake/