每當(dāng)有人問我是做什么工作的時(shí)候鹿驼,很難和人解釋清楚數(shù)據(jù)分析是做什么的,用專業(yè)詞匯吧大多數(shù)人聽不懂坚洽,解釋成賣軟件吧感覺很low“聘現(xiàn)在很多新型名詞的發(fā)明讓信息社會(huì)更復(fù)雜笛质。不擅長過度包裝自己,不擅長不要臉的說自己是數(shù)據(jù)科學(xué)家捞蚂,有充足的自知之明知道自己只是個(gè)“算命”的妇押。
一轉(zhuǎn)眼2017已經(jīng)快過去了四分之一,風(fēng)云巨變的第一季度姓迅,只有不停地提升自己來應(yīng)萬變敲霍,本次就說說如何更好地做個(gè)“算命”的俊马。
(以下僅代表作者個(gè)人觀點(diǎn),如有雷同肩杈,純屬瞎編)
在剛接觸這個(gè)行業(yè)的時(shí)候柴我,正在看一部美劇《Mentalist》,靈媒男主Patrick的神算子的本事正是做好數(shù)據(jù)分析的完美方案扩然。
1
數(shù)據(jù)搜集
每次Patrick 協(xié)助CBI破案時(shí)候艘儒,數(shù)據(jù)搜集是第一步,也是最重要的一步与学。Patrick利用強(qiáng)大的讀心術(shù)搜尋所有的案發(fā)現(xiàn)場細(xì)節(jié)及人物表情變化彤悔。
在數(shù)據(jù)分析行業(yè)想做出好效果嘉抓,數(shù)據(jù)搜集是至關(guān)重要的索守。很多時(shí)候聽到客戶說,你們能做*蝶/*友/*軟/*乾那種三大報(bào)表么抑片?心里是一萬只“羊駝”跑過卵佛。老掉牙的表格都看了十幾年了,估計(jì)報(bào)表都看膩你了敞斋,再做一套你是何居心截汪?猴子請來的逗逼么?
財(cái)務(wù)/HR/CRM/OA等系統(tǒng)是最好的內(nèi)部數(shù)據(jù)搜集節(jié)點(diǎn)植捎,勉強(qiáng)算上數(shù)據(jù)分析的一條根須衙解。好的數(shù)據(jù)分析是要做好內(nèi)外部數(shù)據(jù)的搜集,對外部數(shù)據(jù)(如互聯(lián)網(wǎng)數(shù)據(jù))焰枢,財(cái)大氣粗的金主可以從IDC/Gartner按需購買蚓峦。手頭暫緊的可以考慮免費(fèi)的火車頭/八爪魚一類免費(fèi)工具。
2
數(shù)據(jù)準(zhǔn)備
做完數(shù)據(jù)搜集济锄,下一步是重中之重暑椰,做數(shù)據(jù)準(zhǔn)備。以前的專業(yè)名字叫ETL荐绝,高大上的一頭霧水一汽,用數(shù)據(jù)準(zhǔn)備來闡述很好理解。多源化的信息時(shí)代必須要去糟粕取精華低滩。好的數(shù)據(jù)質(zhì)量直接決定了價(jià)值體現(xiàn)召夹。就算是Mentalist里面的靈媒Patrick也不是所有都去聽都去看。
專業(yè)數(shù)據(jù)準(zhǔn)備領(lǐng)域的高大上軟件Informatica/Kxen/Talend/Syncsort等咱們玩不轉(zhuǎn)恕沫,可以嘗試下易用性較高的產(chǎn)品监憎,如自帶ETL功能的Qlik產(chǎn)品,以及EBI Portal中的EDP模塊昏兆,可以讓使用者像玩游戲一樣進(jìn)行數(shù)據(jù)準(zhǔn)備清洗轉(zhuǎn)換枫虏。
3
模型構(gòu)建
如果你的數(shù)據(jù)和下圖一樣妇穴,想必Parick也無可奈何。人腦雖然有著強(qiáng)大的存儲(chǔ)和模型搭建本能隶债,但是畢竟超人Lucy只有一個(gè)腾它,作為凡人只能用其他方式解決。
搭建合適的模型是讓分析更加準(zhǔn)確的基石死讹,企業(yè)大多數(shù)已經(jīng)具備了數(shù)據(jù)倉庫/數(shù)據(jù)庫瞒滴,部分企業(yè)已經(jīng)有了大數(shù)據(jù)平臺(tái)。但是信息量爆炸的年代赞警,很難知道未來會(huì)發(fā)生什么妓忍。很多時(shí)候你會(huì)發(fā)現(xiàn)有些數(shù)據(jù)還來不及入到數(shù)據(jù)倉庫中,行業(yè)規(guī)則已經(jīng)都變了愧旦。所以必須有快速的響應(yīng)機(jī)制讓不同來源的數(shù)據(jù)在數(shù)據(jù)分析時(shí)搭建好合適的模型世剖。在眾多的數(shù)據(jù)分析工具中強(qiáng)烈推薦Tableau、Qlik產(chǎn)品笤虫,該產(chǎn)品可以快速按需搭建和Cube一樣的分析主題模型旁瘫,并且可以快速更改和添加。
4
數(shù)據(jù)分析
一切準(zhǔn)備好了琼蚯,接下來就是點(diǎn)燃引線的時(shí)機(jī)酬凳。
工作這么久,光數(shù)據(jù)分析產(chǎn)品已經(jīng)用了N種遭庶,
Qlik/Oracle DV/Tableau/Microstrategy/PowerBI/Sisence/Spotfire/DOMO等等宁仔。
最易用的是Oracle DV,傻瓜式的教程來把數(shù)據(jù)可視化峦睡,更易理解翎苫。而且美觀性也絕對杠杠的。
最強(qiáng)大的是Excel赐俗,基本就是為了數(shù)據(jù)分析而生的拉队,但是最大的限制是要自己錄入一些數(shù)據(jù)。
折中的是Qlik產(chǎn)品阻逮,讓使用者可以像Oracle DV一樣簡單操作粱快,又和Excel一樣強(qiáng)大。
低頭族增多的社會(huì)叔扼,值得一提的是亦策軟件推出了完美的微信平臺(tái)方案事哭,讓你的分析報(bào)告放到微信中,讓數(shù)據(jù)分析隨時(shí)隨地瓜富。
低頭累了就抬頭看看大屏展示吧鳍咱!他們的數(shù)據(jù)分析方案總是站在客戶角度出發(fā)的。
雖然PowerBI也在崛起与柑,但是無奈太容易崩潰谤辜。用著用著蓄坏,咣~退出了。
國內(nèi)的某些產(chǎn)品丑念?我就呵呵了涡戳,太花瓶產(chǎn)品。
數(shù)據(jù)可視化部分推薦參考一下Information is beautiful 網(wǎng)站脯倚,好的展示效果全在里面了渔彰。
5
分析思維
好的分析思維直接影響結(jié)果,Parick正是有著不同常人的閱歷和飛速的大腦才可以幫助CBI挖掘隱藏的證據(jù)推正,解決一個(gè)又一個(gè)的棘手案件恍涂。
部分可視化工具只是一個(gè)理解數(shù)據(jù)的載體,重要的是分析思維植榕。不然真的是堆了一堆圖表糊弄眼球了再沧。好的工具可以聯(lián)動(dòng)數(shù)據(jù)讓分析人員得到下一步的信息提示,不好的工具只會(huì)浮出標(biāo)簽告訴你現(xiàn)在是什么内贮。
在數(shù)據(jù)分析時(shí)必要地引入一些前人的分析思維产园,什么五力分析汞斧、RFM/RFE模型夜郁、量本利分析、德爾莫非粘勒、KT決策竞端、6Sigma、克強(qiáng)指數(shù)等等庙睡。
也強(qiáng)烈建議引入數(shù)據(jù)挖掘事富,SAS咱們買不起,一個(gè)模型好幾萬美金一年乘陪,Alteryx/Lavastorm總可以試試统台,個(gè)人版也不貴。勤快點(diǎn)的小伙伴自己玩玩R/Spark一類的開源軟件吧啡邑。
在數(shù)據(jù)分析這個(gè)行業(yè)懶惰是最要不得的贱勃,無論眼下取得如何成績,學(xué)習(xí)新知識一定要和藥一樣不能停谤逼。社會(huì)永遠(yuǎn)是個(gè)人的老師贵扰,只有不停的學(xué)習(xí)才不會(huì)被時(shí)代落下。
在這兒推薦一本書《贏取競爭的100+N工具箱》 流部,有興趣的小伙伴可以讀一下戚绕。
6
自信心
自信心是最最重要的一點(diǎn),沒有自信枝冀,說什么都是鬧著玩舞丛。但是自信不是自大耘子!一切的自信都是基于自身的本事,一個(gè)人如果不清楚自身具備什么素質(zhì)球切,盲目的飄飄然拴还,遲早淪為街頭的浮塵。
本文最后祝各位“算命”的早日成為獵頭的寵兒欧聘。AI尚未呈現(xiàn)“奇點(diǎn)”的黃金時(shí)機(jī)片林,一起加油吧!
本文作者:李德宇