"數(shù)據(jù)分析師” 這個title可太火了,乍一看好像是那種禿頭學(xué)霸奧賽得主才能干的活兒奋姿,既要懂?dāng)?shù)學(xué)理論锄开,又得會用專業(yè)的工具如SAS或者python。但隨著我近兩個月了解下來胀蛮,目前市面上招的“數(shù)據(jù)分析師”初級崗(1-3年經(jīng)驗)院刁,絕大多數(shù)還是表哥表姐那一類糯钙,當(dāng)然不是看不上表哥表姐粪狼,畢竟很多人想做都不一定有機會退腥。但至少說明了,即使沒有很匹配的專業(yè)背景和崗位經(jīng)驗再榄,也可以在很短的時間內(nèi)明白DA在做什么狡刘,大概需要哪些方面的知識+技能,才能有針對性的準(zhǔn)備面試困鸥。
先說下本人背景嗅蔬,雙非院校經(jīng)濟類研究僧,本科信管疾就。畢業(yè)后第一份工作是某行業(yè)TOP互聯(lián)網(wǎng)企業(yè)的運營崗澜术,至于運營崗是做什么的,不同事業(yè)部之間可能天差地別猬腰,我的工作內(nèi)容要硬說和數(shù)據(jù)分析有什么關(guān)聯(lián)鸟废,那就是做日報和偶爾對運營情況做簡單匯報,其實在大廠里不少運營崗的小伙伴的綜合能力也能勝任初級數(shù)據(jù)分析師工作內(nèi)容姑荷。說回我自身的情況盒延,我對數(shù)據(jù)還是很感興趣的,也覺得自己的能力對于目前的崗位是over qualify了鼠冕,而且看不到在當(dāng)前崗位上的發(fā)展前景添寺,收入也微薄的可憐,甚至還有下降的趨勢(行情不好導(dǎo)致獎金減少)懈费,于是就打算轉(zhuǎn)向?qū)B殧?shù)據(jù)分析師崗位计露!首先崗位名稱就比什么運營好多了,別人至少從字面能理解你大概做什么類型的工作憎乙;其次從各大招聘平臺發(fā)布的啟事薄坏,同崗位年限的數(shù)分薪資也要比運營高(就別拿什么運營總監(jiān)/COO說事兒了,對底層打工人沒有參考意義)寨闹;其三胶坠,對我個人挺重要的,就是數(shù)分這類工種的學(xué)習(xí)路線非常多而且具體繁堡,不管是向業(yè)務(wù)專家還是數(shù)據(jù)科學(xué)方向前景都不錯沈善,雖然我已經(jīng)找到對應(yīng)的工作了,此刻也不能預(yù)測自己三五年后會偏向哪個方向椭蹄,但我對高級數(shù)分所需要的知識和技能都還學(xué)的進去闻牡,只是需要多一點時間。
接下來是本人自學(xué)內(nèi)容介紹绳矩,首先聲明下我本人是個學(xué)渣罩润,學(xué)習(xí)能力不算好,要說有什么長處翼馆,可能就是有自己的一套靈活學(xué)習(xí)方法割以,所謂的靈活學(xué)習(xí)金度,就是每門知識或技術(shù),只學(xué)到剛剛?cè)腴T严沥,知道是什么猜极,為什么,(別人)怎么做,就可以了,然后剩下的時間趕緊入門別的模塊的知識任洞,就像拼圖一樣查牌,我不會一張一張的選,而是先對各個部分大概有什么心里有個數(shù),再盡量把各個部分填滿。這不是嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)方法,更多的是一種為了快速找到匹配工作的手段辞色,畢竟我覺得自己最欠缺的還是一份工作經(jīng)驗,而不是理論知識浮定。
第一步是SQL相满,可能有些人會覺得應(yīng)該先學(xué)概率數(shù)理統(tǒng)計打好基礎(chǔ)。emmm怎么說呢桦卒,我覺得能下決心做數(shù)據(jù)分析師的人應(yīng)該不會在概率統(tǒng)計這塊完全0基礎(chǔ)吧立美,而且一開始就學(xué)純理論知識很容易讓人想放棄,但SQL就不一樣了方灾,安裝個Mysql建蹄,在配置好的環(huán)境下寫一句"select * from table"就能立即體驗所謂的“取數(shù)”成就。雖然不是每個數(shù)分都要自己從數(shù)據(jù)庫里查數(shù)裕偿,但SQL能力幾乎已經(jīng)是數(shù)分甚至運營崗的標(biāo)配洞慎。不用學(xué)的多深,一本MICK的《SQL基礎(chǔ)教程》和Ben的《Mysql必知必會》嘿棘,在電腦前刷完查數(shù)的基本語句即可(話說到現(xiàn)在我已經(jīng)忘得差不多了劲腿,基本上只在筆試的時候用過)
花了一周多的時間粗略地看完SQL,就開始試用Tableau(不用Powerbi是因為我的筆記本是macOS)鸟妙,其實這個軟件我到現(xiàn)在也沒有玩的很明白焦人,但還是厚顏無恥的在簡歷上寫會用。最直觀的感受就是圖表多樣化而且比excel好看重父,我上手去學(xué)也只是因為看招聘JD上多次出現(xiàn)花椭。下載Tableau試用版,搭配官方提供的supermarket案例數(shù)據(jù)集房午,自己鼓搗一下午矿辽,知道是怎么回事兒就行,沒必要花太多時間在BI軟件上。
學(xué)完SQL和所謂的可視化神器Tableau袋倔,我頓時覺得信心爆棚雕蔽,心想自己應(yīng)該達到一些初級崗的門檻了吧(實際上也有很多初級數(shù)分甚至不需要工作經(jīng)驗)。于是我開始向python發(fā)起沖鋒奕污。都說life is short, you need python萎羔,這玩意兒在學(xué)生時代就多次聽到液走,這么多年過去了不僅熱度不減碳默,幾乎已經(jīng)成為大廠或者高級數(shù)分崗的標(biāo)配,必須學(xué)缘眶!但我此時犯了一個很致命的錯誤嘱根,就是不重視基礎(chǔ),覺得python就是調(diào)用各種現(xiàn)成庫(可能也確實如此吧只是現(xiàn)階段自己基礎(chǔ)太差有庫也用不好)巷懈,迫不及待的想要做網(wǎng)絡(luò)爬蟲该抒,可視化輸出項目,結(jié)果自然是鎩羽而歸顶燕,除了在網(wǎng)上COPY別人的代碼自己跑一遍凑保,幾乎寫不出幾句有用的。現(xiàn)在我的書架上有《python網(wǎng)絡(luò)爬蟲權(quán)威指南》《python實戰(zhàn)之?dāng)?shù)據(jù)庫應(yīng)用和數(shù)據(jù)獲取》《利用python進行數(shù)據(jù)分析》涌攻,但就沒有一本從零介紹python入門的欧引,這跟我的浮躁心態(tài)有關(guān),很難一步一個腳印地去打好基礎(chǔ)恳谎,也和現(xiàn)實因素有關(guān)芝此,我的現(xiàn)階段目標(biāo)是盡快找到工作,而不是成為一個理論大師因痛。
雖然python入門受挫婚苹,但還是找到了一些好玩的東西,比如可視化圖表包pyechart鸵膏,如果說枯燥的代碼和死板的matplotlib包總讓我昏昏欲睡膊升,那么可交互、能實現(xiàn)各種狂拽酷炫的圖的pyechart無疑是學(xué)習(xí)python數(shù)分過程中的興奮劑谭企,結(jié)果就造成了用僧,我只有在需要做一些好看的chart的時候才會用到Python.
大約離職一個月后,也面了三四家企業(yè)的數(shù)據(jù)分析師崗位以后赞咙,開始意識到上面學(xué)的那些都只是皮毛中的皮毛责循,而且自己雖然學(xué)過概率、統(tǒng)計攀操、線代之類的課程院仿,但稍微進階一點的理論就已經(jīng)在腦海中形成不了清晰的認(rèn)識了。而只會所謂的工具,而沒有業(yè)務(wù)分析sense的話歹垫,面試官可能會覺得我是想往技術(shù)員方向發(fā)展而非業(yè)務(wù)分析方向剥汤。但是在沒有經(jīng)驗的前提下,意識哪能這么容易說提升就提升呢排惨?糾結(jié)之下我還是決定把大學(xué)時期學(xué)過的數(shù)理分析理論梳理一下吭敢,然后通過一些理論結(jié)合自己過去的一些經(jīng)驗,思考這些理論是否能在一些具體的問題上有應(yīng)用暮芭。在書店找了本《IBM SPSS MODELER 數(shù)據(jù)挖掘權(quán)威指南》鹿驼,覺得里面提到的方法和案例都很熟悉,就從頭看了一遍辕宏,而且SPSS這類建模軟件確實好用畜晰,能經(jīng)濟實惠且最快速地帶我走一遍數(shù)學(xué)建模和計算過程。重點掌握下回歸分析就可以了瑞筐,其他更高深的算法先過一遍凄鼻,知道是怎么回事就行,以后慢慢學(xué)習(xí)聚假。