- Author: 杜七
- Date: 2016.06.03
回答朋友關(guān)于『數(shù)據(jù)分析』的幾個問題,匯總于此栖茉。
1篮绿,市場和環(huán)境
『問』:
1)現(xiàn)在一線城市和二線城市的數(shù)據(jù)分析師真有像報告上所說的那么稀缺嗎?現(xiàn)在的行情是怎樣的呢吕漂?
2)數(shù)據(jù)分析師日常的工作是什么亲配?分為哪幾類?傳統(tǒng)公司和互聯(lián)網(wǎng)的數(shù)據(jù)分析師工作有什么不同點嗎?
<u>杜七『答』:</u>
-
1)目前『數(shù)據(jù)分析師』這個JOB 確實有缺口吼虎,為什么呢犬钢?這個由『數(shù)據(jù)分析師』本身工作特性決定:
- 『數(shù)據(jù)分析師』,『數(shù)據(jù)』+『分析』+『師』思灰,這個意味著從業(yè)者需要懂『數(shù)據(jù)』玷犹,也要會『分析』,到了『師』的境界洒疚,說明有一定的經(jīng)驗積累歹颓。一般的大學應(yīng)屆畢業(yè)生,大學里面沒有類似的專業(yè)油湖,懂計算機的不懂數(shù)據(jù)巍扛,懂數(shù)據(jù)的計算機技能差點,懂數(shù)據(jù)和計算機的邏輯性不好乏德,最大的一個問題是撤奸,很多同學對于『定義問題』,『分析問題』喊括,『思考問題』等基本的能力胧瓜,都不具備,更別問『具體的市場郑什,或者業(yè)務(wù)的分析和經(jīng)驗』府喳,所以,應(yīng)屆畢業(yè)生中『統(tǒng)計學』專業(yè)的相對靠近『數(shù)據(jù)分析師』的基本技能蹦误,但是,也僅僅是技能上的靠近肉津。如果畢業(yè)以后不從事這個行業(yè)强胰,以后想轉(zhuǎn)行做這個行業(yè),就相對困難一點妹沙,畢竟偶洋,『隔行如隔山』。另外距糖,上面也側(cè)面提到了玄窝,『數(shù)據(jù)分析師』需要具備很多技能,這個比JAVA開發(fā)工程師這樣相對單一技能來說悍引,要復雜一點恩脂,所以,這個也是『數(shù)據(jù)分析師』缺的一個原因趣斤。
- 另外俩块,大數(shù)據(jù)火熱的時間比較短,頂多3-5年左右。應(yīng)屆畢業(yè)生供求少玉凯,相應(yīng)的從業(yè)人才比較少势腮,又加上最近言必稱數(shù)據(jù),公司更是想盡辦法跟大數(shù)據(jù)沾邊漫仆,對于數(shù)據(jù)人才需求量大捎拯。尤其是互聯(lián)網(wǎng)公司的發(fā)展太快,互聯(lián)網(wǎng)公司對于數(shù)據(jù)人才的需求更大盲厌。儲備少 VS 需求大署照,自然就有缺口了。
- 目前數(shù)據(jù)分析的行情狸眼,不同的公司和職位有不同的情況藤树,大概介于『運營、產(chǎn)品』和『開發(fā)』之間吧拓萌。
-
2)
- 傳統(tǒng)互聯(lián)網(wǎng)公司我沒有待過岁钓,不敢說了解。但是從我自己對于『數(shù)據(jù)分析師』的了解微王,我猜除了分析和研究的業(yè)務(wù)有不同屡限,本質(zhì)上沒有差別。舉個例子炕倘,A股是傳統(tǒng)企業(yè)公司钧大,美股是互聯(lián)網(wǎng)公司,2個股市不一樣罩旋,但是啊央,作為一名投資者,對于『基本面』涨醋、『資金面』和『情緒面』的研究方法瓜饥,邏輯推理,投資方法浴骂,我覺得是一樣的乓土,不會有差異。但是溯警,涉及到具體的A股和美股不同的股市趣苏,具體操作的時候,會一些區(qū)別梯轻。古話說:萬變不離其宗 食磕。
- 數(shù)據(jù)分析師日常工作,大概有如下的幾方面(當然喳挑,各公司業(yè)務(wù)發(fā)展階段不同芬为,稍有差異)萄金,核心都是圍繞『數(shù)據(jù)』,挖掘其價值:
- 提供基礎(chǔ)報表媚朦,滿足基礎(chǔ)需求
- 分析業(yè)務(wù)和產(chǎn)品氧敢,提供業(yè)務(wù)運營和產(chǎn)品優(yōu)化建議
- 提供戰(zhàn)略分析和戰(zhàn)略性報告
- 開發(fā)數(shù)據(jù)產(chǎn)品
- 基本的工作是前三個,后面一個數(shù)據(jù)產(chǎn)品開發(fā)询张,主要是數(shù)據(jù)產(chǎn)品經(jīng)理去做的孙乖,但是也不一定》菅酰可能是分析師提需求唯袄,其他人去做。
2蜗帜,技能
問:
1)我目前比較熟悉 Python 的基礎(chǔ)數(shù)據(jù)包(Numpy恋拷,Pandas,Matplotlib 等)和 Linux Shell厅缺,Keynote蔬顾、AI、Ps 做報告展現(xiàn)也沒啥問題湘捎,做過 5 年銷售诀豁,一年風投經(jīng)理,但數(shù)學和統(tǒng)計較弱窥妇,英語也一般舷胜,能找到合適的數(shù)據(jù)分析工作嗎?
2) 數(shù)據(jù)分析從入門到進階的路線是什么活翩?核心技能是什么呢烹骨?至少要懂那些東西才能上手干活?
3) SQL 在數(shù)據(jù)分析工作很重要嗎材泄?常用的 SQL 工具有哪些呢沮焕?
4)數(shù)據(jù)挖掘和數(shù)據(jù)分析的區(qū)別是什么呢?做數(shù)據(jù)分析一定要懂數(shù)據(jù)挖掘嗎脸爱?需要懂到什么程度呢遇汞?
<u>杜七『答』:</u>
- 1)『數(shù)據(jù)分析師』職位未妹,也有初簿废、中、高級的區(qū)分络它,比如你去阿里巴巴崗位搜索『數(shù)據(jù)分析師』族檬,會有『數(shù)據(jù)分析師』,『數(shù)據(jù)分析專家』等區(qū)分化戳,所以单料,要求不也有埋凯,對于求職者的技能要求也不一樣。會Python扫尖,不是優(yōu)勢白对,反而你做過『一年風投精力』會給你的經(jīng)歷增色,為什么呢换怖?一個好的數(shù)據(jù)分析師甩恼,一定是一個『商業(yè)分析家』,正確的定義問題沉颂,思考問題条摸,找到解決辦法,才是一名合格的分析師需要具備的技能铸屉。所以钉蒲,你肯定可以找到一份數(shù)據(jù)分析的工作。
- 2)說到『從入門到進階的路線』彻坛,我個人覺得沒有一個明確和固定的路線顷啼,不像JAVA,從看《think in java》開始小压,到《如何治療頸椎病》結(jié)束线梗。每個人都會『分析』,都有想法怠益,也都有自己的『看法』仪搔。不過,分析師需要具備的技能蜻牢,看值得分析師新同學關(guān)注的“軟技能”烤咧!這篇文章吧。這個是我自己的個人經(jīng)驗總結(jié)抢呆,期望對你有幫助煮嫌。
-3)SQL主要是用來做數(shù)據(jù)提取的。目前公司的數(shù)據(jù)抱虐,很多都放在數(shù)據(jù)庫昌阿,比如MySQL,mangoDB恳邀,等等懦冰;如果是ODPS,HIVE,也是sql提取谣沸,所以刷钢,這種情況讓別人覺得SQL很重要。其實乳附,SQL也是一個技能内地。我們做數(shù)據(jù)分析阱缓,必須要把數(shù)據(jù)提取出來清焕,這個是第一步。提取出來以后,再分析突雪,是第二步问词。其實激挪,在阿里巴巴這么高大上的公司垄分,一個分析師會SQL+EXCEL+PPT叫倍,基本就可以把活干完了吆倦。相信么瞻赶? 所以璧南,只要會SQL的基本語法篓像,會寫SQL代碼盒粮,寫個1W行,基本SQL就不是問題了丹皱。 - 4)數(shù)據(jù)分析和數(shù)據(jù)挖掘宋税,廣義的『數(shù)據(jù)分析』包括了數(shù)據(jù)挖掘,狹義的說呢杰赛,它們的目的一樣呢簸,都是挖掘數(shù)據(jù)的價值乏屯,但是過程和方法不一樣啸箫。『數(shù)據(jù)挖掘』偏重研究數(shù)據(jù)中的規(guī)律和模式南缓,規(guī)律胸遇、模式一定要通過工具來挖掘;『數(shù)據(jù)分析』一般分析目標相對明確汉形,從數(shù)據(jù)得到一些信息纸镊,不用那么深的規(guī)律的探討倍阐。做數(shù)據(jù)分析,不一定非要懂那么多數(shù)據(jù)挖掘的算法逗威,或者機器學習峰搪。當然,技多不壓身凯旭,懂的東西越多越好概耻。至于具體的一個『業(yè)務(wù)問題』的分析,一般不會涉及到復雜的『數(shù)據(jù)挖掘』罐呼,統(tǒng)計方法就夠了鞠柄。
3,其他
問:
- 1)這個書單和學習計劃怎么樣嫉柴? https://www.zhihu.com/question/29265587/answer/44010658
-2)會 Python 還需要學 R 嗎春锋?他們在做數(shù)據(jù)分析時各自的優(yōu)劣是什么呢?
<u>杜七『答』:</u>
- 1)這個書單和計劃差凹,怎么說呢期奔,挺完美。但是危尿,要看完這些書呐萌,學會這些技術(shù),消化掉谊娇,很難趣倾。之前值得分析師新同學關(guān)注的“軟技能”菲饼!的文章里面我也推薦了一個書單,我覺得分析師的核心技能,還是『軟技能』方面的昼蛀,比如兽间,正確定義問題卖氨,分析問題朝刊,找到問題的串聯(lián)點,怎么樣去解決問題半等,如何正確的思考問題揍愁,這些才是分析師的『核心技能』。所以杀饵,我特別贊同查理芒格說的一句話:『不要做一名股票分析家莽囤,而要做一名商業(yè)分析家』。分析師亦然切距。 我個人覺得完美的學習計劃朽缎,不如這樣。找一家公司的IPO報告,然后仔細的研究這個IPO的報告话肖,研究這個公司的發(fā)展和變化北秽,以及股票的變化,思考一些問題狼牺。用到了分析的軟件,就去學習礼患,學完了立馬使用它去研究IPO報告是钥,等等。這種方法缅叠,比看XX軟件學習技能好多了悄泥。
- 2)Python和R,一把是倚天劍肤粱,一把是屠龍刀弹囚。兩個都好。在高手那里领曼,它們沒有半點區(qū)別鸥鹉。不用糾結(jié)。精通一個就夠用了庶骄。大部分的問題分析毁渗,用不到邏輯回歸和機器學習。
4单刁,總結(jié)
其實灸异,朋友問的幾個問題,基本涉及了『數(shù)據(jù)分析師』技能技能羔飞,工作內(nèi)容肺樟,成長路線等等,這里簡單再總結(jié)一下:
- 數(shù)據(jù)分析師逻淌,工作涉及到『數(shù)據(jù)提取』么伯,『數(shù)據(jù)整理』,『數(shù)據(jù)分析』卡儒,『數(shù)據(jù)報告』等幾個方面蹦狂。
- 『數(shù)據(jù)提取』這塊,目前SQL是必須要掌握的朋贬,上面也提到了凯楔。另外,有些時候可能也會用到爬蟲锦募,爬取一些數(shù)據(jù)摆屯;
- 『數(shù)據(jù)整理』這部分,python和R,二者取其一就夠了虐骑。不多說准验。簡單的數(shù)據(jù),Excel就夠用了廷没。目前做數(shù)據(jù)分析師用Excel打天下的糊饱,估計有90%。
- 『數(shù)據(jù)分析』颠黎,這部分理解為『探索性數(shù)據(jù)分析』吧另锋,比如做一些統(tǒng)計圖,統(tǒng)計方法來分析一些問題狭归,研究方差變化夭坪,等等。這個方面过椎,『軟技能』更需要室梅,比如問題的定義,問題的分析疚宇,等等亡鼠。當然,為了更大程度的挖掘信息敷待,會用『數(shù)據(jù)挖掘』的方法拆宛,等等。從外界看讼撒,貌似會建模和挖掘浑厚,就高大上了,用excel就不高大上了根盒。貌似巴菲特用電腦只會打橋牌钳幅,不會所謂的『股票挖掘和預測模型』,但是炎滞,不影響他是一個偉大的投資和理財家敢艰。想想他的投資理財?shù)幕貓舐剩H人們册赛,你們不覺得你會excel就很牛了么钠导?
- 『數(shù)據(jù)報告』,好了森瘪,前面所有的提取牡属,整理,分析扼睬,都是過程逮栅,『報告』才是我們做這個數(shù)據(jù)分析的一個『結(jié)果』。如果它有意義,對別人有幫助措伐,OK特纤,我們做的工作有意義了。如果它不正確侥加,更沒有意義捧存。前面的付出都是『一江春水向東流』,拜拜了担败。 大部分的報告昔穴,是PPT或者郵件形式。這部分氢架,因為做個PPT不會特別復雜傻咖,大家都不關(guān)注朋魔。其實岖研,它也是有很多技巧的。不展開了警检。
- 最后說一點東西孙援,關(guān)于『數(shù)據(jù)分析師』,舉一個巴菲特的例子扇雕。他不會挖掘算法拓售,不會建模,但是他有一套自己的分析問題镶奉,解決問題的『模型框架』础淤,他會自己去分析公司的財務(wù)數(shù)據(jù),分析經(jīng)濟發(fā)展走勢哨苛,等等鸽凶。巴菲特,不是一個好的分析師么建峭? 相信大家明白『數(shù)據(jù)分析師』的核心技能是什么了玻侥。
- 晚安。