簡書新手简识,第一個(gè)文集想記錄一下自己過去一年的轉(zhuǎn)行經(jīng)歷。其實(shí)從17年4月決定轉(zhuǎn)行忿危,到18年6月拿到offer(因在美工作許可等行政原因10月入職)达箍,時(shí)間是超過了一年的。不過這一年多的時(shí)間癌蚁,除了數(shù)據(jù)科學(xué)方面幻梯,我也花了很多時(shí)間嘗試轉(zhuǎn)行做Quant和碼農(nóng),和在PhD老板的壓榨下反反復(fù)復(fù)改論文努释,算下來我用來學(xué)DS(data science)和找DS工作的時(shí)間其實(shí)是不到一年的碘梢。總結(jié)下一些經(jīng)驗(yàn)教訓(xùn)和本可以避免的彎路伐蒂,希望可以幫助后來者更有效率地完成這個(gè)過程煞躬。
簡單交代一下本人轉(zhuǎn)行前的背景以供參考:美國東部某排名30-50的學(xué)校數(shù)學(xué)系PhD第五年,研究方向叫幾何表示論(即用代數(shù)幾何手段解決表示論問題)逸邦,非常理論恩沛,唯一的應(yīng)用是物理學(xué)里面的量子場論,我做的具體問題離這個(gè)應(yīng)用也還很遙遠(yuǎn)缕减。本科入校時(shí)報(bào)的工科專業(yè)雷客,大一學(xué)了點(diǎn)C語言,大二轉(zhuǎn)了數(shù)學(xué)系桥狡,除了一門數(shù)值方法的課之外搅裙,再沒編過程,最多做課件什么的用MATLAB畫個(gè)圖裹芝,統(tǒng)計(jì)學(xué)方面除了大二時(shí)的概率論其他什么都沒學(xué)過部逮。從大二下學(xué)期一直到PhD第五年快結(jié)束的時(shí)候,幾乎每天都在數(shù)學(xué)證明嫂易、寫數(shù)學(xué)證明兄朋、跟別人討論數(shù)學(xué)證明中度過。電腦除了搜索下載之外怜械,唯一的用處是敲LaTex颅和。
那時(shí)真的是零基礎(chǔ)——不僅完全不熟悉DS需要的知識技能,甚至對這個(gè)行業(yè)關(guān)心什么問題缕允,常用哪些手段解決問題融虽,當(dāng)前發(fā)展如何,前景如何等情況都不甚了了灼芭。所以剛開始也沒有特別集中在這個(gè)行業(yè),而是一度花了很多時(shí)間精力想做Quant般又。五年前本科畢業(yè)申請PhD時(shí)彼绷,曾經(jīng)有一位教授跟我說很多人即使PhD之后不再繼續(xù)做數(shù)學(xué)巍佑,在華爾街也能找到收入不菲的工作。這個(gè)說法在當(dāng)時(shí)(08年的金融危機(jī)剛剛緩解)是沒有問題的寄悯,也有若干實(shí)例佐證萤衰,但是五年后就不一定了。同辦公室的同學(xué)確實(shí)有人拿了JP Morgan的Quant職位offer猜旬,但是首先他的研究方向是PDE脆栋,本身就比較偏應(yīng)用,quantitative finance中的Black Scholes模型也是PDE洒擦,其次他之前有暑假在JP Morgan做實(shí)習(xí)椿争,拿的也是return offer。我決定轉(zhuǎn)行的想法幾乎是兩周內(nèi)從無到有熟嫩、從有到確定秦踪,此前完全沒有相關(guān)經(jīng)驗(yàn),此后也深感來不及(馬上就暑假了而我那時(shí)連編程都不會)掸茅。把美東幾乎所有招Quant的公司都投過一遍之后椅邓,多數(shù)簡歷在HR那里就直接被拒,即使過關(guān)拿到面試昧狮,面試時(shí)還覺得自己表現(xiàn)不錯(cuò)景馁,所有問題都答出來了,面試官的反饋也不錯(cuò)逗鸣,然后依舊莫名收到拒信合住,說與公司文化不符之類。
在準(zhǔn)備Quant期間學(xué)了一些編程慕购,于是又想去做碼農(nóng)聊疲。碼農(nóng)只投了兩家公司,都拿到了面試(也說明碼農(nóng)這個(gè)行業(yè)對轉(zhuǎn)行的接受度比較高)沪悲。第一家面得很慘获洲,完全是送人頭。第二家前面幾輪還可以殿如,到最后一輪onsite時(shí)贡珊,非科班出身、沒上過課只刷過題的缺點(diǎn)暴露無遺涉馁,被問到system design和compiler的問題直接跪了门岔。面試后回家的飛機(jī)上冷靜思考一下,覺得雖然知識點(diǎn)可以補(bǔ)上來烤送,但是自己多年養(yǎng)成的數(shù)學(xué)家式思維要轉(zhuǎn)變成程序員的工程思維還需一定時(shí)日寒随。另一方面老公是碼農(nóng),他的工作日常也不算是我喜歡的、真心想做的事情妻往。想做碼農(nóng)的一部分原因也是覺得有老公幫忙學(xué)起相關(guān)的東西來會容易些互艾,跟老公的交流中卻越來越發(fā)現(xiàn)兩個(gè)人思維方式的不同。這個(gè)期間也逐漸接觸了一些機(jī)器學(xué)習(xí)相關(guān)的東西讯泣,開始了解DS這個(gè)領(lǐng)域纫普。
當(dāng)然DS所涵蓋的范圍遠(yuǎn)比機(jī)器學(xué)習(xí)(包含深度學(xué)習(xí))要廣泛得多,不過我個(gè)人對以機(jī)器學(xué)習(xí)好渠,尤其深度學(xué)習(xí)為主要工具的DS更感興趣昨稼。DS其實(shí)就是在數(shù)據(jù)中尋找規(guī)律,然后用更多的數(shù)據(jù)加以驗(yàn)證拳锚,最后根據(jù)驗(yàn)證結(jié)果得到結(jié)論假栓,當(dāng)然這其中還包括數(shù)據(jù)處理、模型評價(jià)晌畅、模型選擇等問題但指。這個(gè)套路和數(shù)學(xué)科研,或者說很多理工科的科研抗楔,是很相像的棋凳,因此PhD期間接受的科研訓(xùn)練在這個(gè)行業(yè)是可以用上的。而且數(shù)學(xué)系的多年訓(xùn)練賦予我的邏輯思維和抽象思維能力连躏,使得我學(xué)這些東西時(shí)還算比較快剩岳。正如我面高盛的Strats(即Quant)時(shí)面試官小姐姐說的:這個(gè)崗位不會用到你PhD期間學(xué)的數(shù)學(xué),但是PhD教會我們的不只是數(shù)學(xué)入热。從這個(gè)角度說拍棕,所謂的“零基礎(chǔ)”算是存疑的,技能(如編程勺良,建模)和具體知識(如統(tǒng)計(jì)學(xué)绰播,各種算法)是可以短期內(nèi)pick up的,但是思維方式和分析能力是多年養(yǎng)成的尚困。
大約從去年11月-12月起蠢箩,我開始集中投DS的職位,同時(shí)學(xué)習(xí)相關(guān)知識事甜,練習(xí)面試技能到今年6月底拿到第一份offer谬泌。后面7月上中旬忙著畢業(yè)答辯,同時(shí)又拿到兩家offer逻谦,跟HR們斗智斗勇后7月24號確定了公司掌实。具體細(xì)節(jié)以后會逐漸更新,保證真實(shí)邦马,盡量全面(包括學(xué)習(xí)資料贱鼻、注意事項(xiàng)和評價(jià))宴卖,大致題綱如下:
零基礎(chǔ)學(xué)習(xí)Data Science——統(tǒng)計(jì)學(xué)
零基礎(chǔ)學(xué)習(xí)Data Science——編程
從編程+統(tǒng)計(jì)到機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))
轉(zhuǎn)行做Data Scientist——簡歷
轉(zhuǎn)行做Data Scientist——項(xiàng)目經(jīng)歷
轉(zhuǎn)行做Data Scientist——社交和內(nèi)推機(jī)會
轉(zhuǎn)行做Data Scientist——面試
如果對以上提到的或沒提到的任何方面感興趣,歡迎留言告知忱嘹,謹(jǐn)表感謝嘱腥。找到現(xiàn)在這個(gè)DS的工作只是讓轉(zhuǎn)行的過程告一段落,在DS領(lǐng)域的奮斗才剛剛開始拘悦。上述內(nèi)容更新完之后,會記錄工作中的成長和感悟橱脸,有興趣的話歡迎關(guān)注础米,更歡迎交流探討。