2017年7月22日惜浅,小K講座《來(lái),工業(yè)界資深數(shù)據(jù)科學(xué)家教你破解各大公司面試山孔!》圓滿結(jié)束懂讯!
“數(shù)據(jù)科學(xué)”是個(gè)很寬廣的概念,每個(gè)行業(yè)每個(gè)公司里數(shù)據(jù)科學(xué)家的職責(zé)有可能相差很大台颠。小K根據(jù)工作內(nèi)容褐望,做了以下分類(lèi) – $越多,收入越高:
$$$$ Research Scientist(DL/ML/AI)$$$ ML Eng / DS specialist / researcher$$ DS generalist: Stat/Modeling/Experimental Design$ DA/BA: SQL/Visualization
關(guān)于數(shù)據(jù)科學(xué)家在工業(yè)界的職業(yè)前景:
本科生一般從底層L3級(jí)別的Data Scientist和Data Analyst做起串前;研究生對(duì)應(yīng)著L4瘫里;工作一些年數(shù)之后,公司希望你能成為L(zhǎng)5也就是Senior DS/DA荡碾;L6已經(jīng)是專(zhuān)家級(jí)人才了谨读,公司并不強(qiáng)求你成長(zhǎng)為這個(gè)級(jí)別;能達(dá)到更高級(jí)別的人就更稀少了坛吁。
底層的Data Analyst收入不高劳殖,尤其是非IT行業(yè)。但是在互聯(lián)網(wǎng)/IT行業(yè)拨脉,高層次的數(shù)據(jù)科學(xué)家收入并不比軟件工程師少哆姻。比如技術(shù)崗位,做到L6級(jí)別的中國(guó)人有不少玫膀,在灣區(qū)大公司工作的話矛缨,年收入四五十萬(wàn)美元(基本工資+股票)算是正常收入,更牛的當(dāng)然也有帖旨。
跟軟件工程師相比箕昭,數(shù)據(jù)科學(xué)家這個(gè)職業(yè)有如下優(yōu)勢(shì):
首先,經(jīng)驗(yàn)豐富的Data Scientist解阅,跳槽不用老是刷題落竹,因?yàn)槊嬖嚳疾斓耐褪枪ぷ饔玫降膬?nèi)容,經(jīng)驗(yàn)和能力的積累很重要瓮钥。其次筋量,這類(lèi)職業(yè)不像軟件工程師那么成熟烹吵,上升空間更大、更快桨武。
很多人反映:數(shù)據(jù)科學(xué)求職很難肋拔。除了簡(jiǎn)歷關(guān),很多人也掛在了take-home exam呀酸、technical phone screening上面凉蜂,即使拿到on site面試,通過(guò)率也很低性誉。
小K在公司作為Hiring Manager和面試官面試過(guò)很多人窿吩。她認(rèn)為:
學(xué)校課程學(xué)習(xí)和求職面試脫節(jié),是很多同學(xué)掛掉的重要原因错览。
學(xué)校里教課方式是:上什么課纫雁、學(xué)什么東西(比如KNN),作業(yè)和Project就用什么東西來(lái)解決倾哺。實(shí)際面試過(guò)程截然相反轧邪,面試官并不會(huì)問(wèn)你是否會(huì)某個(gè)方法、某個(gè)技術(shù)羞海,面試通常是這樣的:
面試官: 我們產(chǎn)品是這樣的忌愚,請(qǐng)問(wèn),如何改進(jìn)之却邓?求職者: 這道題是考regression嗎硕糊?是AB test嗎?是metric 設(shè)計(jì)嗎腊徙?是SQL嗎简十?他到底想考我啥!昧穿?
小K打了個(gè)比喻:數(shù)據(jù)科學(xué)的面試相當(dāng)于文理科史地生藝術(shù)體育勺远,所有科目混合成一張考卷。在這次講座里时鸵,小K也以Facebook、Uber厅瞎、Houzz等幾家公司的面試題目為例子饰潜,講解了面試題目考啥什么、如何應(yīng)對(duì)和簸。
接下來(lái)彭雾,小K會(huì)開(kāi)設(shè)數(shù)據(jù)科學(xué)就業(yè)培訓(xùn)課程
,如果您有興趣參加锁保,請(qǐng)點(diǎn)這里查看課程安排和報(bào)名參加薯酝。
針對(duì)同學(xué)們的詢問(wèn)半沽,小K也推薦了一些課程和書(shū)籍幫助大家的學(xué)習(xí),推薦名單如下吴菠。
**視頻/課程
**
Python:Coursera《Python for everybody》
Udemy《Complete Python Bootcamp: Go from zero to hero in Python》
R:Coursera《R Programming》
Udemy《R Programming A-Z?: R For Data Science With Real Exercises!》
SQL:Udemy《The Complete SQL Bootcamp》
Statistics & Probability BasicsCoursera《Basic Statistics》
Coursera《An Intuitive Introduction to Probability》
**下面這些書(shū)都在小K書(shū)架上者填!分享給大家。
**
如果你想加強(qiáng)business/product sense來(lái)應(yīng)對(duì)analytics面試做葵,推薦《Cracking the PM Interview: How to Land a Product Manager Job in Technology》這本書(shū) – 你沒(méi)看錯(cuò)占哟,是PM的書(shū)!:
還有一本也不錯(cuò):《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》
R編程的書(shū)籍:《R for Data Science: Import, Tidy, Transform, Visualize, and Model Data》
或者是另外一本:《R in Action: Data Analysis and Graphics with R》
Python這本書(shū)很贊:《Python Crash Course: A Hands-On, Project-Based Introduction to Programming》
數(shù)據(jù)可視化酿矢,如果讓你的presentation更漂亮榨乎,參考神書(shū):《Visualize This: The FlowingData Guide to Design, Visualization, and Statistics》
實(shí)驗(yàn)設(shè)計(jì)經(jīng)典書(shū)籍:《Design and Analysis of Experiments》
機(jī)器學(xué)習(xí)經(jīng)典書(shū)籍:《The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition》
深度學(xué)習(xí)大牛作品:《Deep Learning (Adaptive Computation and Machine Learning series)》
下面這本是編程面試的神書(shū),但是做data analyst的同學(xué)不用看瘫筐,考不到這種題目:《Cracking the coding Interview》
最后蜜暑,小K從2013年開(kāi)始一直更新的《Data Scientist 煉成記錄》,也有很詳細(xì)的學(xué)習(xí)材料和問(wèn)題分析策肝。