01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman
06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen
11 - 15:Eithon Cadag, George Roumeliotis, Diane Wu, Jace Kohlmeier, Joe Blitzstein
16 - 20:Jonh Foreman, Josh Wills, Bradley Voytek, Luis Sanchez, Michelangelo D’ agostino
21 - 25:Michael Hochster, Kunal Punera, Sean Courley, Jonathan Goldman, William Chen
- Eithon Cadag
教育背景:華盛頓大學(xué)·商學(xué)和信息科學(xué)雙學(xué)位蹂季,華盛頓大學(xué)·博士,研究方向是將機(jī)器學(xué)習(xí)算法應(yīng)用于生物學(xué)領(lǐng)域屠橄。
職業(yè)經(jīng)歷:拓?fù)錂C(jī)器學(xué)習(xí)公司Ayasdi的經(jīng)理和首席數(shù)據(jù)科學(xué)家
- 在研究生課程中鍛煉了代碼能力
研究生階段選修的很多計(jì)算機(jī)課程和其他非計(jì)算機(jī)課程都需要寫大量的代碼。并且做過很多和生物相關(guān)的項(xiàng)目收叶。
- “充實(shí)”的研究生經(jīng)歷
“我研究生的最后一年幾乎就沒睡覺碟贾!”
- 統(tǒng)計(jì)學(xué)的重要性
“數(shù)據(jù)科學(xué)里很重要的一塊是對(duì)統(tǒng)計(jì)學(xué)的訓(xùn)練防嗡。從根本上來說,“數(shù)據(jù)科學(xué)”這個(gè)名詞意味著你是一個(gè)科學(xué)家淮逊,而科學(xué)家有責(zé)任和義務(wù)去做出正確結(jié)果催首。如果你做不到這一點(diǎn),其實(shí)你就是會(huì)用數(shù)據(jù)做點(diǎn)漂亮圖像的人而已泄鹏,根本稱不上科學(xué)家郎任。能夠理解你做的東西,并且從統(tǒng)計(jì)學(xué)的角度去評(píng)估是否你的東西是有效而且正確的备籽,這一點(diǎn)非常重要舶治。”
- George Roumeliotis
教育背景:悉尼大學(xué)·應(yīng)用數(shù)學(xué)學(xué)士车猬,斯坦福大學(xué)博士后霉猛,研究方向是等離子天體物理。
職業(yè)經(jīng)歷:Dynaptics珠闰,JRG Software惜浅,財(cái)務(wù)軟件公司Intuit的資深數(shù)據(jù)科學(xué)家&數(shù)據(jù)創(chuàng)新領(lǐng)袖。
(注:從姓氏判斷伏嗜,George因該是希臘裔)
- 數(shù)據(jù)科學(xué)的范疇
數(shù)據(jù)科學(xué)自有其規(guī)律和底蘊(yùn)坛悉,是一個(gè)結(jié)合了應(yīng)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)承绸、商業(yè)資訊和新產(chǎn)品開發(fā)的綜合職位裸影,最后一項(xiàng)目前在數(shù)據(jù)科學(xué)的比例越來越大。
數(shù)據(jù)科學(xué)家的技術(shù)列表中大概包括了統(tǒng)計(jì)學(xué)八酒、機(jī)器學(xué)習(xí)、SQL和Hadoop刃唐,以及一門類似Java一類的主流編程語言羞迷。
一個(gè)具有商業(yè)咨詢能力的數(shù)據(jù)科學(xué)家就像是一個(gè)資深的麥肯錫咨詢師界轩,可以流暢地在商業(yè)和技術(shù)兩個(gè)領(lǐng)域騰挪閃轉(zhuǎn),并且是一名能被人信任的商業(yè)顧問或者領(lǐng)袖衔瓮。這些絕對(duì)是很高很難的能力浊猾。
- 技術(shù)學(xué)習(xí)
熟練使用SQL語言和Hadoop絕對(duì)是繞不過去的條件。
學(xué)會(huì)R語言是重中之重热鞍。另外葫慎,毫無疑問你也需要學(xué)會(huì)一門主流的編程語言,比如Java或者C++薇宠。當(dāng)然偷办,學(xué)會(huì)一門主流的腳本語言,例如Python和Perl也是很有用的澄港。
- 年輕數(shù)據(jù)科學(xué)家最常犯的錯(cuò)誤是什么椒涯?
首先,你要主動(dòng)去和身邊的非技術(shù)人員搞好關(guān)系回梧。
其次废岂,嘗試用商業(yè)流程去看、去分析這個(gè)世界狱意。商業(yè)流程包括了一個(gè)商業(yè)活動(dòng)里所涉及的人員湖苞、體系和步驟。概括來說详囤,一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目的目的是提高某一項(xiàng)現(xiàn)存的商業(yè)流程的利潤效率财骨。
- 一名成功的數(shù)據(jù)科學(xué)家應(yīng)該具備什么?
一名成功的數(shù)據(jù)科學(xué)家應(yīng)該有能力去改變他周邊的世界纬纪。
- 未來數(shù)據(jù)科學(xué)的走向是怎樣的蚓再?
數(shù)據(jù)科學(xué)將會(huì)帶來數(shù)據(jù)產(chǎn)品的井噴式爆發(fā),提供數(shù)據(jù)產(chǎn)品的公司與使用數(shù)據(jù)產(chǎn)品的客戶都會(huì)快速增長——也就是說包各,這一項(xiàng)基于大數(shù)據(jù)和高級(jí)分析的科學(xué)將會(huì)進(jìn)入千家萬戶摘仅。
- Diane Wu
教育背景:西蒙弗雷澤大學(xué)·計(jì)算機(jī)學(xué)士,斯坦福大學(xué)·遺傳學(xué)博士问畅,選修了很多計(jì)算機(jī)科學(xué)與機(jī)器學(xué)習(xí)的課程(Andrew Ng的機(jī)器學(xué)習(xí)課程娃属、Daphne Koller的概率圖模型(Probabilistic Graphical Models)課、Jeff Heer的數(shù)據(jù)可視化課以及Jure Leskovec的大數(shù)據(jù)挖掘課护姆。)矾端。
職業(yè)經(jīng)歷:Palantir,MetaMind卵皂。
- 在Palantir(注:這家公司的老板是Peter Thiel)的工作
將定性的問題轉(zhuǎn)換為定量的問題來研究(比如找到不錯(cuò)的替代指標(biāo)來做出正確的結(jié)論)秩铆、統(tǒng)計(jì)(對(duì)數(shù)據(jù)做計(jì)算操作)、溝通交流(用易于被理解的方式展示數(shù)據(jù))
- 卓越的數(shù)據(jù)科學(xué)家與普通數(shù)據(jù)科學(xué)家之間的區(qū)別在哪里?
需要同時(shí)能從工程學(xué)和統(tǒng)計(jì)學(xué)兩個(gè)角度去思考問題殴玛。你必須要思考什么樣的統(tǒng)計(jì)檢測方法是正確的捅膘,從什么角度去看問題,如何去用軟件工程實(shí)現(xiàn)你的解決方案滚粟,以及如何玩轉(zhuǎn)那些體量非常大的數(shù)據(jù)集寻仗。還需要能用清晰易懂的方式去展示你的結(jié)果。
- 數(shù)據(jù)科學(xué)的未來凡壤?
我覺得在未來10年署尤,我們將會(huì)出現(xiàn)數(shù)據(jù)科學(xué)之外的很多新名詞,因?yàn)槿藗兘K將意識(shí)到他們?cè)趯ふ业娜耸窃鯓拥模ǚ治鰩熁蛘哳A(yù)測建模師)亚侠。
- Jace Kohlmeier
教育背景:堪薩斯大學(xué)·數(shù)學(xué)和計(jì)算機(jī)雙學(xué)位曹体,普林斯頓大學(xué)林論計(jì)算科學(xué)碩士。
職業(yè)經(jīng)歷:Citadel盖奈,Khan Academy數(shù)據(jù)科學(xué)主管混坞。
- 在Citadel是如何學(xué)習(xí)的?
“我的方法——可能不是最優(yōu)的方法——就是讀書钢坦【吭校”
- 哪些技能是非常基礎(chǔ)而且核心的爹凹?
定量分析思維厨诸。編程能力。設(shè)計(jì)模型禾酱。
- 如何鍛煉溝通能力微酬?
“我當(dāng)時(shí)錄制了幾盤嘗試扮演各種商業(yè)角色的錄像帶。然后我看了那些錄像帶颤陶,并且驚愕地看著自己的肢體語言颗管,聽著自己的發(fā)音怪癖。直到今天我都在努力改正這方面的問題滓走】呀”
“我的另一個(gè)進(jìn)步方式是,努力與那些非常外向的人結(jié)伴搅方”瓤裕”
- Joe Blitzstein
教育背景:加州理工大學(xué)·數(shù)學(xué)學(xué)士,斯坦福大學(xué)·數(shù)學(xué)博士
職業(yè)經(jīng)歷:哈佛大學(xué)應(yīng)用統(tǒng)計(jì)專業(yè)教授
- 概率論簡介課程
Joe在斯坦福的概率論課程非常受歡迎姨涡,有推特賬號(hào)@stat110(https://twitter.com/stat110)和書《Introduction to Probability》衩藤。這本科還有網(wǎng)頁,https://projects.iq.harvard.edu/stat110涛漂。(這本書真的非常好赏表,推薦閱讀,但只有英文版,下載地址:https://github.com/iamseancheney/pythonbooks/blob/master/Introduction%20to%20Probability%20-%20Blitzstein.pdf)瓢剿。
- 講故事岁诉、溝通交流和可視化在數(shù)據(jù)科學(xué)中分別具有怎樣的作用?
“但是我覺得跋选,能從數(shù)據(jù)中獲得可以解釋的正確結(jié)果,并且將它告訴更多的人哗蜈,這絕對(duì)是一種藝術(shù)前标。”溝通交流其實(shí)包括了與你自己的溝通交流距潘!推薦Edward Tufte的書《The Visual Display of Quantitative Information》炼列。
- 通過對(duì)別人講授這些知識(shí)來鞏固學(xué)習(xí)
“你必須要思考應(yīng)該強(qiáng)調(diào)什么東西,必須用那些非常常規(guī)的語言去講授那些不那么常規(guī)的專有名詞音比。你還要回想你一開始學(xué)習(xí)這些概念的時(shí)候是怎么理解的俭尖,想到一路上你越過的那些障礙和絆腳石,知道重點(diǎn)和核心在那里洞翩。這一招對(duì)于任何人都有用稽犁。”