《數(shù)據(jù)科學(xué)家訪談錄》總結(jié)·4


01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman
06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen
11 - 15:Eithon Cadag, George Roumeliotis, Diane Wu, Jace Kohlmeier, Joe Blitzstein
16 - 20:Jonh Foreman, Josh Wills, Bradley Voytek, Luis Sanchez, Michelangelo D’ agostino
21 - 25:Michael Hochster, Kunal Punera, Sean Courley, Jonathan Goldman, William Chen


  1. Jonh Foreman
    《Data Smart》作者
    教育背景:麻省理工大學(xué)·運(yùn)籌學(xué)博士
    職業(yè)經(jīng)歷:多家咨詢公司番川,NSA丐谋,Booz Allen,MailChimp首席科學(xué)家
  • Jonh的職業(yè)經(jīng)歷

對(duì)Jonh的采訪主要是關(guān)于他的職業(yè)經(jīng)歷连躏。在讀博期間,他參與過戴爾電腦的供應(yīng)量項(xiàng)目,萌生了進(jìn)入科技界的想法。博士畢業(yè)之后袜爪,在美國(guó)國(guó)家安全局實(shí)習(xí)過,不喜歡政府的工作環(huán)境⊙ι粒現(xiàn)在的公司MailChimp位于亞特蘭大辛馆,最大的優(yōu)點(diǎn)是可以給公司很高的獨(dú)立性。

  • 什么數(shù)據(jù)科學(xué)家不應(yīng)該花時(shí)間在Kaggle上逛绵?

數(shù)據(jù)科學(xué)家做的主要工作就是建立預(yù)測(cè)模型怀各,這種說法是不正確的倔韭。

在建立一個(gè)模型之前术浪,你需要知道你的公司里有什么可用的數(shù)據(jù)資源,有什么技術(shù)對(duì)于你來說是有平臺(tái)資源支持的寿酌,有什么技術(shù)是適合的胰苏,你需要去很好地定義那個(gè)問題,并且認(rèn)真研究其中的各個(gè)細(xì)節(jié)醇疼。

在數(shù)據(jù)科學(xué)界有一個(gè)觀點(diǎn)就是硕并,Kaggle根本不會(huì)關(guān)注一個(gè)問題是不是當(dāng)務(wù)之急必須解決的。

  • 在公司里秧荆,數(shù)據(jù)科學(xué)家的角色具體是怎樣的呢倔毙?

一個(gè)人人都知道的數(shù)據(jù)科學(xué)家的職責(zé)就是清洗和準(zhǔn)備數(shù)據(jù)。尋找乙濒、爬取陕赃、準(zhǔn)備卵蛉、清洗,這就是這一部分職責(zé)的操作流程么库。在建模之前的數(shù)據(jù)整理工作量是非常巨大的傻丝。

任何數(shù)據(jù)科學(xué)家應(yīng)該具備的能力就是與商業(yè)人士溝通的能力。

  • “數(shù)據(jù)科學(xué)”這個(gè)術(shù)語有點(diǎn)荒唐

“數(shù)據(jù)科學(xué)”的組成就是兩個(gè)含糊不清的詞匯诉儒,并沒有真正代表我大部分時(shí)間在做的事情葡缰。作為一個(gè)術(shù)語的數(shù)據(jù)科學(xué)可能會(huì)消亡,成為一個(gè)過氣的“網(wǎng)紅”忱反,但技術(shù)確實(shí)是很重要的泛释,這些技術(shù)終將會(huì)深深影響商業(yè)界的許多工作。

  • 線上世界會(huì)開始向線下融合

與李開復(fù)不謀而合

  1. Josh Wills
    教育背景:杜克大學(xué)·理論數(shù)學(xué)學(xué)士温算,德州大學(xué)奧斯汀分行舶模·運(yùn)籌學(xué)博士。
    職業(yè)經(jīng)歷:Zilliant米者,Indeed韭畸,Google,Cloudera數(shù)據(jù)科學(xué)主任
  • 統(tǒng)計(jì)學(xué)的學(xué)習(xí)

大學(xué)最后一年學(xué)習(xí)過統(tǒng)計(jì)學(xué)入門課程蔓搞。在奧斯汀為IBM工作時(shí)胰丁,學(xué)習(xí)了基本的統(tǒng)計(jì)學(xué)知識(shí),并有機(jī)會(huì)加以利用喂分。

(對(duì)Josh的采訪主要是他就職過的公司的對(duì)比锦庸,不同公司的工作內(nèi)容,和數(shù)據(jù)關(guān)系相對(duì)較淺蒲祈。)

  1. Bradley Voytek
    教育背景:南加州大學(xué)·物理學(xué)學(xué)士甘萧,伯克利分校博士。
    職業(yè)經(jīng)歷:Uber梆掸,UCSD計(jì)算神經(jīng)科學(xué)教授
  • 不回避失敗

“在很多地方扬卷,失敗往往會(huì)被人鄙視,但是我覺得從某種意義上說酸钦,失敗也是你成長(zhǎng)的過程怪得。”

Bradley的本科GPA很糟糕卑硫,但是被伯克利錄取徒恋。他覺得過去有很多人在關(guān)鍵的時(shí)刻給予過他幫助,并且由于對(duì)神經(jīng)科學(xué)有更大的興趣欢伏,又回到了學(xué)校任職入挣。

  • 關(guān)于溝通

我經(jīng)常想起這個(gè)畫面。能否順利地與別人溝通交流硝拧,講出你的點(diǎn)子径筏,是一個(gè)很重要的問題风皿。

  1. Luis Sanchez
    教育背景:委內(nèi)瑞拉一所軍事大學(xué)獲得學(xué)士學(xué)位,LASPAU獎(jiǎng)學(xué)金的MBA學(xué)位
    職業(yè)經(jīng)歷:ttwick公司的數(shù)據(jù)科學(xué)家與CEO
  • 數(shù)據(jù)科學(xué)是什么匠璧?

數(shù)據(jù)科學(xué)是一門從一組數(shù)據(jù)中提取價(jià)值的藝術(shù)和科學(xué)桐款,無論數(shù)據(jù)大小都是。

叫作“藝術(shù)”夷恍,因?yàn)闆]有一種萬能的方法或者公式可以幫助你回答所有你想問的數(shù)據(jù)問題魔眨。

稱為“科學(xué)”,因?yàn)槟阈枰私饽闼龅氖虑楸澈蟮睦碚摍C(jī)理酿雪,并花費(fèi)10000個(gè)小時(shí)去磨礪解決問題的方法遏暴,讓自己培養(yǎng)出條件反射一般的記憶。

  • 數(shù)據(jù)科學(xué)家的目標(biāo)應(yīng)該是什么指黎?

數(shù)據(jù)科學(xué)家的目標(biāo)是從最有效的資源利用和時(shí)間限制中創(chuàng)造出可操作朋凉、可使用的智能價(jià)值。數(shù)據(jù)科學(xué)家應(yīng)該能夠以有意義的方式將數(shù)據(jù)連接起來醋安,從而從數(shù)據(jù)的組合中創(chuàng)建新的知識(shí)杂彭,從而能夠以創(chuàng)造性的方式模擬和解決問題,并快速地完成所有的工作吓揪。

  • 學(xué)習(xí)路徑

金融量化亲怠,到數(shù)據(jù)抓取、網(wǎng)絡(luò)爬蟲柠辞,人工智能团秽。

  • 研究生最該做什么?

除了Visual Basic語言之外叭首,還應(yīng)該學(xué)習(xí)更多的語言习勤。我將為曾經(jīng)的我訂立一個(gè)學(xué)習(xí)Octave、Python以及在1995年出現(xiàn)的Java的計(jì)劃焙格。

  • 持續(xù)學(xué)習(xí)的方法

我參加了很多會(huì)議和聚會(huì)图毕,我盡可能多地閱讀有關(guān)人工智能、金融工程和其他相關(guān)話題的最新發(fā)現(xiàn)间螟。

  • 數(shù)據(jù)科學(xué)在未來幾年會(huì)發(fā)生什么變化吴旋?

我希望最大的進(jìn)步來自高性能計(jì)算和數(shù)據(jù)存儲(chǔ)损肛。還會(huì)有更多的“工具”能夠被用來進(jìn)行數(shù)據(jù)分析厢破。

  1. Michelangelo D’ agostino
    教育背景:哈佛大學(xué)·物理學(xué)士,伯克利大學(xué)·天體物理博士
    職業(yè)經(jīng)歷:《經(jīng)濟(jì)學(xué)人》作者治拿,奧巴馬競(jìng)選團(tuán)隊(duì)分析師摩泪,Braintree首席數(shù)據(jù)科學(xué)家,Civis Analytics
  • 如何接觸數(shù)據(jù)科學(xué)的劫谅?

讀博期間的項(xiàng)目是分析中微子信號(hào)模式见坑,使用了大量的神經(jīng)網(wǎng)絡(luò)技術(shù)嚷掠。Kaggle剛開始出現(xiàn)的時(shí)候,就參與其中荞驴。自學(xué)了R語言不皆,參加各種Meetup。推薦博客KDNuggets熊楼,https://www.kdnuggets.com霹娄。

  • 上學(xué)期間最重要的?

我總是告訴學(xué)生鲫骗,在研究生階段學(xué)到的最有用的技能就是如何自學(xué)犬耻,以及如何準(zhǔn)確定位你還不知道的東西。這是第一件事执泰。第二件事是要堅(jiān)持不懈枕磁,在遇到問題的時(shí)候,要絞盡腦汁地前進(jìn)术吝,直到取得突破计济。自信心是另一個(gè)我想說的東西。最后一件事是排苍,如果有過處理數(shù)據(jù)的經(jīng)驗(yàn)峭咒,那是極好的。學(xué)習(xí)如何處理數(shù)據(jù)的唯一方法是實(shí)際使用數(shù)據(jù)纪岁。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末凑队,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子幔翰,更是在濱河造成了極大的恐慌漩氨,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件遗增,死亡現(xiàn)場(chǎng)離奇詭異叫惊,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)做修,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門霍狰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人饰及,你說我怎么就攤上這事蔗坯。” “怎么了燎含?”我有些...
    開封第一講書人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵宾濒,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我屏箍,道長(zhǎng)绘梦,這世上最難降的妖魔是什么橘忱? 我笑而不...
    開封第一講書人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮卸奉,結(jié)果婚禮上钝诚,老公的妹妹穿的比我還像新娘。我一直安慰自己榄棵,他們只是感情好敲长,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著秉继,像睡著了一般祈噪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上尚辑,一...
    開封第一講書人閱讀 51,521評(píng)論 1 304
  • 那天辑鲤,我揣著相機(jī)與錄音,去河邊找鬼杠茬。 笑死月褥,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的瓢喉。 我是一名探鬼主播宁赤,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼栓票!你這毒婦竟也來了决左?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤走贪,失蹤者是張志新(化名)和其女友劉穎佛猛,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體坠狡,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡继找,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了逃沿。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片婴渡。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖凯亮,靈堂內(nèi)的尸體忽然破棺而出边臼,到底是詐尸還是另有隱情,我是刑警寧澤触幼,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布硼瓣,位于F島的核電站,受9級(jí)特大地震影響置谦,放射性物質(zhì)發(fā)生泄漏堂鲤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一媒峡、第九天 我趴在偏房一處隱蔽的房頂上張望瘟栖。 院中可真熱鬧,春花似錦谅阿、人聲如沸半哟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽寓涨。三九已至,卻和暖如春氯檐,著一層夾襖步出監(jiān)牢的瞬間戒良,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工冠摄, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留糯崎,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓河泳,卻偏偏與公主長(zhǎng)得像沃呢,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子拆挥,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355