《數(shù)據(jù)科學(xué)家訪談錄》總結(jié)·1

一本介紹了25位成功的數(shù)據(jù)科學(xué)家學(xué)習(xí)和成長經(jīng)歷的書。其中监婶,博士有17位,擁有斯坦福學(xué)位6人餐曼,只擁有本科學(xué)位3人压储,女性3位。


01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman
06 - 10:Clare Corthell, Drew Conway, Kevin Novak, Chris Moody, Erich Owen
11 - 15:Eithon Cadag, George Roumeliotis, Diane Wu, Jace Kohlmeier, Joe Blitzstein
16 - 20:Jonh Foreman, Josh Wills, Bradley Voytek, Luis Sanchez, Michelangelo D’ agostino
21 - 25:Michael Hochster, Kunal Punera, Sean Courley, Jonathan Goldman, William Chen


  1. DJ Patil
    “數(shù)據(jù)科學(xué)家”一詞的創(chuàng)造者
    《Data Scientist: Sexiest Job of the 21st Century》哈佛商業(yè)周刊作者
    教育背景:加州大學(xué)圣地亞哥分性雌·數(shù)學(xué)學(xué)士集惋,馬里蘭州立大學(xué)·應(yīng)用數(shù)學(xué)博士,博士研究方向是非線性動態(tài)過程踩娘、混沌理論和復(fù)雜系統(tǒng)刮刑。
    職業(yè)經(jīng)歷:氣象領(lǐng)域近十年研究(注:DJ的博士研究方向和這個工作很對口);eBay首席架構(gòu)師和研究科學(xué)家养渴;LinkedIn數(shù)據(jù)產(chǎn)品主管雷绢;RelateIQ產(chǎn)品部副總裁(注:RelateIQ被Salesforce收購后,更名為SalesforceIQ)理卑。
  • 如何應(yīng)對面試翘紊?

求職需要你每一次都針對不同的聊天對象修改對自己的介紹和描述。其中的精髓正和做數(shù)據(jù)科學(xué)如出一轍藐唠,你需要不斷地在展示自己和研究如何展示自己之間反復(fù)循環(huán)帆疟。

  • 如何在職場快速發(fā)展?

我認為目前數(shù)據(jù)科學(xué)領(lǐng)域的一大優(yōu)勢就是它并沒有過于清晰的職位技能需求宇立,所以很大一部分擁有偏才的人其實都是適合這個領(lǐng)域的踪宠。公司里根本沒有人知道具體該使用什么工具來解決正在面對的問題,所以你必須去搞清楚妈嘹,而這恰好給予了你足夠的自由度柳琢。

  • 職場新人要領(lǐng)?

新人首先要證明可以完成一些任務(wù)润脸,然后證明可以創(chuàng)造一些東西柬脸。

  • 學(xué)術(shù)界向科技界轉(zhuǎn)型,會遇到的不足毙驯?

第一倒堕,學(xué)術(shù)界的人技能都過于單一,只專注于特定的問題和緯度尔苦。(DJ本人是在上學(xué)時上了大量的公式推導(dǎo)課和概率統(tǒng)計課;DJ學(xué)習(xí)的原則是,要能帶來更廣闊的眼界和出路)允坚;

第二魂那, 學(xué)術(shù)界的人很喜歡滔滔不絕的說話,而不是靜靜聆聽別人的需求稠项,所以也不擅長傾聽別人的問題在哪里涯雅。(相反的,就是要合作展运、交流活逆、溝通、競爭拗胜、辯論)

  • 數(shù)據(jù)科學(xué)是一個團隊游戲

沒有任何一個數(shù)據(jù)科學(xué)家可以為自己的成就獨自邀功蔗候。數(shù)據(jù)科學(xué)是一個團隊游戲,需要有人收集數(shù)據(jù)埂软,有人處理數(shù)據(jù)(注:原書這里寫的是轉(zhuǎn)移這批數(shù)據(jù)锈遥,是翻譯錯誤),有人分析數(shù)據(jù)勘畔,有人將結(jié)果發(fā)布出去所灸。

  • 數(shù)據(jù)科學(xué)技能向其它領(lǐng)域轉(zhuǎn)移

舉例有Datakind、Social Good炫七、Crisis Text Line爬立。新興技術(shù)促使小公司可以擁有不輸大公司的系統(tǒng)。

社會根本上的轉(zhuǎn)變也在促使這一趨勢万哪,老一代人主要是同情侠驯,當代人主要是扶助。類似于壤圃,過去的數(shù)據(jù)科學(xué)家只能以圖形展示問題和數(shù)據(jù)陵霉,而當代數(shù)據(jù)科學(xué)家是通過鞭辟入里的分析得出結(jié)論,并且可以知道要采取什么行動伍绳。

  • 在工作和產(chǎn)品開發(fā)中最看重的品質(zhì)

公司有兩件事最吸引人:從頭做一些東西踊挠,開發(fā)一個實實在在的產(chǎn)品。為了能作出好產(chǎn)品冲杀,首先效床,需要理解兩樣?xùn)|西,缺一不可权谁。一個是用戶體驗(user experience)剩檀,另一個是數(shù)據(jù)。另外一點旺芽,多元化沪猴。方法是接觸不同的事務(wù)辐啄。

  • 關(guān)于努力工作(吐槽:答非所問,問的問題是學(xué)習(xí)哪些知識可以變得多元运嗜,卻回答要努力工作)

DJ在RelateIQ工作時壶辜,通常每周的工作時長達到100小時(差不多就是每周工作7天,每天14到15小時)担租。他建議加入公司的年輕數(shù)據(jù)科學(xué)家的一件事就是砸民,最好每天最早到公司且最晚離開。每天只睡4~5個小時奋救,至少要持續(xù)6個月甚至于一年多岭参。

  • 要培養(yǎng)哪些有益的習(xí)慣

從認真傾聽他人,到做一個團隊合作者尝艘,小到出門撿垃圾演侯,再到認真陪孩子做每一個游戲,不浪費食物利耍,以及做事情重視團隊利益而不僅是自身利益蚌本。一絲不茍地完成自己的任務(wù),不辜負任何人和任何任務(wù)隘梨。講故事的能力和敘事能力程癌。另外,永遠不要丟掉內(nèi)心里的激情和好奇心轴猎。

  • 如何選擇方向

無論你去哪里嵌莉,記得要跟最優(yōu)秀的人在一起。確保無論自己去哪里捻脖、做什么锐峭,都可以讓自己獲得盡量多的進步。人生坐標最好時刻指向那個時候?qū)δ銇碚f最好的方向可婶。

  1. Hillary Mason
    Bitly前首席科學(xué)家
    Fast Forward Labs 創(chuàng)始人
    Accel全職數(shù)據(jù)科學(xué)家
    現(xiàn)任Cloudera的機器學(xué)習(xí)部門經(jīng)理
  • 未來5年數(shù)據(jù)領(lǐng)域的前景

多種行業(yè)和專業(yè)的人士會投入數(shù)據(jù)領(lǐng)域沿癞;數(shù)據(jù)工具會飛速發(fā)展;數(shù)據(jù)文化會越來越流行矛渴。

  • 溝通能力和講故事能力的重要性

把從數(shù)據(jù)中分析得到的東西告訴別人椎扬,讓更多并沒有參與這個研究過程的人也知道結(jié)論是什么。創(chuàng)造一個有信服力并且精彩的故事具温,同時要保證故事尊重數(shù)據(jù)事實蚕涤。

但這并不容易。難點在于铣猩,要有同理心揖铜。

除了要理解非常復(fù)雜以及學(xué)術(shù)性的技術(shù),同時還要對一些完全沒有技術(shù)背景的人講解這一切达皿。必須要清楚他們是怎么想的天吓,才能用他們理解的語言來講述贿肩。同時,聽眾能集中精力的時間很短龄寞,很快就會變得不耐煩尸曼,并且絕對不會花費大量的時間去學(xué)習(xí)這些知識。所以必須要想辦法用語言萄焦,或者可視化工具,來讓聽眾理解冤竹。

  • 什么是好的數(shù)據(jù)科學(xué)工作機會拂封?

最好的數(shù)據(jù)科學(xué)工作機會,就是那種有足夠自由度去收集數(shù)據(jù)的工作機會鹦蠕。而收集來的數(shù)據(jù)經(jīng)常是一直在努力創(chuàng)造的一個產(chǎn)品的“副產(chǎn)品”冒签。

  • 新人該如何選擇公司?

了解一個初創(chuàng)公司的文化钟病。

  • 項目管理經(jīng)驗

同時推進幾個項目的進度萧恕,促進項目之間的成員有所交流,讓項目的進度趕得上公司其他部門的進展肠阱。

  • 如何做出對公司有重大影響力的產(chǎn)品和工作票唆?

首先,清晰定義問題屹徘,推薦的辦法是用最簡潔的語言描述出來走趋,寫在一張白紙上。

其次噪伊,預(yù)估項目進度簿煌,設(shè)定衡量指標。

最后鉴吹,找到入手點姨伟。入手時,就要有長期規(guī)劃豆励,確倍峄模可以通過這一階段的工作,更深入地了解數(shù)據(jù)肆糕、確保每一個項目都時刻與公司的業(yè)務(wù)和產(chǎn)品相關(guān)般堆。

  • 如何打造數(shù)據(jù)科學(xué)團隊?

能快速學(xué)習(xí)诚啃、有非常多創(chuàng)意淮摔、能夠靈活變通,以及能夠與你公司的軟件工程開發(fā)部門通力協(xié)作的人始赎。

  1. Pete Skomoroch
    教育經(jīng)歷:布蘭迪斯大學(xué)·數(shù)學(xué)物理雙學(xué)位
    職業(yè)經(jīng)歷:Analytics和橙、MIT Lincoln Laboratory仔燕、AOL Search、LinkedIn(主管就是DJ Patil)
    LinkedIn Skills & Endorsements功能的創(chuàng)造者
  • 數(shù)據(jù)科學(xué)家與其它職位最核心的差別魔招?

我們不想要招聘那種可以做商業(yè)智能分析晰搀,但是完全不會寫代碼的人;同樣我們也不想要那種只能干純編碼的工作而完全沒有任何科學(xué)或者數(shù)學(xué)背景的人办斑。我們期待那種有復(fù)合背景的人外恕。我認為這其實就是數(shù)據(jù)科學(xué)的精髓所在,它是跨學(xué)科的領(lǐng)域乡翅。

  • 該學(xué)習(xí)什么課程鳞疲?

盡量多地選修物理學(xué)和數(shù)學(xué)課程,同時選修一些計算機課程蠕蚜。

  • Pete的“地獄般”的工作尚洽、學(xué)習(xí)經(jīng)歷

”我經(jīng)常很晚都在辦公室里,確認那些周期運行的模型在順利地跑著靶累,研讀上千張與模型有關(guān)的表格與日志腺毫。”

“我經(jīng)常早上醒來就去萊克星頓工作挣柬,然后去麻省理工圖書館通宵熬夜學(xué)習(xí)潮酒,只吃自動販賣機的東西,把所有的時間都用來解決各種難題邪蛔,然后第二天再去工作澈灼,完全就不睡覺。在這樣做之后店溢,我偶爾會回家去叁熔,身體崩潰到不行,但是之后我又會繼續(xù)重復(fù)這樣的過程床牧∪倩兀”

  • 聰明+努力

聰慧只能幫你走到一定的高度,再往后只能依賴努力了戈咳,因為任何值得做的事情都必須花時間去搞定心软,并且你必須要追根溯源地深挖下去。

  • 管理者要不要掌握編碼能力著蛙?

“如果你即將轉(zhuǎn)入管理崗位删铃,我建議你不要完全放棄編程。保留一些編程的底子和基礎(chǔ)踏堡,將有助于你跟上新工具的發(fā)展猎唁、新處理方法的發(fā)明、新的代碼庫以及最新的那些黑科技和編程語言顷蟆。所有這一切都是很重要的诫隅,因為你距離一線的開發(fā)技術(shù)越遠腐魂,你越難以做出明智的決策。這是一個科技飛速迭代的世界逐纬,尤其是數(shù)據(jù)科學(xué)領(lǐng)域蛔屹。”

  • 做項目和講述項目的平衡點

“我個人會在講述項目和做項目這兩者之間求取平衡點豁生。我的建議就是兔毒,努力工作、長時間工作甸箱,然后告訴別人你做了什么眼刃,之后你就可以向著下一步努力了∫〖。”

  • 數(shù)據(jù)在未來的應(yīng)用前景

一,越來越多的數(shù)據(jù)垂直領(lǐng)域公司將會出現(xiàn)仪际。

二围小, 社交數(shù)據(jù)。現(xiàn)階段所有產(chǎn)出的社交數(shù)據(jù)其實都能夠以一種全新的方式去表征世界現(xiàn)象以及人們的行為树碱。

  1. Mike Dewar
    教育經(jīng)歷:謝菲爾德大學(xué)博士肯适,研究方向是使用數(shù)據(jù)對復(fù)雜系統(tǒng)建模;愛丁堡大學(xué)成榜、哥倫比亞大學(xué)博士后框舔。
    職業(yè)經(jīng)歷:Bitly(他在哥大的老板與Hillary Mason相識,因此去了Bitly)赎婚,《紐約時報》研究與開發(fā)實驗室刘绣。
  • 畫圖的重要性

一開始就要作圖。通過畫圖來表示事物是怎么運轉(zhuǎn)的挣输,哪怕是最簡單的流程圖表或者工程圖譜都可以纬凤。很快地做出很粗糙的圖片來查看一批數(shù)據(jù)是怎樣的,從時間序列和柱狀圖開始撩嚼。努力去想如何進行圖形建模停士,并且盡量利用你面前所擁有的系統(tǒng)和數(shù)據(jù),去幫助自己思考各種可能性是如何組合在一起的完丽。

一恋技,可以用圖來驗證對于整個系統(tǒng)機理做出的假設(shè)是否正確;二逻族,可以盡快地深入理解數(shù)據(jù)集蜻底。

  • 將大數(shù)據(jù)看作一種文化現(xiàn)象

一, 當下聘鳞,對于數(shù)據(jù)的采集量朱躺,以及數(shù)據(jù)的需求量都在發(fā)生劇變刁赖,而用于存儲數(shù)據(jù)、處理數(shù)據(jù)以及轉(zhuǎn)移數(shù)據(jù)的各種成本都在不斷下降长搀。

二宇弛,越來越多的數(shù)據(jù)都開始被開放出來供人們使用。

  • 對從學(xué)術(shù)圈轉(zhuǎn)向數(shù)據(jù)科學(xué)的博士研究生有什么建議源请?

公開編程枪芒、構(gòu)建人際網(wǎng)絡(luò)、利用所學(xué)進行社會實踐谁尸。

  1. Riley Newman
    教育經(jīng)歷:華盛頓大學(xué)國際政治與經(jīng)濟學(xué)士舅踪、碩士、劍橋大學(xué)博士(肄業(yè))良蛮。
    職業(yè)經(jīng)歷:經(jīng)濟咨詢領(lǐng)域抽碌,Airbnb數(shù)據(jù)主管。
    (注:我覺得對Riley的采訪沒做好决瞳,問的問題大多是關(guān)于Airbnb公司货徙,而不是關(guān)于數(shù)據(jù)的)
  • Airbnb的招聘

“我團隊里所有人都在計量計算方面有一定程度的訓(xùn)練,不過我比較希望我的團隊擁有來自不同背景的人皮胡,因為這樣可以使得不同的技能得以交流溝通痴颊,我們也許也可以用不同的辦法去解決問題÷藕兀”

在Airbnb蠢棱,我們主要使用Hive、R甩栈、Python和Excel泻仙。

  • 數(shù)據(jù)科學(xué)可以給公司帶來什么價值?

數(shù)據(jù)可以在所有方面都有所建樹量没。數(shù)據(jù)是客戶發(fā)出的聲音——數(shù)據(jù)是用于記錄客戶在產(chǎn)品上的各種行為的一個非常有效的工具饰豺,它代表了用戶使用你的產(chǎn)品,為了他們想要做的事兒(或者不想做的事兒)所做的決定允蜈。數(shù)據(jù)科學(xué)家可以將這樣的決定翻譯成故事講述給別人去理解冤吨。

  • 數(shù)據(jù)科學(xué)的前景?

我們將會看到一大批工具的出現(xiàn)饶套。

數(shù)據(jù)的采集會取得長足的進步漩蟆。

數(shù)據(jù)科學(xué)會迎來普及化大潮。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末妓蛮,一起剝皮案震驚了整個濱河市怠李,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖捺癞,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件夷蚊,死亡現(xiàn)場離奇詭異,居然都是意外死亡髓介,警方通過查閱死者的電腦和手機惕鼓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來唐础,“玉大人箱歧,你說我怎么就攤上這事∫慌颍” “怎么了呀邢?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長豹绪。 經(jīng)常有香客問我价淌,道長纽窟,這世上最難降的妖魔是什么拧额? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮赏陵,結(jié)果婚禮上仲智,老公的妹妹穿的比我還像新娘。我一直安慰自己姻氨,他們只是感情好钓辆,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著肴焊,像睡著了一般前联。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上娶眷,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天似嗤,我揣著相機與錄音,去河邊找鬼届宠。 笑死烁落,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的豌注。 我是一名探鬼主播伤塌,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼轧铁!你這毒婦竟也來了每聪?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎药薯,沒想到半個月后绑洛,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡童本,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年真屯,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片巾陕。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡讨跟,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出鄙煤,到底是詐尸還是另有隱情晾匠,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布梯刚,位于F島的核電站凉馆,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏亡资。R本人自食惡果不足惜澜共,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望锥腻。 院中可真熱鬧嗦董,春花似錦、人聲如沸瘦黑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽幸斥。三九已至匹摇,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間甲葬,已是汗流浹背廊勃。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留经窖,地道東北人坡垫。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像画侣,于是被迫代替她去往敵國和親葛虐。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容