如何組建數(shù)據(jù)科學(xué)團(tuán)隊(duì)

今天近乎所有的互聯(lián)網(wǎng)公司都希望組建(大)數(shù)據(jù)分析團(tuán)隊(duì),但由于大數(shù)據(jù)技術(shù)應(yīng)用是一個(gè)高速發(fā)展的全新領(lǐng)域搓茬,與建設(shè)常規(guī)的軟件開發(fā)團(tuán)隊(duì)相比旦事,企業(yè)在數(shù)據(jù)科學(xué)團(tuán)隊(duì)的招聘么翰、建設(shè)和成長(zhǎng)方面面臨各種全新的挑戰(zhàn)。

對(duì)于人力資源經(jīng)理來(lái)說(shuō)过蹂,大數(shù)據(jù)分析人才的招聘說(shuō)明中有太多的生詞十绑,包括各種大數(shù)據(jù)新鮮名詞聚至、算法和技能酷勺,而且整個(gè)技術(shù)人才市場(chǎng)對(duì)大數(shù)據(jù)經(jīng)驗(yàn)、最佳實(shí)踐的定義和標(biāo)準(zhǔn)尚無(wú)定論扳躬。

企業(yè)組建大數(shù)據(jù)分析團(tuán)隊(duì)首先需要搞清楚以下三個(gè)問(wèn)題:數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的智能定位脆诉、所需資源以及數(shù)據(jù)分析團(tuán)隊(duì)的架構(gòu)。

職能定位

企業(yè)上下需要在一開始就明確數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的定位贷币,以及主要的利益相關(guān)者击胜。

不同企業(yè)的做法不同,有的企業(yè)讓CTO領(lǐng)導(dǎo)數(shù)據(jù)科學(xué)團(tuán)隊(duì)役纹,有的則選擇讓CFO甚至CMO領(lǐng)導(dǎo)偶摔,有的選擇由一個(gè)項(xiàng)目經(jīng)理統(tǒng)領(lǐng)分散于不同業(yè)務(wù)部門的數(shù)據(jù)專家,還有一些企業(yè)將數(shù)據(jù)科學(xué)團(tuán)隊(duì)定位于研發(fā)團(tuán)隊(duì)促脉,沒(méi)有具體的日程表或利益相關(guān)者辰斋。

以上取決于企業(yè)的組織模式、企業(yè)文化瘸味、資源和數(shù)據(jù)科學(xué)團(tuán)隊(duì)的具體任務(wù)宫仗。由于數(shù)據(jù)科學(xué)如此性感,企業(yè)的高官們都想將其納入自己的管轄范圍旁仿,因此如果不能事先明確數(shù)據(jù)科學(xué)團(tuán)隊(duì)的職能定位藕夫,在日后的運(yùn)營(yíng)中勢(shì)必引起各部門之間的困惑和摩擦。

資源需求

了解技術(shù)人才市場(chǎng)的人都知道枯冈,數(shù)據(jù)科學(xué)人才的身價(jià)不菲毅贮,而企業(yè)往往在組建數(shù)據(jù)科學(xué)團(tuán)隊(duì)前對(duì)資源需求估計(jì)不足。

對(duì)于一個(gè)超過(guò)300人的互聯(lián)網(wǎng)公司來(lái)說(shuō)尘奏,如果想組建一個(gè)有明確任務(wù)(例如推薦引擎滩褥、用戶激活等)的數(shù)據(jù)科學(xué)團(tuán)隊(duì),第一階段可以考慮組建一個(gè)5-8人的團(tuán)隊(duì)罪既,包括一名技術(shù)項(xiàng)目經(jīng)理铸题、1-2名負(fù)責(zé)建模的數(shù)據(jù)科學(xué)家,以及3-5名數(shù)據(jù)工程師負(fù)責(zé)部署生產(chǎn)代碼琢感。

團(tuán)隊(duì)構(gòu)成

當(dāng)明確了資源需求和團(tuán)隊(duì)規(guī)模后丢间,下一步面臨的問(wèn)題是如何找到合適的數(shù)據(jù)科學(xué)人才。正如文章開頭提到的驹针,這對(duì)于企業(yè)的人力資源部門來(lái)說(shuō)幾乎是個(gè)不可能完成的任務(wù)烘挫,人力資源經(jīng)理的郵箱會(huì)迅速被充斥各種新鮮技術(shù)名詞的簡(jiǎn)歷填滿。

人力資源部門還非常容易受到媒體或數(shù)據(jù)分析廠商的影響,企業(yè)需要根據(jù)需求自行定義招聘說(shuō)明中的技能要求饮六,例如教育背景與實(shí)操經(jīng)驗(yàn)的孰重孰輕等其垄。當(dāng)然,這些都是說(shuō)起來(lái)容易做起來(lái)難卤橄。

以8人數(shù)據(jù)科學(xué)團(tuán)隊(duì)為例绿满,團(tuán)隊(duì)初創(chuàng)成員大致分為以下三類:

1、技術(shù)項(xiàng)目經(jīng)理窟扑。

擁有3~5年的相關(guān)團(tuán)隊(duì)管理和項(xiàng)目經(jīng)驗(yàn)喇颁;最好擁有扎實(shí)的技術(shù)背景,最好能夠編程(雖然并不需要真的去編程)嚎货。數(shù)據(jù)分析團(tuán)隊(duì)的技術(shù)項(xiàng)目經(jīng)理不僅僅需要豐富的項(xiàng)目管理經(jīng)驗(yàn)橘霎,還必須了解數(shù)據(jù)分析相關(guān)的算法和技能,最好能夠進(jìn)行代碼審核殖属。

2姐叁、數(shù)據(jù)科學(xué)家。

數(shù)據(jù)科學(xué)家要求有廣泛而扎實(shí)的專業(yè)背景洗显,最好擁有物理學(xué)外潜、數(shù)學(xué)、計(jì)算機(jī)科學(xué)墙懂、生物學(xué)或相關(guān)學(xué)科領(lǐng)域的博士學(xué)位橡卤。判斷數(shù)據(jù)科學(xué)家水平最簡(jiǎn)單的依據(jù)是她曾經(jīng)發(fā)表過(guò)的研究論文質(zhì)量。

有一點(diǎn)需要注意的是损搬,一位機(jī)器學(xué)習(xí)領(lǐng)域的資深專家很可能軟件開發(fā)技能很差碧库,因此在考察數(shù)據(jù)科學(xué)家技能時(shí)不要想當(dāng)然,務(wù)必要明確其編程技能巧勤。對(duì)于以應(yīng)用為主的互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō)嵌灰,編程技能對(duì)于一個(gè)初創(chuàng)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)來(lái)說(shuō)非常重要,除非你要組建的是一個(gè)學(xué)術(shù)性的數(shù)據(jù)科學(xué)團(tuán)隊(duì)颅悉。

3沽瞭、數(shù)據(jù)工程師。

不需要太多學(xué)術(shù)背景剩瓶,只要是對(duì)數(shù)據(jù)分析感興趣的靠譜的軟件開發(fā)人員都可勝任驹溃。數(shù)據(jù)工程師需要對(duì)算法、數(shù)據(jù)架構(gòu)和軟件工程有深入了解延曙,尤其是算法層面豌鹤,因?yàn)楹芏嘬浖こ處熯@方面的知識(shí)很薄弱,而對(duì)于數(shù)據(jù)科學(xué)團(tuán)隊(duì)來(lái)說(shuō)算法至關(guān)重要枝缔〔几恚可以嘗試從開源項(xiàng)目的積極貢獻(xiàn)者中去尋找未來(lái)的數(shù)據(jù)工程師。通常對(duì)數(shù)據(jù)工程師的技能要求與數(shù)據(jù)科學(xué)家類似(例如Python、Scala等)

以上每類數(shù)據(jù)科學(xué)人才的招聘要求視企業(yè)和預(yù)算的不同而異灵临,團(tuán)隊(duì)組建初期沒(méi)必要招聘太過(guò)資深的人士截型,因?yàn)樵趫F(tuán)隊(duì)職能和領(lǐng)域范圍在初期會(huì)經(jīng)歷比較大的變動(dòng)。而且數(shù)據(jù)科學(xué)團(tuán)隊(duì)初期由于需要搭建數(shù)據(jù)平臺(tái)儒溉,清洗數(shù)據(jù)宦焦,需要干大量“臟活”。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末睁搭,一起剝皮案震驚了整個(gè)濱河市赶诊,隨后出現(xiàn)的幾起案子笼平,更是在濱河造成了極大的恐慌园骆,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件寓调,死亡現(xiàn)場(chǎng)離奇詭異锌唾,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)夺英,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門晌涕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人痛悯,你說(shuō)我怎么就攤上這事余黎。” “怎么了载萌?”我有些...
    開封第一講書人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵惧财,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我扭仁,道長(zhǎng)垮衷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任乖坠,我火速辦了婚禮搀突,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘熊泵。我一直安慰自己仰迁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開白布顽分。 她就那樣靜靜地躺著徐许,像睡著了一般。 火紅的嫁衣襯著肌膚如雪怯邪。 梳的紋絲不亂的頭發(fā)上绊寻,一...
    開封第一講書人閱讀 49,071評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼澄步。 笑死冰蘑,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的村缸。 我是一名探鬼主播祠肥,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼梯皿!你這毒婦竟也來(lái)了仇箱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤东羹,失蹤者是張志新(化名)和其女友劉穎剂桥,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體属提,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡权逗,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了冤议。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片斟薇。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖恕酸,靈堂內(nèi)的尸體忽然破棺而出堪滨,到底是詐尸還是另有隱情,我是刑警寧澤蕊温,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布袱箱,位于F島的核電站,受9級(jí)特大地震影響寿弱,放射性物質(zhì)發(fā)生泄漏犯眠。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一症革、第九天 我趴在偏房一處隱蔽的房頂上張望筐咧。 院中可真熱鬧,春花似錦噪矛、人聲如沸量蕊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)残炮。三九已至,卻和暖如春缩滨,著一層夾襖步出監(jiān)牢的瞬間势就,已是汗流浹背泉瞻。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留苞冯,地道東北人袖牙。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像舅锄,于是被迫代替她去往敵國(guó)和親鞭达。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容