今天近乎所有的互聯(lián)網(wǎng)公司都希望組建(大)數(shù)據(jù)分析團(tuán)隊(duì),但由于大數(shù)據(jù)技術(shù)應(yīng)用是一個(gè)高速發(fā)展的全新領(lǐng)域搓茬,與建設(shè)常規(guī)的軟件開發(fā)團(tuán)隊(duì)相比旦事,企業(yè)在數(shù)據(jù)科學(xué)團(tuán)隊(duì)的招聘么翰、建設(shè)和成長(zhǎng)方面面臨各種全新的挑戰(zhàn)。
對(duì)于人力資源經(jīng)理來(lái)說(shuō)过蹂,大數(shù)據(jù)分析人才的招聘說(shuō)明中有太多的生詞十绑,包括各種大數(shù)據(jù)新鮮名詞聚至、算法和技能酷勺,而且整個(gè)技術(shù)人才市場(chǎng)對(duì)大數(shù)據(jù)經(jīng)驗(yàn)、最佳實(shí)踐的定義和標(biāo)準(zhǔn)尚無(wú)定論扳躬。
企業(yè)組建大數(shù)據(jù)分析團(tuán)隊(duì)首先需要搞清楚以下三個(gè)問(wèn)題:數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的智能定位脆诉、所需資源以及數(shù)據(jù)分析團(tuán)隊(duì)的架構(gòu)。
職能定位
企業(yè)上下需要在一開始就明確數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的定位贷币,以及主要的利益相關(guān)者击胜。
不同企業(yè)的做法不同,有的企業(yè)讓CTO領(lǐng)導(dǎo)數(shù)據(jù)科學(xué)團(tuán)隊(duì)役纹,有的則選擇讓CFO甚至CMO領(lǐng)導(dǎo)偶摔,有的選擇由一個(gè)項(xiàng)目經(jīng)理統(tǒng)領(lǐng)分散于不同業(yè)務(wù)部門的數(shù)據(jù)專家,還有一些企業(yè)將數(shù)據(jù)科學(xué)團(tuán)隊(duì)定位于研發(fā)團(tuán)隊(duì)促脉,沒(méi)有具體的日程表或利益相關(guān)者辰斋。
以上取決于企業(yè)的組織模式、企業(yè)文化瘸味、資源和數(shù)據(jù)科學(xué)團(tuán)隊(duì)的具體任務(wù)宫仗。由于數(shù)據(jù)科學(xué)如此性感,企業(yè)的高官們都想將其納入自己的管轄范圍旁仿,因此如果不能事先明確數(shù)據(jù)科學(xué)團(tuán)隊(duì)的職能定位藕夫,在日后的運(yùn)營(yíng)中勢(shì)必引起各部門之間的困惑和摩擦。
資源需求
了解技術(shù)人才市場(chǎng)的人都知道枯冈,數(shù)據(jù)科學(xué)人才的身價(jià)不菲毅贮,而企業(yè)往往在組建數(shù)據(jù)科學(xué)團(tuán)隊(duì)前對(duì)資源需求估計(jì)不足。
對(duì)于一個(gè)超過(guò)300人的互聯(lián)網(wǎng)公司來(lái)說(shuō)尘奏,如果想組建一個(gè)有明確任務(wù)(例如推薦引擎滩褥、用戶激活等)的數(shù)據(jù)科學(xué)團(tuán)隊(duì),第一階段可以考慮組建一個(gè)5-8人的團(tuán)隊(duì)罪既,包括一名技術(shù)項(xiàng)目經(jīng)理铸题、1-2名負(fù)責(zé)建模的數(shù)據(jù)科學(xué)家,以及3-5名數(shù)據(jù)工程師負(fù)責(zé)部署生產(chǎn)代碼琢感。
團(tuán)隊(duì)構(gòu)成
當(dāng)明確了資源需求和團(tuán)隊(duì)規(guī)模后丢间,下一步面臨的問(wèn)題是如何找到合適的數(shù)據(jù)科學(xué)人才。正如文章開頭提到的驹针,這對(duì)于企業(yè)的人力資源部門來(lái)說(shuō)幾乎是個(gè)不可能完成的任務(wù)烘挫,人力資源經(jīng)理的郵箱會(huì)迅速被充斥各種新鮮技術(shù)名詞的簡(jiǎn)歷填滿。
人力資源部門還非常容易受到媒體或數(shù)據(jù)分析廠商的影響,企業(yè)需要根據(jù)需求自行定義招聘說(shuō)明中的技能要求饮六,例如教育背景與實(shí)操經(jīng)驗(yàn)的孰重孰輕等其垄。當(dāng)然,這些都是說(shuō)起來(lái)容易做起來(lái)難卤橄。
以8人數(shù)據(jù)科學(xué)團(tuán)隊(duì)為例绿满,團(tuán)隊(duì)初創(chuàng)成員大致分為以下三類:
1、技術(shù)項(xiàng)目經(jīng)理窟扑。
擁有3~5年的相關(guān)團(tuán)隊(duì)管理和項(xiàng)目經(jīng)驗(yàn)喇颁;最好擁有扎實(shí)的技術(shù)背景,最好能夠編程(雖然并不需要真的去編程)嚎货。數(shù)據(jù)分析團(tuán)隊(duì)的技術(shù)項(xiàng)目經(jīng)理不僅僅需要豐富的項(xiàng)目管理經(jīng)驗(yàn)橘霎,還必須了解數(shù)據(jù)分析相關(guān)的算法和技能,最好能夠進(jìn)行代碼審核殖属。
2姐叁、數(shù)據(jù)科學(xué)家。
數(shù)據(jù)科學(xué)家要求有廣泛而扎實(shí)的專業(yè)背景洗显,最好擁有物理學(xué)外潜、數(shù)學(xué)、計(jì)算機(jī)科學(xué)墙懂、生物學(xué)或相關(guān)學(xué)科領(lǐng)域的博士學(xué)位橡卤。判斷數(shù)據(jù)科學(xué)家水平最簡(jiǎn)單的依據(jù)是她曾經(jīng)發(fā)表過(guò)的研究論文質(zhì)量。
有一點(diǎn)需要注意的是损搬,一位機(jī)器學(xué)習(xí)領(lǐng)域的資深專家很可能軟件開發(fā)技能很差碧库,因此在考察數(shù)據(jù)科學(xué)家技能時(shí)不要想當(dāng)然,務(wù)必要明確其編程技能巧勤。對(duì)于以應(yīng)用為主的互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō)嵌灰,編程技能對(duì)于一個(gè)初創(chuàng)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)來(lái)說(shuō)非常重要,除非你要組建的是一個(gè)學(xué)術(shù)性的數(shù)據(jù)科學(xué)團(tuán)隊(duì)颅悉。
3沽瞭、數(shù)據(jù)工程師。
不需要太多學(xué)術(shù)背景剩瓶,只要是對(duì)數(shù)據(jù)分析感興趣的靠譜的軟件開發(fā)人員都可勝任驹溃。數(shù)據(jù)工程師需要對(duì)算法、數(shù)據(jù)架構(gòu)和軟件工程有深入了解延曙,尤其是算法層面豌鹤,因?yàn)楹芏嘬浖こ處熯@方面的知識(shí)很薄弱,而對(duì)于數(shù)據(jù)科學(xué)團(tuán)隊(duì)來(lái)說(shuō)算法至關(guān)重要枝缔〔几恚可以嘗試從開源項(xiàng)目的積極貢獻(xiàn)者中去尋找未來(lái)的數(shù)據(jù)工程師。通常對(duì)數(shù)據(jù)工程師的技能要求與數(shù)據(jù)科學(xué)家類似(例如Python、Scala等)
以上每類數(shù)據(jù)科學(xué)人才的招聘要求視企業(yè)和預(yù)算的不同而異灵临,團(tuán)隊(duì)組建初期沒(méi)必要招聘太過(guò)資深的人士截型,因?yàn)樵趫F(tuán)隊(duì)職能和領(lǐng)域范圍在初期會(huì)經(jīng)歷比較大的變動(dòng)。而且數(shù)據(jù)科學(xué)團(tuán)隊(duì)初期由于需要搭建數(shù)據(jù)平臺(tái)儒溉,清洗數(shù)據(jù)宦焦,需要干大量“臟活”。