六年前森瘪,“哈佛商業(yè)評論”將數(shù)據(jù)科學(xué)家評為“21世紀(jì)最性感的工作”。從那時起票堵,數(shù)據(jù)科學(xué)家已經(jīng)成為美國發(fā)展最快的職業(yè)之一扼睬,畢業(yè)生的起薪達(dá)到六位數(shù),雇主需求繼續(xù)超過供給悴势。
但是窗宇,這些人幸運地得到了Glassdoor稱之為“美國最佳工作”的演出?成為其中之一需要什么特纤?并且正在成為一名數(shù)據(jù)科學(xué)家真的和你認(rèn)為的炒作一樣偉大嗎军俊?
為了探究這些問題,我使用Stack Overflow收集的數(shù)據(jù)來回應(yīng)他們2018年的年度開發(fā)者調(diào)查捧存。該數(shù)據(jù)集包含來自全球183個國家和地區(qū)的軟件開發(fā)人員的近100,000份回復(fù)粪躬。
在受訪者中担败,有7,088人(7.7%)自稱為數(shù)據(jù)科學(xué)家。這些受訪者與數(shù)據(jù)所代表的其余85,010名非數(shù)據(jù)科學(xué)家軟件開發(fā)人員進(jìn)行了比較镰官。
第1部分:“典型”數(shù)據(jù)科學(xué)家的樣子是什么提前?
歷史上,計算機(jī)科學(xué)和軟件開發(fā)被描述為書呆子男性程序員的領(lǐng)域朋魔。只要看看HBO 硅谷的演員 (如圖所示)岖研,看看我的意思。
但隨著最近圍繞數(shù)據(jù)科學(xué)的炒作警检,我希望這可能已經(jīng)發(fā)生了變化孙援。在“21世紀(jì)最性感的工作”中工作的前景是否足以吸引更多人口眾多的個人加入計算機(jī)和科技?答案似乎是 否定的扇雕。
圖1:數(shù)據(jù)科學(xué)家(DS)與非數(shù)據(jù)科學(xué)家(Non_DS)的性別(左)和年齡(右)分布比較
從圖1中可以看出拓售,數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家受訪者的年齡和性別分布幾乎相同。數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家的平均年齡為30.5歲镶奉,91%的數(shù)據(jù)科學(xué)家是男性础淤,而非數(shù)據(jù)科學(xué)家的這一比例為92%。
這表明哨苛,數(shù)據(jù)科學(xué)工作的增長不僅沒有吸引人們從新的人口統(tǒng)計數(shù)據(jù)到計算和技術(shù)鸽凶,而是為那些有可能成為開發(fā)人員的人創(chuàng)造了新的職業(yè)道路。
然而建峭,比較數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家的教育背景確實揭示了這兩個群體之間的一個關(guān)鍵差異玻侥。
圖2:數(shù)據(jù)科學(xué)家(DS)與非數(shù)據(jù)科學(xué)家(Non_DS)的最高級別分布比較
圖2顯示,盡管與普遍看法相反亿蒸,有可能成為沒有碩士或博士學(xué)位的數(shù)據(jù)科學(xué)家凑兰,數(shù)據(jù)科學(xué)家比非數(shù)據(jù)科學(xué)家更有可能擁有高級學(xué)位,45%數(shù)據(jù)科學(xué)家的受訪者持有碩士或博士學(xué)位边锁,相比之下姑食,23%的非數(shù)據(jù)科學(xué)家。
這表明數(shù)據(jù)科學(xué)和非數(shù)據(jù)科學(xué)開發(fā)人員角色所需技能的差異茅坛,數(shù)據(jù)科學(xué)角色更可能需要作為高級學(xué)位課程的一部分教授的技能音半。
第2部分:數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家之間的編碼技巧有何不同?
鑒于雇主對數(shù)據(jù)科學(xué)家角色的學(xué)術(shù)要求較高贡蓖,這就提出了一個問題:與非數(shù)據(jù)科學(xué)家相比祟剔,雇主還需要更多的數(shù)據(jù)科學(xué)家編碼經(jīng)驗嗎?
事實上摩梧,圖3顯示了相反的情況物延。
圖3:數(shù)據(jù)科學(xué)家(DS)與非數(shù)據(jù)科學(xué)家(Non_DS)的專業(yè)編碼經(jīng)驗分布比較
與非數(shù)據(jù)科學(xué)家開發(fā)人員相比,數(shù)據(jù)科學(xué)家通常擁有更少的專業(yè)編碼經(jīng)驗仅父,62%的數(shù)據(jù)科學(xué)家受訪者擁有5年或更少的專業(yè)編碼經(jīng)驗叛薯,而非數(shù)據(jù)科學(xué)家的這一比例為57%浑吟。
這表明,在開發(fā)者角色中耗溜,不是要求更多的數(shù)據(jù)科學(xué)家在各方面组力,而是在編碼技能和大學(xué)教授的各種技術(shù)技能之間進(jìn)行權(quán)衡。
然而抖拴,并非所有編程語言都是平等的燎字,數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家在日常工作中使用的編程語言不一定相同。
數(shù)據(jù)科學(xué)家更有可能使用為Python或R等統(tǒng)計建模和分析設(shè)計或使用庫的語言阿宅,而非數(shù)據(jù)科學(xué)家更有可能使用與Web開發(fā)活動相關(guān)的語言進(jìn)行編程候衍,例如HTML,CSS和JavaScript洒放。
例如蛉鹿,77%的數(shù)據(jù)科學(xué)家報告在過去一年中使用Python編程,而非數(shù)據(jù)科學(xué)家的這一比例為35%往湿,而72%的非數(shù)據(jù)科學(xué)家報告說在過去一年中使用過JavaScript編程妖异,而55%數(shù)據(jù)科學(xué)家。
這反映了數(shù)據(jù)科學(xué)家通常執(zhí)行的任務(wù)類型的差異领追,數(shù)據(jù)科學(xué)家通常專注于使用統(tǒng)計和建模技術(shù)從數(shù)據(jù)中獲取洞察力他膳,而非數(shù)據(jù)科學(xué)家更有可能參與軟件工程或Web開發(fā) - 類型活動。
第3部分:數(shù)據(jù)科學(xué)家對他們的職業(yè)生涯比非數(shù)據(jù)科學(xué)家更滿意嗎绒窑?
如果數(shù)據(jù)科學(xué)家真的是現(xiàn)在最好的工作棕孙,那么我們期望數(shù)據(jù)科學(xué)家比非數(shù)據(jù)科學(xué)家更滿意他們的工作和他們的職業(yè)生涯。這正是我們從數(shù)據(jù)中觀察到的回论。
然而散罕,盡管數(shù)據(jù)科學(xué)家確實比非數(shù)據(jù)科學(xué)家對工作和職業(yè)生涯更滿意分歇,但這兩個群體往往在工作和職業(yè)生涯中都享有高水平的滿足感傀蓉。
圖4顯示,73%的數(shù)據(jù)科學(xué)家和70%的非數(shù)據(jù)科學(xué)家對他們的工作至少略微滿意职抡,而74%的數(shù)據(jù)科學(xué)家和73%的非數(shù)據(jù)科學(xué)家至少對他們的職業(yè)生涯略感滿意葬燎。
圖4:數(shù)據(jù)科學(xué)家(DS)與非數(shù)據(jù)科學(xué)家(非DS)的工作滿意度(左)和職業(yè)滿意度(右)分布的比較
因此,即使數(shù)據(jù)科學(xué)的職業(yè)不適合您缚甩,任何與發(fā)展相關(guān)的角色都可能導(dǎo)致工作和職業(yè)滿意度水平與“美國最佳工作”相似谱净。
結(jié)論
在探索了作為數(shù)據(jù)科學(xué)家的工作所需的內(nèi)容之后,以及如何與登陸非數(shù)據(jù)科學(xué)家開發(fā)人員角色擅威,以及比較這兩組人員的工作水平和職業(yè)滿意度壕探,我們發(fā)現(xiàn):
- 盡管數(shù)據(jù)科學(xué)家和非數(shù)據(jù)科學(xué)家傾向于來自相似的人口統(tǒng)計背景(即主要是年輕男性),但數(shù)據(jù)科學(xué)家比非數(shù)據(jù)科學(xué)家更有可能擁有高級學(xué)位郊丛,但往往缺乏專業(yè)的編碼經(jīng)驗李请。
- 數(shù)據(jù)科學(xué)家更傾向于使用統(tǒng)計和建模為重點的編程語言瞧筛,如Python和R,而不是非數(shù)據(jù)科學(xué)家同行导盅,他們傾向于支持基于Web開發(fā)的語言较幌,如HTML,CSS和JavaScript白翻。
- 盡管數(shù)據(jù)科學(xué)家比非數(shù)據(jù)科學(xué)家享有更高的工作和職業(yè)滿意度乍炉,但這兩個群體往往對自己的工作和職業(yè)非常滿意。
綜上所述滤馍,一個典型的數(shù)據(jù)科學(xué)家似乎是一個刻板的書呆子男性程序員:一個30多歲的男性岛琼,具有高級學(xué)位和一些使用Python或R等語言編程的專業(yè)經(jīng)驗。
然而纪蜒,僅僅因為這是“典型”數(shù)據(jù)科學(xué)家現(xiàn)在的樣子衷恭,這并不意味著這將是未來的樣子。事實上纯续,為了全球經(jīng)濟(jì)随珠,這種形象 必須 改變。
如前所述猬错,數(shù)據(jù)科學(xué)是一個快速發(fā)展的行業(yè)窗看,需求一直超過供應(yīng),預(yù)計將在未來許多年內(nèi)持續(xù)發(fā)展倦炒。
滿足這種需求的最佳方式是雇主尋找方法來吸引傳統(tǒng)上在計算機(jī)科學(xué)和技術(shù)中代表性不足的人口群體中的個人显沈。
如果您認(rèn)為自己不適合“典型”的數(shù)據(jù)科學(xué)家模型,那么逢唤,我的建議是: 不要氣餒拉讯。
數(shù)據(jù)科學(xué)專業(yè)為各種背景的人提供了充足的空間,根據(jù)數(shù)據(jù)科學(xué)家所享有的工作和職業(yè)滿意度鳖藕,開發(fā)獲得數(shù)據(jù)科學(xué)所需技能的工作非常值得魔慷。
畢竟,誰不想在“21世紀(jì)最性感的工作”中工作著恩?