六年前凡人,“哈佛商業(yè)評論”將數(shù)據(jù)科學家評為“21世紀最性感的工作”。從那時起叹阔,數(shù)據(jù)科學家已經(jīng)成為美國發(fā)展最快的職業(yè)之一挠轴,畢業(yè)生的起薪達到六位數(shù),雇主需求繼續(xù)超過供給耳幢。
但是岸晦,這些人幸運地得到了Glassdoor稱之為“美國最佳工作”的演出?成為其中之一需要什么帅掘?并且正在成為一名數(shù)據(jù)科學家真的和你認為的炒作一樣偉大嗎委煤?
為了探究這些問題,我使用Stack Overflow收集的數(shù)據(jù)來回應他們2018年的年度開發(fā)者調查修档。該數(shù)據(jù)集包含來自全球183個國家和地區(qū)的軟件開發(fā)人員的近100,000份回復碧绞。
在受訪者中,有7,088人(7.7%)自稱為數(shù)據(jù)科學家吱窝。這些受訪者與數(shù)據(jù)所代表的其余85,010名非數(shù)據(jù)科學家軟件開發(fā)人員進行了比較讥邻。
第1部分:“典型”數(shù)據(jù)科學家的樣子是什么?
歷史上院峡,計算機科學和軟件開發(fā)被描述為書呆子男性程序員的領域炉旷。只要看看HBO 硅谷的演員 (如圖所示)优烧,看看我的意思俺叭。
但隨著最近圍繞數(shù)據(jù)科學的炒作铃拇,我希望這可能已經(jīng)發(fā)生了變化。在“21世紀最性感的工作”中工作的前景是否足以吸引更多人口眾多的個人加入計算機和科技俩垃?答案似乎是 否定的励幼。
圖1:數(shù)據(jù)科學家(DS)與非數(shù)據(jù)科學家(Non_DS)的性別(左)和年齡(右)分布比較
從圖1中可以看出,數(shù)據(jù)科學家和非數(shù)據(jù)科學家受訪者的年齡和性別分布幾乎相同口柳。數(shù)據(jù)科學家和非數(shù)據(jù)科學家的平均年齡為30.5歲苹粟,91%的數(shù)據(jù)科學家是男性,而非數(shù)據(jù)科學家的這一比例為92%跃闹。
這表明嵌削,數(shù)據(jù)科學工作的增長不僅沒有吸引人們從新的人口統(tǒng)計數(shù)據(jù)到計算和技術,而是為那些有可能成為開發(fā)人員的人創(chuàng)造了新的職業(yè)道路望艺。
然而苛秕,比較數(shù)據(jù)科學家和非數(shù)據(jù)科學家的教育背景確實揭示了這兩個群體之間的一個關鍵差異。
圖2:數(shù)據(jù)科學家(DS)與非數(shù)據(jù)科學家(Non_DS)的最高級別分布比較
圖2顯示找默,盡管與普遍看法相反想帅,有可能成為沒有碩士或博士學位的數(shù)據(jù)科學家,數(shù)據(jù)科學家比非數(shù)據(jù)科學家更有可能擁有高級學位啡莉,45%數(shù)據(jù)科學家的受訪者持有碩士或博士學位港准,相比之下,23%的非數(shù)據(jù)科學家咧欣。
這表明數(shù)據(jù)科學和非數(shù)據(jù)科學開發(fā)人員角色所需技能的差異浅缸,數(shù)據(jù)科學角色更可能需要作為高級學位課程的一部分教授的技能。
第2部分:數(shù)據(jù)科學家和非數(shù)據(jù)科學家之間的編碼技巧有何不同魄咕?
鑒于雇主對數(shù)據(jù)科學家角色的學術要求較高衩椒,這就提出了一個問題:與非數(shù)據(jù)科學家相比,雇主還需要更多的數(shù)據(jù)科學家編碼經(jīng)驗嗎哮兰?
事實上毛萌,圖3顯示了相反的情況。
圖3:數(shù)據(jù)科學家(DS)與非數(shù)據(jù)科學家(Non_DS)的專業(yè)編碼經(jīng)驗分布比較
與非數(shù)據(jù)科學家開發(fā)人員相比喝滞,數(shù)據(jù)科學家通常擁有更少的專業(yè)編碼經(jīng)驗阁将,62%的數(shù)據(jù)科學家受訪者擁有5年或更少的專業(yè)編碼經(jīng)驗,而非數(shù)據(jù)科學家的這一比例為57%右遭。
這表明做盅,在開發(fā)者角色中,不是要求更多的數(shù)據(jù)科學家在各方面窘哈,而是在編碼技能和大學教授的各種技術技能之間進行權衡吹榴。
然而,并非所有編程語言都是平等的滚婉,數(shù)據(jù)科學家和非數(shù)據(jù)科學家在日常工作中使用的編程語言不一定相同图筹。
數(shù)據(jù)科學家更有可能使用為Python或R等統(tǒng)計建模和分析設計或使用庫的語言,而非數(shù)據(jù)科學家更有可能使用與Web開發(fā)活動相關的語言進行編程让腹,例如HTML远剩,CSS和JavaScript。
例如哨鸭,77%的數(shù)據(jù)科學家報告在過去一年中使用Python編程民宿,而非數(shù)據(jù)科學家的這一比例為35%,而72%的非數(shù)據(jù)科學家報告說在過去一年中使用過JavaScript編程像鸡,而55%數(shù)據(jù)科學家活鹰。
這反映了數(shù)據(jù)科學家通常執(zhí)行的任務類型的差異,數(shù)據(jù)科學家通常專注于使用統(tǒng)計和建模技術從數(shù)據(jù)中獲取洞察力只估,而非數(shù)據(jù)科學家更有可能參與軟件工程或Web開發(fā) - 類型活動志群。
第3部分:數(shù)據(jù)科學家對他們的職業(yè)生涯比非數(shù)據(jù)科學家更滿意嗎?
如果數(shù)據(jù)科學家真的是現(xiàn)在最好的工作蛔钙,那么我們期望數(shù)據(jù)科學家比非數(shù)據(jù)科學家更滿意他們的工作和他們的職業(yè)生涯锌云。這正是我們從數(shù)據(jù)中觀察到的。
然而吁脱,盡管數(shù)據(jù)科學家確實比非數(shù)據(jù)科學家對工作和職業(yè)生涯更滿意桑涎,但這兩個群體往往在工作和職業(yè)生涯中都享有高水平的滿足感彬向。
圖4顯示,73%的數(shù)據(jù)科學家和70%的非數(shù)據(jù)科學家對他們的工作至少略微滿意攻冷,而74%的數(shù)據(jù)科學家和73%的非數(shù)據(jù)科學家至少對他們的職業(yè)生涯略感滿意娃胆。
圖4:數(shù)據(jù)科學家(DS)與非數(shù)據(jù)科學家(非DS)的工作滿意度(左)和職業(yè)滿意度(右)分布的比較
因此,即使數(shù)據(jù)科學的職業(yè)不適合您等曼,任何與發(fā)展相關的角色都可能導致工作和職業(yè)滿意度水平與“美國最佳工作”相似里烦。
結論
在探索了作為數(shù)據(jù)科學家的工作所需的內容之后,以及如何與登陸非數(shù)據(jù)科學家開發(fā)人員角色禁谦,以及比較這兩組人員的工作水平和職業(yè)滿意度胁黑,我們發(fā)現(xiàn):
- 盡管數(shù)據(jù)科學家和非數(shù)據(jù)科學家傾向于來自相似的人口統(tǒng)計背景(即主要是年輕男性),但數(shù)據(jù)科學家比非數(shù)據(jù)科學家更有可能擁有高級學位州泊,但往往缺乏專業(yè)的編碼經(jīng)驗丧蘸。
- 數(shù)據(jù)科學家更傾向于使用統(tǒng)計和建模為重點的編程語言,如Python和R拥诡,而不是非數(shù)據(jù)科學家同行触趴,他們傾向于支持基于Web開發(fā)的語言,如HTML渴肉,CSS和JavaScript冗懦。
- 盡管數(shù)據(jù)科學家比非數(shù)據(jù)科學家享有更高的工作和職業(yè)滿意度,但這兩個群體往往對自己的工作和職業(yè)非常滿意仇祭。
綜上所述披蕉,一個典型的數(shù)據(jù)科學家似乎是一個刻板的書呆子男性程序員:一個30多歲的男性,具有高級學位和一些使用Python或R等語言編程的專業(yè)經(jīng)驗乌奇。
然而没讲,僅僅因為這是“典型”數(shù)據(jù)科學家現(xiàn)在的樣子,這并不意味著這將是未來的樣子礁苗。事實上爬凑,為了全球經(jīng)濟,這種形象 必須 改變试伙。
如前所述嘁信,數(shù)據(jù)科學是一個快速發(fā)展的行業(yè),需求一直超過供應疏叨,預計將在未來許多年內持續(xù)發(fā)展潘靖。
滿足這種需求的最佳方式是雇主尋找方法來吸引傳統(tǒng)上在計算機科學和技術中代表性不足的人口群體中的個人。
如果您認為自己不適合“典型”的數(shù)據(jù)科學家模型蚤蔓,那么卦溢,我的建議是: 不要氣餒。
數(shù)據(jù)科學專業(yè)為各種背景的人提供了充足的空間,根據(jù)數(shù)據(jù)科學家所享有的工作和職業(yè)滿意度单寂,開發(fā)獲得數(shù)據(jù)科學所需技能的工作非常值得贬芥。
畢竟,誰不想在“21世紀最性感的工作”中工作宣决?