什么是數(shù)據科學1

數(shù)據科學和數(shù)據科學家成為了流行詞匯赞庶。當有人問你干什么训挡,你回答說數(shù)據科學家。對方會恍然大悟歧强,覺得特別高大上澜薄,奧,數(shù)據科學家啊摊册,聽說過肤京。是啊,沒聽說過數(shù)據科學家那就out了茅特。如果接著問忘分,數(shù)據科學家具體干什么的?然后就沒有然后了白修。不知道你們有沒有聽過這樣一則軼事妒峦,美國最高法院法官Potter Stewart被問到什么是淫穢時,他回答:“看下才知道兵睛】虾В”這和數(shù)據科學很類似窥浪,很多概念,在大而化之的時候都可以存在笛丙,大家口耳相傳寒矿,聊的不亦樂乎,但一追究細節(jié)若债,立即土崩瓦解。那么什么是數(shù)據科學家呢拆融?我谷歌了一下數(shù)據科學家的定義蠢琳,下面是其中的一些:

  1. 住在加州的數(shù)據分析師
  2. 數(shù)據科學家是商業(yè)(數(shù)據)分析師的進化版
  3. 比軟件學家更懂統(tǒng)計,比統(tǒng)計學家更懂軟件科學的人
  4. 擁有出眾數(shù)據分析能力的BI咨詢師镜豹,尤其是能用大量數(shù)據增加商業(yè)競爭力的人
  5. 會編程傲须,懂統(tǒng)計,能通過多種方式從數(shù)據中掘金的人

此外趟脂,很多其它職位其職責都和“從數(shù)據中獲取信息”有關泰讽,比如:數(shù)據分析師,BI咨詢師昔期,統(tǒng)計學家已卸,金融分析師、商業(yè)分析師硼一,預測分析師……這些不同職業(yè)有什么區(qū)別累澡?即便都是數(shù)據科學家,教育背景等等也是千差萬別般贼。由于媒體的炒作以及對“數(shù)據科學家”這個名稱的濫用愧哟,盡管總的分析行業(yè)正在飛速發(fā)展,但大家對這個行業(yè)從業(yè)人員的認識卻越來越混亂⊥疑粒現(xiàn)在大部分商業(yè)領域所謂的分析都達不到“科學”的程度店诗,而僅僅是加減乘除的游戲巩踏。這些不同的職位要求有何不同?在北美總體說來:

  • 金融分析師一般有金融方向的MBA學位肥矢。他/她會用電子表格,知道會計軟件叠洗,分析各部門的預算數(shù)據橄抹,分析實際經營結果和預測之間的差別,做一些預測惕味,但這里的預測不會涉及復雜的機器學習楼誓,統(tǒng)計模型。

  • 數(shù)據分析師一般有MBA學位名挥,有一些計算機背景疟羹,很擅長使用電子表格,會用高階的電子表格編程功能如VBA,自定義函數(shù)榄融,宏参淫。根據情況,會使用一些BI的軟件愧杯,如Tableau涎才,主要都是用鼠標點拖的方式。會用SQL從數(shù)據庫中讀取數(shù)據力九。我所見的商業(yè)分析師擁有很少(或沒有)統(tǒng)計知識耍铜。所以這部分人有處理數(shù)據的知識,但是沒有統(tǒng)計學的知識跌前,能做的分析非常有限棕兼。

  • 統(tǒng)計學家一般多在藥廠,生物技術公司抵乓,做一些非常傳統(tǒng)的混合效應模型伴挚,方差分析等生物統(tǒng)計分析。由于行業(yè)要求灾炭,多用SAS而非開源軟件R茎芋。

  • BI咨詢師,一般也是工商管理專業(yè)蜈出,有MBA學位败徊,受傳統(tǒng)的商學院教育(熟悉4Ps或6Ps,4Cs,使用SWOT法分析市場),熟練使用電子表格掏缎,很少或沒有其它技術背景皱蹦。

  • 數(shù)據科學家,多是數(shù)學/統(tǒng)計眷蜈,計算機沪哺,工程學專業(yè)出身,會使用R,Python等多種編程語言酌儒,熟悉數(shù)據可視化辜妓。大多數(shù)在入職前沒有太多市場營銷知識。掌握高等概率統(tǒng)計忌怎,熟悉如下概念:抽樣籍滴,概率分布,假設檢驗榴啸,方差分析孽惰,擬合優(yōu)度檢驗,回歸鸥印,時間序列預測模型勋功,非參數(shù)估計坦报,實驗設計,決策樹狂鞋,馬爾可夫鏈片择,貝葉斯統(tǒng)計(很快就能在白板上寫下貝葉斯定理)

數(shù)據科學家都分布在哪些行業(yè)呢?根據Burtch Works Executive Recruiting在2015年4月發(fā)布的“數(shù)據科學家薪資調查報告”骚揍,科技公司(包括互聯(lián)網)是數(shù)據科學家最大的雇主字管。其次是一些為其它公司提供如廣告,市場調查信不,市場分析等商業(yè)服務的公司嘲叔。這兩者之和超過了50%。2014年創(chuàng)業(yè)公司雇傭了29.4%的數(shù)據科學家浑塞,2015年這個比例降至14.3%,原因不是創(chuàng)業(yè)公司招的數(shù)據科學家職位少了政己,而是大公司招入的數(shù)據科學家增長迅速酌壕,整體基數(shù)變大⌒桑總體來說數(shù)據科學家就業(yè)前景在北美是非常好的卵牍。調查還顯示,在北美沦泌,大部分數(shù)據科學家(70%)工作經驗小于10年糊昙。因此數(shù)據科學還是個很年輕的行業(yè)。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末谢谦,一起剝皮案震驚了整個濱河市释牺,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌回挽,老刑警劉巖没咙,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異千劈,居然都是意外死亡祭刚,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門墙牌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來涡驮,“玉大人,你說我怎么就攤上這事喜滨∽酵保” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵虽风,是天一觀的道長锯梁。 經常有香客問我即碗,道長,這世上最難降的妖魔是什么陌凳? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任剥懒,我火速辦了婚禮,結果婚禮上合敦,老公的妹妹穿的比我還像新娘初橘。我一直安慰自己,他們只是感情好充岛,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布保檐。 她就那樣靜靜地躺著,像睡著了一般崔梗。 火紅的嫁衣襯著肌膚如雪夜只。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天蒜魄,我揣著相機與錄音扔亥,去河邊找鬼。 笑死谈为,一個胖子當著我的面吹牛旅挤,可吹牛的內容都是我干的。 我是一名探鬼主播伞鲫,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼粘茄,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了秕脓?” 一聲冷哼從身側響起柒瓣,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎吠架,沒想到半個月后嘹朗,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡诵肛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年屹培,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片怔檩。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡褪秀,死狀恐怖,靈堂內的尸體忽然破棺而出薛训,到底是詐尸還是另有隱情媒吗,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布乙埃,位于F島的核電站闸英,受9級特大地震影響锯岖,放射性物質發(fā)生泄漏。R本人自食惡果不足惜甫何,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一出吹、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辙喂,春花似錦捶牢、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至炬太,卻和暖如春灸蟆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背亲族。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工炒考, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人孽水。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓票腰,卻偏偏與公主長得像城看,于是被迫代替她去往敵國和親女气。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內容