數(shù)據(jù)科學職業(yè)生涯路徑:如何在數(shù)據(jù)分析工作中找準自己的角色和定位?

全世界明吩,企業(yè)每天都在創(chuàng)造更多的數(shù)據(jù)间学,迄今為止大多數(shù)都在努力從中受益。根據(jù)麥肯錫的說法印荔,僅美國就將面臨150低葫,000多名數(shù)據(jù)分析師的短缺另加150萬個精通數(shù)據(jù)的管理者。

美國企業(yè)與高等教育論壇(BHEF)與普華永道(PWC)近期發(fā)布的重要報告也指出“數(shù)據(jù)分析的人才需求每年都在增長仍律,而每年的高校畢業(yè)生數(shù)量遠遠無法滿足行業(yè)需求嘿悬。”換言之水泉,現(xiàn)在入行數(shù)據(jù)分析師恰逢其時善涨。

數(shù)據(jù)分析人才供給嚴重不足

但是在入行之前,C君忍不住問一句草则,你們知道什么是精通數(shù)據(jù)的管理者嗎钢拧?這所有的數(shù)據(jù)科學家都是一樣的嗎?下圖為我們揭示了國外數(shù)據(jù)科學的不同角色和定位


國外數(shù)據(jù)科學的不同角色和定位

而以當前中國數(shù)據(jù)人才的市場來看炕横,主要分為數(shù)據(jù)專員(統(tǒng)計員)源内、數(shù)據(jù)運營、數(shù)據(jù)分析師看锉、數(shù)據(jù)分析工程師姿锭、數(shù)據(jù)挖掘工程師、數(shù)據(jù)策略師(數(shù)據(jù)產(chǎn)品經(jīng)理)伯铣、算法工程師等職位崗位呻此,那么數(shù)據(jù)人才的第一步踏出以后該如何確定自己的職業(yè)角色和定位?

中國數(shù)據(jù)人才的角色和定位

業(yè)務數(shù)據(jù)分析師(數(shù)據(jù)專員腔寡、數(shù)據(jù)運營等)

業(yè)務分析師對應的CDA一級考試焚鲜。他們是數(shù)據(jù)分析師的一個子集,他們更關心的是數(shù)據(jù)的業(yè)務含義和應該導致操作。
你能拿到的薪水:業(yè)務數(shù)據(jù)分析師作為入門級的角色忿磅,往往是數(shù)據(jù)科學角色中報酬最少的糯彬,月薪一般為5k-15k
你需要掌握的知識:
理論基礎:概率論、統(tǒng)計學理論基礎
軟件要求:必要Excel葱她、SQL撩扒;可選SPSS、SAS吨些、R等
業(yè)務分析能力:熟知業(yè)務搓谆,能夠根據(jù)問題業(yè)務指標提取公司數(shù)據(jù)庫中相關數(shù)據(jù),進行整理豪墅、清洗泉手、處理,通過相應數(shù)據(jù)分析方法偶器,結合軟件平臺應用完成對數(shù)據(jù)的分析和報告斩萌。
結果展現(xiàn)能力:能夠形成邏輯清晰的報告,傳遞分析結果屏轰,對實際業(yè)務提出建議和策略颊郎。

建模分析師(數(shù)據(jù)挖掘工程師、大數(shù)據(jù)工程師)

建模分析師對應的是CDA二級建模分析師考試霎苗。他們通常扮演一個數(shù)據(jù)工程師的角色袭艺。主要依靠他們的軟件工程經(jīng)驗來處理大規(guī)模的大量數(shù)據(jù)。他們通常專注于編碼叨粘,清理數(shù)據(jù)集,以及實施來自數(shù)據(jù)科學家的請求瘤睹。他們通常知道從Python到Java的各種各樣的編程語言升敲。當有人從數(shù)據(jù)科學家那里獲取預測模型并用代碼實現(xiàn)它,
你能拿到的薪水:建模分析師作為數(shù)據(jù)工程師轰传,在數(shù)據(jù)科學角色中占據(jù)著十分重要的地位驴党,月薪一般為15k-25k
你需要掌握的知識:
理論基礎:統(tǒng)計學、概率論和數(shù)理統(tǒng)計获茬、多元統(tǒng)計分析港庄、時間序列、數(shù)據(jù)挖掘(DM)
軟件要求:必要Excel恕曲、SQL鹏氧;可選SPSS MODELER、R佩谣、Python把还、SAS等
業(yè)務分析能力:Data可以將業(yè)務目標轉化為數(shù)據(jù)分析目標;熟悉常用算法和數(shù)據(jù)結構,熟悉企業(yè)數(shù)據(jù)庫構架建設吊履;針對不同分析主體安皱,可以熟練的進行維度分析,能夠從海量數(shù)據(jù)中搜集并提取信息艇炎;通過相關數(shù)據(jù)分析方法酌伊,結合一個或多個數(shù)據(jù)分析軟件完成對海量數(shù)據(jù)的處理和分析。
結果展現(xiàn)能力:報告體現(xiàn)數(shù)據(jù)挖掘的整體流程缀踪,層層闡述信息的收集居砖、模型的構建、結果的驗證和解讀辜贵,對行業(yè)進行評估悯蝉,優(yōu)化和決策。

第三階:大數(shù)據(jù)分析師(大數(shù)據(jù)架構師托慨、大數(shù)據(jù)工程師)

大數(shù)據(jù)分析師對應的是CDA二級大數(shù)據(jù)分析師考試鼻由。他們專注于構建管理數(shù)據(jù)模型的技術,仔細檢查數(shù)據(jù)厚棵,并提供報告和可視化來解釋數(shù)據(jù)隱藏的見解蕉世,模型的優(yōu)化和改進等。
你能拿到的薪水:大數(shù)據(jù)分析師作為架構的搭建者婆硬,在編程框架中舉足輕重狠轻,月薪一般為25k-50k
理論基礎:統(tǒng)計學、概率論和數(shù)據(jù)庫彬犯、數(shù)據(jù)挖掘向楼、JAVA基礎、Linux基礎
軟件要求:必要 SQL谐区、Hadoop湖蜕、HDFS、Mapreduce宋列、Mahout昭抒、Hive、Spark炼杖;可選R灭返、Hadoop、Hbase坤邪、ZooKeeper熙含、Pig等
業(yè)務分析能力:熟悉hadoop+hive+spark進行大數(shù)據(jù)分析的架構設計,并能針對不同的業(yè)務提出大數(shù)據(jù)架構的解決思路艇纺。掌握hadoop+hive+ Spark+tableau平臺上Spark MLlib婆芦、SparkSQL的功能與應用場景怕磨,根據(jù)不同的數(shù)據(jù)業(yè)務需求選擇合適的組件進行分析與處理。并對基于Spark框架提出的模型進行對比分析與完善消约。
結果展現(xiàn)能力:報告能體現(xiàn)大數(shù)據(jù)分析的優(yōu)勢肠鲫,能清楚地闡述數(shù)據(jù)采集、大數(shù)據(jù)處理過程及最終結果的解讀或粮,同時提出模型的優(yōu)化和改進之處导饲,以利于提升大數(shù)據(jù)分析的商業(yè)價值。

第四階:數(shù)據(jù)科學家

數(shù)據(jù)科學家對應的是CDA三級數(shù)據(jù)分析科學家考試氯材。扮演數(shù)據(jù)科學家角色的人可能是運用統(tǒng)計學和算法的理論知識找到解決數(shù)據(jù)科學問題的最佳方法的人渣锦,可能是建立一個模型來預測下個月信用卡違約的數(shù)量的人……
你能拿到的薪水:數(shù)據(jù)科學家是數(shù)據(jù)科學的編程與實現(xiàn),數(shù)據(jù)科學理論和數(shù)據(jù)的商業(yè)影響之間的橋梁氢哮,年薪一般在60W以上袋毙。
理論基礎:統(tǒng)計、大數(shù)據(jù)冗尤、數(shù)據(jù)挖掘听盖、機器學習和商業(yè)智能
軟件要求:必要Excel、SQL裂七;可選R皆看、Python、SAS背零、Hadoop等
業(yè)務分析能力帶領數(shù)據(jù)團隊腰吟,能夠將企業(yè)的數(shù)據(jù)資產(chǎn)進行有效的整合和管理,建立內外部數(shù)據(jù)的連接徙瓶;熟悉數(shù)據(jù)倉庫的構造理論毛雇,可以指導ETL工程師業(yè)務工作;可以面向數(shù)據(jù)挖掘運用主題構造數(shù)據(jù)集市侦镇;在人和數(shù)據(jù)之間建立有機聯(lián)系禾乘,面向用戶數(shù)據(jù)創(chuàng)造不同特性的產(chǎn)品和系統(tǒng);具有數(shù)據(jù)規(guī)劃的能力虽缕。
結果展現(xiàn)能力帶領數(shù)據(jù)團隊,能夠將企業(yè)的數(shù)據(jù)資產(chǎn)進行有效的整合和管理蒲稳,建立內外部數(shù)據(jù)的連接氮趋;熟悉數(shù)據(jù)倉庫的構造理論,可以指導ETL工程師業(yè)務工作江耀;可以面向數(shù)據(jù)挖掘運用主題構造數(shù)據(jù)集市剩胁;在人和數(shù)據(jù)之間建立有機聯(lián)系,面向用戶數(shù)據(jù)創(chuàng)造不同特性的產(chǎn)品和系統(tǒng)祥国;具有數(shù)據(jù)規(guī)劃的能力昵观。

結論

數(shù)據(jù)科學是一個新的晾腔,令人興奮的領域,它需要符合具體定數(shù)據(jù)科學角色的個人聚在一起啊犬,解決前沿問題灼擂。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市觉至,隨后出現(xiàn)的幾起案子剔应,更是在濱河造成了極大的恐慌,老刑警劉巖语御,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件峻贮,死亡現(xiàn)場離奇詭異,居然都是意外死亡应闯,警方通過查閱死者的電腦和手機纤控,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來碉纺,“玉大人船万,你說我怎么就攤上這事∠Ъ” “怎么了唬涧?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長盛撑。 經(jīng)常有香客問我碎节,道長,這世上最難降的妖魔是什么抵卫? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任狮荔,我火速辦了婚禮,結果婚禮上介粘,老公的妹妹穿的比我還像新娘殖氏。我一直安慰自己,他們只是感情好姻采,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布雅采。 她就那樣靜靜地躺著,像睡著了一般慨亲。 火紅的嫁衣襯著肌膚如雪婚瓜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天刑棵,我揣著相機與錄音巴刻,去河邊找鬼。 笑死蛉签,一個胖子當著我的面吹牛胡陪,可吹牛的內容都是我干的沥寥。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼柠座,長吁一口氣:“原來是場噩夢啊……” “哼邑雅!你這毒婦竟也來了?” 一聲冷哼從身側響起愚隧,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤蒂阱,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后狂塘,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體录煤,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年荞胡,在試婚紗的時候發(fā)現(xiàn)自己被綠了妈踊。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡泪漂,死狀恐怖廊营,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情萝勤,我是刑警寧澤露筒,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站敌卓,受9級特大地震影響慎式,放射性物質發(fā)生泄漏。R本人自食惡果不足惜趟径,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一瘪吏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蜗巧,春花似錦掌眠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至望拖,卻和暖如春渺尘,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背靠娱。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留掠兄,地道東北人像云。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓锌雀,卻偏偏與公主長得像,于是被迫代替她去往敵國和親迅诬。 傳聞我的和親對象是個殘疾皇子腋逆,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內容