全世界明吩,企業(yè)每天都在創(chuàng)造更多的數(shù)據(jù)间学,迄今為止大多數(shù)都在努力從中受益。根據(jù)麥肯錫的說法印荔,僅美國就將面臨150低葫,000多名數(shù)據(jù)分析師的短缺另加150萬個精通數(shù)據(jù)的管理者。
美國企業(yè)與高等教育論壇(BHEF)與普華永道(PWC)近期發(fā)布的重要報告也指出“數(shù)據(jù)分析的人才需求每年都在增長仍律,而每年的高校畢業(yè)生數(shù)量遠遠無法滿足行業(yè)需求嘿悬。”換言之水泉,現(xiàn)在入行數(shù)據(jù)分析師恰逢其時善涨。
但是在入行之前,C君忍不住問一句草则,你們知道什么是精通數(shù)據(jù)的管理者嗎钢拧?這所有的數(shù)據(jù)科學家都是一樣的嗎?下圖為我們揭示了國外數(shù)據(jù)科學的不同角色和定位
而以當前中國數(shù)據(jù)人才的市場來看炕横,主要分為數(shù)據(jù)專員(統(tǒng)計員)源内、數(shù)據(jù)運營、數(shù)據(jù)分析師看锉、數(shù)據(jù)分析工程師姿锭、數(shù)據(jù)挖掘工程師、數(shù)據(jù)策略師(數(shù)據(jù)產(chǎn)品經(jīng)理)伯铣、算法工程師等職位崗位呻此,那么數(shù)據(jù)人才的第一步踏出以后該如何確定自己的職業(yè)角色和定位?
業(yè)務數(shù)據(jù)分析師(數(shù)據(jù)專員腔寡、數(shù)據(jù)運營等)
業(yè)務分析師對應的CDA一級考試焚鲜。他們是數(shù)據(jù)分析師的一個子集,他們更關心的是數(shù)據(jù)的業(yè)務含義和應該導致操作。
你能拿到的薪水:業(yè)務數(shù)據(jù)分析師作為入門級的角色忿磅,往往是數(shù)據(jù)科學角色中報酬最少的糯彬,月薪一般為5k-15k
你需要掌握的知識:
理論基礎:概率論、統(tǒng)計學理論基礎
軟件要求:必要Excel葱她、SQL撩扒;可選SPSS、SAS吨些、R等
業(yè)務分析能力:熟知業(yè)務搓谆,能夠根據(jù)問題業(yè)務指標提取公司數(shù)據(jù)庫中相關數(shù)據(jù),進行整理豪墅、清洗泉手、處理,通過相應數(shù)據(jù)分析方法偶器,結合軟件平臺應用完成對數(shù)據(jù)的分析和報告斩萌。
結果展現(xiàn)能力:能夠形成邏輯清晰的報告,傳遞分析結果屏轰,對實際業(yè)務提出建議和策略颊郎。
建模分析師(數(shù)據(jù)挖掘工程師、大數(shù)據(jù)工程師)
建模分析師對應的是CDA二級建模分析師考試霎苗。他們通常扮演一個數(shù)據(jù)工程師的角色袭艺。主要依靠他們的軟件工程經(jīng)驗來處理大規(guī)模的大量數(shù)據(jù)。他們通常專注于編碼叨粘,清理數(shù)據(jù)集,以及實施來自數(shù)據(jù)科學家的請求瘤睹。他們通常知道從Python到Java的各種各樣的編程語言升敲。當有人從數(shù)據(jù)科學家那里獲取預測模型并用代碼實現(xiàn)它,
你能拿到的薪水:建模分析師作為數(shù)據(jù)工程師轰传,在數(shù)據(jù)科學角色中占據(jù)著十分重要的地位驴党,月薪一般為15k-25k
你需要掌握的知識:
理論基礎:統(tǒng)計學、概率論和數(shù)理統(tǒng)計获茬、多元統(tǒng)計分析港庄、時間序列、數(shù)據(jù)挖掘(DM)
軟件要求:必要Excel恕曲、SQL鹏氧;可選SPSS MODELER、R佩谣、Python把还、SAS等
業(yè)務分析能力:Data可以將業(yè)務目標轉化為數(shù)據(jù)分析目標;熟悉常用算法和數(shù)據(jù)結構,熟悉企業(yè)數(shù)據(jù)庫構架建設吊履;針對不同分析主體安皱,可以熟練的進行維度分析,能夠從海量數(shù)據(jù)中搜集并提取信息艇炎;通過相關數(shù)據(jù)分析方法酌伊,結合一個或多個數(shù)據(jù)分析軟件完成對海量數(shù)據(jù)的處理和分析。
結果展現(xiàn)能力:報告體現(xiàn)數(shù)據(jù)挖掘的整體流程缀踪,層層闡述信息的收集居砖、模型的構建、結果的驗證和解讀辜贵,對行業(yè)進行評估悯蝉,優(yōu)化和決策。
第三階:大數(shù)據(jù)分析師(大數(shù)據(jù)架構師托慨、大數(shù)據(jù)工程師)
大數(shù)據(jù)分析師對應的是CDA二級大數(shù)據(jù)分析師考試鼻由。他們專注于構建管理數(shù)據(jù)模型的技術,仔細檢查數(shù)據(jù)厚棵,并提供報告和可視化來解釋數(shù)據(jù)隱藏的見解蕉世,模型的優(yōu)化和改進等。
你能拿到的薪水:大數(shù)據(jù)分析師作為架構的搭建者婆硬,在編程框架中舉足輕重狠轻,月薪一般為25k-50k
理論基礎:統(tǒng)計學、概率論和數(shù)據(jù)庫彬犯、數(shù)據(jù)挖掘向楼、JAVA基礎、Linux基礎
軟件要求:必要 SQL谐区、Hadoop湖蜕、HDFS、Mapreduce宋列、Mahout昭抒、Hive、Spark炼杖;可選R灭返、Hadoop、Hbase坤邪、ZooKeeper熙含、Pig等
業(yè)務分析能力:熟悉hadoop+hive+spark進行大數(shù)據(jù)分析的架構設計,并能針對不同的業(yè)務提出大數(shù)據(jù)架構的解決思路艇纺。掌握hadoop+hive+ Spark+tableau平臺上Spark MLlib婆芦、SparkSQL的功能與應用場景怕磨,根據(jù)不同的數(shù)據(jù)業(yè)務需求選擇合適的組件進行分析與處理。并對基于Spark框架提出的模型進行對比分析與完善消约。
結果展現(xiàn)能力:報告能體現(xiàn)大數(shù)據(jù)分析的優(yōu)勢肠鲫,能清楚地闡述數(shù)據(jù)采集、大數(shù)據(jù)處理過程及最終結果的解讀或粮,同時提出模型的優(yōu)化和改進之處导饲,以利于提升大數(shù)據(jù)分析的商業(yè)價值。
第四階:數(shù)據(jù)科學家
數(shù)據(jù)科學家對應的是CDA三級數(shù)據(jù)分析科學家考試氯材。扮演數(shù)據(jù)科學家角色的人可能是運用統(tǒng)計學和算法的理論知識找到解決數(shù)據(jù)科學問題的最佳方法的人渣锦,可能是建立一個模型來預測下個月信用卡違約的數(shù)量的人……
你能拿到的薪水:數(shù)據(jù)科學家是數(shù)據(jù)科學的編程與實現(xiàn),數(shù)據(jù)科學理論和數(shù)據(jù)的商業(yè)影響之間的橋梁氢哮,年薪一般在60W以上袋毙。
理論基礎:統(tǒng)計、大數(shù)據(jù)冗尤、數(shù)據(jù)挖掘听盖、機器學習和商業(yè)智能
軟件要求:必要Excel、SQL裂七;可選R皆看、Python、SAS背零、Hadoop等
業(yè)務分析能力帶領數(shù)據(jù)團隊腰吟,能夠將企業(yè)的數(shù)據(jù)資產(chǎn)進行有效的整合和管理,建立內外部數(shù)據(jù)的連接徙瓶;熟悉數(shù)據(jù)倉庫的構造理論毛雇,可以指導ETL工程師業(yè)務工作;可以面向數(shù)據(jù)挖掘運用主題構造數(shù)據(jù)集市侦镇;在人和數(shù)據(jù)之間建立有機聯(lián)系禾乘,面向用戶數(shù)據(jù)創(chuàng)造不同特性的產(chǎn)品和系統(tǒng);具有數(shù)據(jù)規(guī)劃的能力虽缕。
結果展現(xiàn)能力帶領數(shù)據(jù)團隊,能夠將企業(yè)的數(shù)據(jù)資產(chǎn)進行有效的整合和管理蒲稳,建立內外部數(shù)據(jù)的連接氮趋;熟悉數(shù)據(jù)倉庫的構造理論,可以指導ETL工程師業(yè)務工作江耀;可以面向數(shù)據(jù)挖掘運用主題構造數(shù)據(jù)集市剩胁;在人和數(shù)據(jù)之間建立有機聯(lián)系,面向用戶數(shù)據(jù)創(chuàng)造不同特性的產(chǎn)品和系統(tǒng)祥国;具有數(shù)據(jù)規(guī)劃的能力昵观。
結論
數(shù)據(jù)科學是一個新的晾腔,令人興奮的領域,它需要符合具體定數(shù)據(jù)科學角色的個人聚在一起啊犬,解決前沿問題灼擂。