Data Scientist、Data Analyst芝硬、Data Engineer
Data Enginner 所做的一切都為了Data Management蚜点,具體內(nèi)容包括數(shù)據(jù)模型、數(shù)據(jù)架構(gòu)拌阴、數(shù)據(jù)標(biāo)準(zhǔn)绍绘、元數(shù)據(jù)永脓、主數(shù)據(jù)泞辐、數(shù)據(jù)治理、數(shù)據(jù)管控等等漱病,Data Enginner的目標(biāo)是把數(shù)據(jù)整好捺氢,存儲(chǔ)成本低藻丢,查詢效率高剪撬,至于怎么使用這些數(shù)據(jù)不是他們關(guān)心的范疇摄乒。
Data Analyst所做的一切都是為了回答問(wèn)題。這些問(wèn)題可能來(lái)自業(yè)務(wù)部門(mén)残黑,也可能來(lái)自各級(jí)管理人員馍佑,有些問(wèn)題就是想知道某些具體數(shù)字,也有些問(wèn)題是開(kāi)放式的探索問(wèn)題梨水,例如為什么這個(gè)月銷量下降等等拭荤。Data Analyst在Data Enginner提供的數(shù)據(jù)基礎(chǔ)之上進(jìn)行探索分析,如統(tǒng)計(jì)分析或機(jī)器學(xué)習(xí)等疫诽,目的是找到問(wèn)題的正確答案舅世。
Data Scientist是一個(gè)自Hi型的忽悠理念。什么是Scientist奇徒?按維基百科的定義雏亚,Scientist廣義上指使用系統(tǒng)化的活動(dòng)來(lái)發(fā)現(xiàn)新知識(shí)的人,狹義的定義指使用科學(xué)方法做研究的人∧Ω疲現(xiàn)在業(yè)界所謂的Data Scientist是數(shù)據(jù)應(yīng)用領(lǐng)域的混合體罢低,他無(wú)所不能,他要擁有相關(guān)領(lǐng)域的各種技能胖笛,哪有需要就往那里搬网持,能獨(dú)立承擔(dān)從數(shù)據(jù)處理宜岛、分析探索到實(shí)踐應(yīng)用直至最終產(chǎn)生業(yè)務(wù)價(jià)值全流程服務(wù)的全能超人,聽(tīng)起來(lái)很高大上功舀,不過(guò)和科學(xué)不太搭邊萍倡,叫科學(xué)家有點(diǎn)勉強(qiáng)了。