萬事始于初心铅辞,終于堅(jiān)持熙含。最后一篇來聊聊與大數(shù)據(jù)相關(guān)的職位:數(shù)據(jù)分析師(Data Analyst)谒府, 數(shù)據(jù)科學(xué)家(Data Scientist)粗梭,數(shù)據(jù)工程師(Data Engineer)争便,數(shù)據(jù)庫管理員(DBA), 數(shù)據(jù)架構(gòu)師(Data Architect).
在這個(gè)5個(gè)職位中,數(shù)據(jù)分析師要求最低断医,通常是利用已有的數(shù)據(jù)資料和工具能熟練運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)方法進(jìn)行觀測(cè)滞乙,實(shí)驗(yàn),研究分析出背后的一套規(guī)律為企業(yè)進(jìn)行優(yōu)化決策鉴嗤。它會(huì)告訴管理層歷史發(fā)生了什么斩启,以及現(xiàn)在正在發(fā)生什么。那么未來呢醉锅,如何預(yù)測(cè)未來兔簇?
洞悉未來,數(shù)據(jù)科學(xué)家當(dāng)仁不讓。數(shù)據(jù)科學(xué)家都是很好的故事編劇垄琐,他們往往會(huì)根據(jù)相關(guān)的以及不相關(guān)的數(shù)據(jù)來尋找深層的原因和規(guī)律边酒,并建立適當(dāng)?shù)哪P蛠眍A(yù)測(cè)今后的發(fā)展和趨勢(shì),最后完成一個(gè)個(gè)令人咂舌的故事狸窘。但現(xiàn)實(shí)往往很殘酷墩朦,很多故事都會(huì)因?yàn)檫^擬合或者數(shù)據(jù)材料不夠充實(shí),結(jié)局慘淡翻擒,豆瓣評(píng)分不高(廣告植入?##@)氓涣。
巧婦難為無米之炊,數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家的數(shù)據(jù)從哪里來陋气?數(shù)據(jù)工程師則像是這個(gè)領(lǐng)域的管道藍(lán)領(lǐng)劳吠。他們更偏開發(fā)層面,運(yùn)用編程語言實(shí)現(xiàn)數(shù)據(jù)平臺(tái)和數(shù)據(jù)管道的開發(fā)巩趁,讓大量的數(shù)據(jù)源源不斷的輸送到企業(yè)的數(shù)據(jù)倉庫或者數(shù)據(jù)島里赴背,方便數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家查詢和挖掘。
這么多的數(shù)據(jù)放在一起當(dāng)然需要有人維護(hù)和管理晶渠,顧名思義凰荚,數(shù)據(jù)庫管理員就是該領(lǐng)域的專業(yè)人士。他們需要保證數(shù)據(jù)庫管理系統(tǒng)的穩(wěn)定性褒脯,安全性便瑟,完整性和高性能。
數(shù)據(jù)架構(gòu)師呢番川?通常有數(shù)據(jù)系統(tǒng)相關(guān)的設(shè)計(jì)與優(yōu)化和垂直行業(yè)經(jīng)驗(yàn)到涂,需要平臺(tái)級(jí)開發(fā)和架構(gòu)設(shè)計(jì)能力。要求比較高颁督,既要精通數(shù)據(jù)分析的業(yè)務(wù)決策層面践啄,也要精通系統(tǒng)開發(fā)和運(yùn)算模型的使用。數(shù)據(jù)架構(gòu)層面做的好沉御,事半功倍屿讽,否則,事倍功半吠裆。
最后伐谈,總結(jié)下網(wǎng)上這5個(gè)職業(yè)的收入情況,數(shù)據(jù)科學(xué)家 >= 數(shù)據(jù)架構(gòu)師, 數(shù)據(jù)庫管理員? >= 數(shù)據(jù)工程師 > 數(shù)據(jù)分析師试疙。一家之言诵棵,請(qǐng)勿對(duì)號(hào)入座,選擇適合自己的才是最重要的祝旷。