已從事數(shù)據(jù)分析(數(shù)據(jù)挖掘)一段時(shí)間的他們炼蛤,現(xiàn)在都是什么狀態(tài)?

繼《普通程序員蝶涩,如何轉(zhuǎn)型大數(shù)據(jù)相關(guān)方向理朋?》和《給大數(shù)據(jù)入行者的,建議和書單

》之后子寓,特此摘述幾個(gè)大數(shù)據(jù)從業(yè)者的職場履歷暗挑!


1

彭先生 ?亞馬遜-機(jī)器學(xué)習(xí)研究員笋除、數(shù)據(jù)科學(xué)家

見證了大數(shù)據(jù)從炙手可熱的全過程


【履歷】

2010年-2012年斜友,Google實(shí)習(xí)生

2012年-2017年,博士畢業(yè)垃它,入職亞馬遜擔(dān)任機(jī)器學(xué)習(xí)研究員和數(shù)據(jù)科學(xué)家鲜屏。

【見聞】

當(dāng)年一起從事數(shù)據(jù)研究(數(shù)據(jù)挖掘)的同事,都去哪兒了国拇?

A.??約50%轉(zhuǎn)為純程序員:數(shù)據(jù)科學(xué)家的價(jià)值洛史,體現(xiàn)非常曲折。牛逼的大有人在酱吝,因心累而轉(zhuǎn)為純程序員的也在所難免也殖,因?yàn)槌绦騿T的選擇面很寬,高者其薪資也可能高過數(shù)據(jù)科學(xué)家。

B. 約40%轉(zhuǎn)為PM:述者原話“數(shù)據(jù)科學(xué)家免不了忽悠忆嗜,忽悠多了失去了自己己儒,有的就變成了會(huì)寫SQL的產(chǎn)品經(jīng)理”,可采納度自行揣度~

C. 約10%轉(zhuǎn)為全棧數(shù)據(jù)科學(xué)家:在數(shù)據(jù)科學(xué)方面混得比較久的捆毫,多轉(zhuǎn)為了全椛镣澹科學(xué)家。全椉保化既可以往底層通程序員途样、系統(tǒng)構(gòu)架,也可以往高處通管理層濒憋,大侃價(jià)值觀何暇,把握全局,做的東西也更容易落地跋炕;但勞神費(fèi)力同樣在所難免赖晶。

總結(jié):數(shù)據(jù)科學(xué)家就像是咨詢公司一樣,不是特別適合作為終身職業(yè)辐烂。若早期入行遏插,可能風(fēng)光無限;但長遠(yuǎn)來講纠修,價(jià)值的落地胳嘲、測量都比較困難。

【經(jīng)驗(yàn)】

1)機(jī)器學(xué)習(xí)技術(shù)方面

模型容易獲得扣草,但經(jīng)驗(yàn)難得(無論做研究了牛,還是做業(yè)務(wù),都是如此)辰妙。

模型方面鹰祸,不外乎五大生態(tài)系統(tǒng):

A.?Python + Scikit Learn,最適合生產(chǎn)環(huán)境和數(shù)據(jù)研究混用;

B.?Spark + MLLib;

C.?Java + Weka ;

D.?TensorFlow等深度學(xué)習(xí)生態(tài);

E.?微軟等內(nèi)部重造輪子生態(tài)

以上五種生態(tài)密浑,除了最后一個(gè)外蛙婴,其余都容易入門(有基本的數(shù)學(xué)、統(tǒng)計(jì)知識(shí)尔破,看看github源代碼等)街图。但事關(guān)參數(shù)調(diào)試和具體成果,則要視研究領(lǐng)域和上下游情況而定懒构。不過餐济,系統(tǒng)工具方面的快速發(fā)展,給新入門者提供了許多便利之處胆剧,如Elasticsearch + Logstash + Kibana (ELK) 絮姆、Docker、?Kubernetes等都非常好用,同時(shí)部署門檻降低篙悯,部署速度得到提升冤灾。

經(jīng)驗(yàn):Docker出現(xiàn)以后,如果一件課題的代碼超過了2000行辕近,就說明你做錯(cuò)了韵吨。

2)管理方面

跟對(duì)老板/部門,尤其是老板移宅,上升速度會(huì)比較快归粉。而事實(shí)情況是,雖然大數(shù)據(jù)很火漏峰,但有上升機(jī)會(huì)的部門卻不多糠悼,例如做risk和預(yù)測的部門,往往比較苦逼浅乔。

2

某數(shù)據(jù)分析(挖掘)工程師

三年數(shù)據(jù)分析從業(yè)經(jīng)驗(yàn)

1)數(shù)據(jù)分析也好數(shù)據(jù)挖掘也好倔喂,其實(shí)都有套路;

如靖苇,流失分析:從用戶C端轉(zhuǎn)化率漏斗找漏洞席噩,通過多維組合分析找原因,并用abtest驗(yàn)證原因贤壁,最后分類識(shí)別深挖潛在目標(biāo)用戶悼枢。

2)東西變化很快,但實(shí)用的沒有那么多脾拆;

算法每年更新馒索,但行業(yè)里面通用的東西變化并不是很大

3)入?yún)⑦x擇很困難

能走多遠(yuǎn),不在于算法學(xué)的有多好名船,而在于對(duì)所處行業(yè)的理解深度绰上。


3

XX(轉(zhuǎn)行至數(shù)據(jù)挖掘)

三年數(shù)據(jù)挖掘從業(yè)經(jīng)驗(yàn)


1)大部分?jǐn)?shù)據(jù)挖掘工程師,偏算法應(yīng)用渠驼,但不執(zhí)于算法蜈块;

互聯(lián)網(wǎng)領(lǐng)域,大部分?jǐn)?shù)據(jù)挖掘工程師偏算法應(yīng)用渴邦,旨在用算法提升業(yè)務(wù)疯趟。

大數(shù)據(jù)挖掘門檻不會(huì)很高:數(shù)據(jù)處理能力為必須拘哨;算法方面谋梭,懂些理論,知道能解決什么問題倦青,參數(shù)怎么調(diào)瓮床,就能入門了(當(dāng)然,懂得算法理論細(xì)節(jié)最好)。

然而隘庄,算法牛逼不一定能做出牛逼的項(xiàng)目踢步,算法不牛逼也不一定做不出牛逼的項(xiàng)目。

2)跟著業(yè)務(wù)拓展算法丑掺;

鑒于業(yè)務(wù)發(fā)展階段問題和個(gè)人實(shí)力問題获印,并沒有很多機(jī)會(huì)讓你接觸到牛逼哄哄的技術(shù),跟著工作拓展算法(廣告dmp系統(tǒng)等)更加可行街州。

3)奮斗方向:用數(shù)據(jù)和算法驅(qū)動(dòng)業(yè)務(wù)增長漆诽;

通過數(shù)據(jù)和算法驅(qū)動(dòng)業(yè)務(wù)的增長乒裆。

如從事廣告,便期望對(duì)互聯(lián)網(wǎng)廣告業(yè)務(wù)有深入了解和實(shí)踐。比如實(shí)踐上薄坏,目前做的廣告dmp系統(tǒng)大部分是離線計(jì)算,希望將來業(yè)務(wù)發(fā)展能做dsp系統(tǒng)系羞,對(duì)接ssp參與廣告競價(jià)复罐。

4)給新入行者的建議

如果你數(shù)學(xué)功底和算法理論足夠強(qiáng)大,可以考慮偏算法理論研究和算法平臺(tái)開發(fā)的崗位趟紊,不然就考慮偏算法應(yīng)用的崗位氮双,做一位增長黑客。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末霎匈,一起剝皮案震驚了整個(gè)濱河市眶蕉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌唧躲,老刑警劉巖造挽,帶你破解...
    沈念sama閱讀 218,204評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異弄痹,居然都是意外死亡饭入,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門肛真,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谐丢,“玉大人,你說我怎么就攤上這事蚓让∏溃” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵历极,是天一觀的道長窄瘟。 經(jīng)常有香客問我,道長趟卸,這世上最難降的妖魔是什么蹄葱? 我笑而不...
    開封第一講書人閱讀 58,657評(píng)論 1 293
  • 正文 為了忘掉前任氏义,我火速辦了婚禮,結(jié)果婚禮上图云,老公的妹妹穿的比我還像新娘惯悠。我一直安慰自己,他們只是感情好竣况,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評(píng)論 6 392
  • 文/花漫 我一把揭開白布克婶。 她就那樣靜靜地躺著,像睡著了一般丹泉。 火紅的嫁衣襯著肌膚如雪鸠补。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評(píng)論 1 305
  • 那天嘀掸,我揣著相機(jī)與錄音紫岩,去河邊找鬼。 笑死睬塌,一個(gè)胖子當(dāng)著我的面吹牛泉蝌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播揩晴,決...
    沈念sama閱讀 40,302評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼勋陪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了硫兰?” 一聲冷哼從身側(cè)響起诅愚,我...
    開封第一講書人閱讀 39,216評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎劫映,沒想到半個(gè)月后违孝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡泳赋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評(píng)論 3 336
  • 正文 我和宋清朗相戀三年雌桑,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片祖今。...
    茶點(diǎn)故事閱讀 39,977評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡校坑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出千诬,到底是詐尸還是另有隱情耍目,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評(píng)論 5 347
  • 正文 年R本政府宣布徐绑,位于F島的核電站邪驮,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏泵三。R本人自食惡果不足惜耕捞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望烫幕。 院中可真熱鬧俺抽,春花似錦、人聲如沸较曼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽捷犹。三九已至弛饭,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間萍歉,已是汗流浹背侣颂。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評(píng)論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留枪孩,地道東北人憔晒。 一個(gè)月前我還...
    沈念sama閱讀 48,138評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像蔑舞,于是被迫代替她去往敵國和親拒担。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容