萬達電商萌妹子:告訴你如何成為數(shù)據(jù)挖掘師!

數(shù)據(jù)挖掘森篷、數(shù)據(jù)分析已成為各大企業(yè)的重點输钩,市場前景一片光明,但如何在短時間內(nèi)成為大數(shù)據(jù)挖掘工程師呢仲智?今天买乃,大圣眾包平臺(www.dashengzb.cn)小編就為大家介紹一位在萬達電商做數(shù)據(jù)挖掘的妹子小曼的經(jīng)歷,看她是如何從數(shù)學(xué)女生一年內(nèi)獲得萬達數(shù)據(jù)挖掘工程師offer钓辆。

數(shù)據(jù)挖掘師需要哪些技能剪验?

1、無論是數(shù)據(jù)分析還是數(shù)據(jù)挖掘岩馍,統(tǒng)計的概念碉咆、知識是必備的,因此蛀恩,EXCEL、SPSS茂浮、SAS等這些至少要熟練双谆。小曼本身是數(shù)學(xué)系,接觸這些工具也比較多席揽,有基礎(chǔ)好掌握顽馋。

2、另外幌羞,數(shù)據(jù)挖掘還至少會一門編程語言寸谜,比如現(xiàn)在流行Python、Java属桦、hadoop等熊痴,有時用MapReduce寫程序,再用Hadoop或者Hyp來處理數(shù)據(jù)聂宾,如果用Python的話會和Spark相結(jié)合更配哦果善。

3、做數(shù)據(jù)挖掘的話系谐,其實就是從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律然后分類巾陕,應(yīng)用到一些高等數(shù)學(xué)、概率論等知識,所以數(shù)據(jù)專業(yè)有優(yōu)勢鄙煤,另外還需要懂些算法晾匠。比如樸素貝葉斯算法需要概率方面的知識,SKM算法需要高等代數(shù)或者區(qū)間論方面的知識梯刚。個人建議要想長遠發(fā)展凉馆,數(shù)學(xué)知識是很有必要的。

數(shù)據(jù)挖掘主要工作內(nèi)容有哪些乾巧?

以上是個人工作句喜,不代表各家企業(yè)的數(shù)據(jù)挖掘。

數(shù)據(jù)分析的話更傾向于統(tǒng)計沟于、分析然后作圖作報告咳胃,這方面較少做。

數(shù)據(jù)挖掘的話主要是建模型旷太,比如展懈,我們做百貨的數(shù)據(jù)分析。萬達電商本身的數(shù)據(jù)非常大供璧,具體要做什么需要項目組自己來定存崖。我們分析百貨數(shù)據(jù)就是為了提升銷售業(yè)績,帶動新的業(yè)務(wù)睡毒,因此来惧,我們從這些點出發(fā),去進行用戶分群工作演顾;就拿刷卡消費記錄來說供搀,萬達會員卡的卡號信息及歷史記錄都有,我們利用這些數(shù)據(jù)聚類钠至,分不同的用戶群葛虐,然后用戶背后購買行為,比如傾向女裝棉钧、家居用品還是親子類等等屿脐,然后針對性推薦營銷。

一般宪卿,用戶分類主要是用K-means的诵、K-means++等方法。(不懂挖掘算法可看《如何用數(shù)據(jù)挖掘算法進行精準(zhǔn)營銷》)處理數(shù)據(jù)的維度特別大愧捕,是300w*142維奢驯,如果全部拿來聚類,效果不太好次绘,所以我們會進行降維瘪阁,這時需要用到AutoEncoder算法撒遣,比如我們把142維數(shù)據(jù)灌進去,在隱含層降成50維數(shù)據(jù)管跺,輸出還是142維數(shù)據(jù)义黎。也就是說把一開始的142維數(shù)據(jù)投射到50維數(shù)據(jù)之后,再還原成142維豁跑,這142維與之前的142維數(shù)據(jù)之間的映射關(guān)系是一樣的廉涕,那么我們就可以用中間50維的數(shù)據(jù)做聚類分析。最后需要一個評價指標(biāo)艇拍,分析降維前后的效果狐蜕。

無論是數(shù)據(jù)挖掘師還是數(shù)據(jù)分析師,每個人都有自己的優(yōu)勢及興趣卸夕,但從長遠發(fā)展而言层释,個人建議不應(yīng)貪多,而是提高自己的技術(shù)和業(yè)務(wù)水平快集,多學(xué)習(xí)編程語言贡羔,這些技術(shù)都可以慢慢學(xué),但真正要長遠下去个初,并獲得升值成為核心乖寒,業(yè)務(wù)能力才是最重要,希望結(jié)合興趣院溺,在一個領(lǐng)域成為專家便足矣楣嘁。

(更多大數(shù)據(jù)與商業(yè)智能領(lǐng)域干貨、兼職機會及行業(yè)資源分享等請關(guān)注大圣眾包平臺珍逸,或添加大圣花花個人微信號(dashenghuaer)马澈,拉你入bigdata&BI交流群330648564。)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末弄息,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子勤婚,更是在濱河造成了極大的恐慌摹量,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件馒胆,死亡現(xiàn)場離奇詭異缨称,居然都是意外死亡,警方通過查閱死者的電腦和手機祝迂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評論 3 392
  • 文/潘曉璐 我一進店門睦尽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人型雳,你說我怎么就攤上這事当凡∩胶Γ” “怎么了?”我有些...
    開封第一講書人閱讀 162,764評論 0 353
  • 文/不壞的土叔 我叫張陵沿量,是天一觀的道長浪慌。 經(jīng)常有香客問我,道長朴则,這世上最難降的妖魔是什么权纤? 我笑而不...
    開封第一講書人閱讀 58,193評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮乌妒,結(jié)果婚禮上汹想,老公的妹妹穿的比我還像新娘。我一直安慰自己撤蚊,他們只是感情好古掏,可當(dāng)我...
    茶點故事閱讀 67,216評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著拴魄,像睡著了一般冗茸。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上匹中,一...
    開封第一講書人閱讀 51,182評論 1 299
  • 那天夏漱,我揣著相機與錄音,去河邊找鬼顶捷。 笑死挂绰,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的服赎。 我是一名探鬼主播葵蒂,決...
    沈念sama閱讀 40,063評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼重虑!你這毒婦竟也來了践付?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,917評論 0 274
  • 序言:老撾萬榮一對情侶失蹤缺厉,失蹤者是張志新(化名)和其女友劉穎永高,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體提针,經(jīng)...
    沈念sama閱讀 45,329評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡命爬,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,543評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了辐脖。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片饲宛。...
    茶點故事閱讀 39,722評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖嗜价,靈堂內(nèi)的尸體忽然破棺而出艇抠,到底是詐尸還是另有隱情幕庐,我是刑警寧澤,帶...
    沈念sama閱讀 35,425評論 5 343
  • 正文 年R本政府宣布练链,位于F島的核電站翔脱,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏媒鼓。R本人自食惡果不足惜届吁,卻給世界環(huán)境...
    茶點故事閱讀 41,019評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望绿鸣。 院中可真熱鬧疚沐,春花似錦、人聲如沸潮模。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽擎厢。三九已至究流,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間动遭,已是汗流浹背芬探。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留厘惦,地道東北人偷仿。 一個月前我還...
    沈念sama閱讀 47,729評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像宵蕉,于是被迫代替她去往敵國和親酝静。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,614評論 2 353

推薦閱讀更多精彩內(nèi)容