當(dāng)我們談?wù)摂?shù)據(jù)分析時婴栽,我們在談?wù)撌裁矗?br> 我們其實在談?wù)摂?shù)據(jù)分析的三個部分满粗。
1. 數(shù)據(jù)采集 數(shù)據(jù)采集是我們的「原材料」,主要通過爬蟲以及一些自動化工具采集得來居夹。
2. 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是數(shù)據(jù)分析中最有價值的部分败潦,主要是要幫助我們找到數(shù)據(jù)的規(guī)律,幫助我們做出決策准脂,完成業(yè)務(wù)訴求。
3. 數(shù)據(jù)可視化 數(shù)據(jù)可視化可以幫助我們更直白地看到做出的結(jié)果檬洞,幫助我們理解或者向他人演示狸膏。
數(shù)據(jù)挖掘是數(shù)據(jù)分析的重中之重,大家的差異和價值也體現(xiàn)在其中添怔。
下面我列出數(shù)據(jù)挖掘的知識清單湾戳,供大家學(xué)習(xí)參考。
每一個算法都可能花你很多時間去搞懂广料,我希望大家可以先去了解下每個算法的基本含義以及作用砾脑,這樣你才會有更深刻的印象。
留一個思考題艾杏,你要開始學(xué)習(xí)數(shù)據(jù)挖掘了韧衣,你有什么心得體會呢?如果一個淘寶店家要查看店鋪商品之間的關(guān)聯(lián)關(guān)系购桑,他應(yīng)該用那個算法呢畅铭?為什么?
歡迎大家留言討論勃蜘,后續(xù)我會持續(xù)更新硕噩,記得關(guān)注我哦!