標簽(空格分隔): 數(shù)據(jù)化運營
2.1 數(shù)據(jù)挖掘發(fā)展史
2.2 數(shù)據(jù)分析與數(shù)據(jù)挖掘的主要區(qū)別
2.3 數(shù)據(jù)挖掘的主要成熟技術(shù)以及在數(shù)據(jù)化運營中的主要應(yīng)用
2.4 互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)挖掘應(yīng)用的特點
2.1 數(shù)據(jù)挖掘的發(fā)展史
始于20世紀下半葉
發(fā)展 1989年第11屆國際人工智能聯(lián)合會議 首次出現(xiàn)KDD(knowledge discovery in database)
進入21世紀屈暗,數(shù)據(jù)挖掘作為比較成熟的交叉學(xué)科舌仍,融合了數(shù)據(jù)庫钻洒、人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)悼泌、高性能計算、模式識別、神經(jīng)網(wǎng)絡(luò)是越、數(shù)據(jù)可視化、信息檢索和空間數(shù)據(jù)分析等多個領(lǐng)域的理論核技術(shù)碌上。
2.2 統(tǒng)計分析和數(shù)據(jù)挖掘的主要區(qū)別
兩者在很多情況下都是同根同源的倚评。
相對于傳統(tǒng)的統(tǒng)計分析技術(shù)浦徊,數(shù)據(jù)挖掘有以下特點:
- 數(shù)據(jù)挖掘特別擅長處理大數(shù)據(jù)
- 數(shù)據(jù)挖掘在實踐中一般會借助數(shù)據(jù)挖掘工具
- 數(shù)據(jù)挖掘技術(shù)更多的是企業(yè)數(shù)據(jù)分析師、業(yè)務(wù)分析師在使用天梧,而不是統(tǒng)計學(xué)家盔性。
- 數(shù)據(jù)挖掘是統(tǒng)計分析技術(shù)的延伸和發(fā)展。
數(shù)據(jù)挖掘與統(tǒng)計分析的明顯差別: - 統(tǒng)計分析的基礎(chǔ)之一是概率困呢岗,在分析時冕香,需要對數(shù)據(jù)分布和變量間的關(guān)系做假設(shè)而數(shù)據(jù)挖掘會自動尋找變量之間的關(guān)系。
- 統(tǒng)計分析在預(yù)測中長表現(xiàn)為一個或一組函數(shù)的關(guān)系式后豫,數(shù)據(jù)挖掘在預(yù)測應(yīng)用中的重點在于預(yù)測的結(jié)果悉尾,很多時候不會產(chǎn)生明確的關(guān)系式。
- 實踐應(yīng)用中挫酿,統(tǒng)計分析常需要分析人員先做假設(shè)或判斷构眯,然后利用數(shù)據(jù)分析技術(shù)來驗證該假設(shè)是否成立。數(shù)據(jù)挖掘讓算法自己去尋找數(shù)據(jù)中隱藏的關(guān)系或規(guī)律早龟。
2.3 數(shù)據(jù)挖掘的主要成熟技術(shù)以及在數(shù)據(jù)化運營中的主要應(yīng)用
決策樹
神經(jīng)網(wǎng)絡(luò)
回歸
關(guān)聯(lián)分析
聚類
貝葉斯分類方法
支持向量機
主成份分析
假設(shè)檢驗
2.4 互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)挖掘應(yīng)用的特點
數(shù)據(jù)海量
分析周期段
分析失效性明顯變短
互聯(lián)網(wǎng)行業(yè)的顛覆性迅速惫霸、周期短