前言
本書主要闡述數(shù)據(jù)挖掘原理讹剔,在示例的引導(dǎo)下詳細(xì)講解起源于統(tǒng)計學(xué)油讯、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)延欠、模料邏輯和演化計算等學(xué)科的具有代表性的撞羽、最前沿的挖掘方法和算法。本書還著重描述如何恰當(dāng)?shù)剡x擇方法數(shù)據(jù)分析軟件并合理地調(diào)整參數(shù)衫冻。每章末尾附有復(fù)習(xí)題诀紊。
本書特點
1.介紹支持向量機(SVM)和Kohonen映射
2.講解DBSCAN、BIRCH和分布式DBSCAN聚類算法
3.介紹貝葉斯網(wǎng)絡(luò)隅俘,討論圖形中的Betweeness和Centrality參數(shù)測量算法
4.分析在建立決策樹時使用的CART算法和基尼指數(shù)
5.介紹Bagging & Boosting集成學(xué)習(xí)方法邻奠,并詳述AdaBoost算法
6.討論Relief以及PageRank算法
7.討論文本挖掘的潛在語義分析(LSA),并分析如何測定文本文檔之間的語義相似性
8.講解時態(tài)、空間为居、Web碌宴、文本、并行和分布式數(shù)據(jù)挖掘等新主題
9.更詳細(xì)地講解數(shù)據(jù)挖掘技術(shù)商業(yè)蒙畴、隱私贰镣、安全和法律方面的內(nèi)容
第一章 數(shù)據(jù)挖掘的概念
1.1 概述
1.2 數(shù)據(jù)挖掘的起源
1.3 數(shù)據(jù)挖掘過程
1.4 大型數(shù)據(jù)集
1.5 數(shù)據(jù)倉庫
1.6 數(shù)據(jù)挖掘的商業(yè)方面:為什么數(shù)據(jù)挖掘項目會失敗.
1.7 本書結(jié)構(gòu)安排.
1.8 復(fù)習(xí)題
1.9 參考書目
第二章 數(shù)據(jù)準(zhǔn)備
2.1 原始數(shù)據(jù)的表述
2.2 原始數(shù)據(jù)的特性
2.3 原始數(shù)據(jù)的轉(zhuǎn)換
2.3.1 標(biāo)準(zhǔn)化
2.3.2 數(shù)據(jù)平整
2.3.3 差值和比率
2.4 丟失數(shù)據(jù)
2.5 時間相關(guān)數(shù)據(jù)
2.6 異常點分析
2.7 復(fù)習(xí)題
2.8 參考書目
第三章 數(shù)據(jù)歸約
3.1 大型數(shù)據(jù)集的維度
3.2 特征歸約
3.2.1 特征選擇
3.2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量.
3.5 主成分分析
3.6 值歸約
3.7 特征離散化:ChiMerge技術(shù)
3.8 案例歸約
3.9 復(fù)習(xí)題
3.10 參考書目
第四章 從數(shù)據(jù)中學(xué)習(xí)
4.1 學(xué)習(xí)機器
4.2 統(tǒng)計學(xué)習(xí)原理
4.3 學(xué)習(xí)方法的類型
4.4 常見的學(xué)習(xí)任務(wù)
4.5 支持向量機.
4.6k NN:最近鄰分類器.
4.7 模型選擇 與泛化
4.8 模型的評估
4.9 90%準(zhǔn)確的情形
4.9.1 保險欺詐檢測
4.9.2 改進心臟護理
4.10 復(fù)習(xí)題
4.11 參考書目
第五章 統(tǒng)計方法
5.1 統(tǒng)計推斷
5.2 評測數(shù)據(jù)集的差異
5.3 貝葉斯定理
5.4 預(yù)測回歸
5.5 方差分析
5.6 對數(shù)回歸
5.7 對數(shù)-線性模型.
5.8 線性判別分析
5.9 復(fù)習(xí)題
5.10 參考書目
第六章 決策樹和決策規(guī)則
6.1 決策樹
6.2 C4.5算法:生成決策樹
6.3 未知屬性值
6.4 修剪決策樹
6.5 C4.5 算法:生成決策規(guī)則
6.6 CART 算法和Gini指標(biāo)
6.7 決策樹和決策規(guī)則的局限性
6.8 復(fù)習(xí)題
6.9 參考書 目
第七章人工神經(jīng)網(wǎng)絡(luò)
第八章 集成學(xué)習(xí)
第九章 聚類分析
第十章 關(guān)聯(lián)規(guī)則
第十一章 Web 挖掘和文本挖掘
第十二章 數(shù)據(jù)挖掘高級技術(shù)
第十三章 遺傳算法
第十四章 模糊集和模糊邏輯
第十五章 可視化方法
附錄A數(shù)據(jù)挖掘工具
附錄B數(shù)據(jù)挖掘應(yīng)用
總結(jié)
由于這本書的細(xì)節(jié)分的太多了,今天小編就整理到這里想要獲取的小伙伴可以+WX17667506182來獲取哦~~~
最后給小編一個關(guān)注就是最大的動力膳凝!