20年數(shù)據(jù)開發(fā)大懦鸲撸總結(jié)出的大數(shù)據(jù)挖掘:概念沦辙、模型、方法和算法

前言

本書主要闡述數(shù)據(jù)挖掘原理讹剔,在示例的引導(dǎo)下詳細(xì)講解起源于統(tǒng)計學(xué)油讯、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)延欠、模料邏輯和演化計算等學(xué)科的具有代表性的撞羽、最前沿的挖掘方法和算法。本書還著重描述如何恰當(dāng)?shù)剡x擇方法數(shù)據(jù)分析軟件并合理地調(diào)整參數(shù)衫冻。每章末尾附有復(fù)習(xí)題诀紊。

本書特點

1.介紹支持向量機(SVM)和Kohonen映射

2.講解DBSCAN、BIRCH和分布式DBSCAN聚類算法

3.介紹貝葉斯網(wǎng)絡(luò)隅俘,討論圖形中的Betweeness和Centrality參數(shù)測量算法

4.分析在建立決策樹時使用的CART算法和基尼指數(shù)

5.介紹Bagging & Boosting集成學(xué)習(xí)方法邻奠,并詳述AdaBoost算法

6.討論Relief以及PageRank算法

7.討論文本挖掘的潛在語義分析(LSA),并分析如何測定文本文檔之間的語義相似性

8.講解時態(tài)、空間为居、Web碌宴、文本、并行和分布式數(shù)據(jù)挖掘等新主題

9.更詳細(xì)地講解數(shù)據(jù)挖掘技術(shù)商業(yè)蒙畴、隱私贰镣、安全和法律方面的內(nèi)容

第一章 數(shù)據(jù)挖掘的概念

1.1 概述

1.2 數(shù)據(jù)挖掘的起源

1.3 數(shù)據(jù)挖掘過程

1.4 大型數(shù)據(jù)集

1.5 數(shù)據(jù)倉庫

1.6 數(shù)據(jù)挖掘的商業(yè)方面:為什么數(shù)據(jù)挖掘項目會失敗.

1.7 本書結(jié)構(gòu)安排.

1.8 復(fù)習(xí)題

1.9 參考書目

第二章 數(shù)據(jù)準(zhǔn)備

2.1 原始數(shù)據(jù)的表述

2.2 原始數(shù)據(jù)的特性

2.3 原始數(shù)據(jù)的轉(zhuǎn)換

2.3.1 標(biāo)準(zhǔn)化

2.3.2 數(shù)據(jù)平整

2.3.3 差值和比率

2.4 丟失數(shù)據(jù)

2.5 時間相關(guān)數(shù)據(jù)

2.6 異常點分析

2.7 復(fù)習(xí)題

2.8 參考書目

第三章 數(shù)據(jù)歸約

3.1 大型數(shù)據(jù)集的維度

3.2 特征歸約

3.2.1 特征選擇

3.2.2 特征提取

3.3 Relief算法

3.4 特征排列的熵度量.

3.5 主成分分析

3.6 值歸約

3.7 特征離散化:ChiMerge技術(shù)

3.8 案例歸約

3.9 復(fù)習(xí)題

3.10 參考書目

第四章 從數(shù)據(jù)中學(xué)習(xí)

4.1 學(xué)習(xí)機器

4.2 統(tǒng)計學(xué)習(xí)原理

4.3 學(xué)習(xí)方法的類型

4.4 常見的學(xué)習(xí)任務(wù)

4.5 支持向量機.

4.6k NN:最近鄰分類器.

4.7 模型選擇 與泛化

4.8 模型的評估

4.9 90%準(zhǔn)確的情形

4.9.1 保險欺詐檢測

4.9.2 改進心臟護理

4.10 復(fù)習(xí)題

4.11 參考書目

第五章 統(tǒng)計方法

5.1 統(tǒng)計推斷

5.2 評測數(shù)據(jù)集的差異

5.3 貝葉斯定理

5.4 預(yù)測回歸

5.5 方差分析

5.6 對數(shù)回歸

5.7 對數(shù)-線性模型.

5.8 線性判別分析

5.9 復(fù)習(xí)題

5.10 參考書目

第六章 決策樹和決策規(guī)則

6.1 決策樹

6.2 C4.5算法:生成決策樹

6.3 未知屬性值

6.4 修剪決策樹

6.5 C4.5 算法:生成決策規(guī)則

6.6 CART 算法和Gini指標(biāo)

6.7 決策樹和決策規(guī)則的局限性

6.8 復(fù)習(xí)題

6.9 參考書 目

第七章人工神經(jīng)網(wǎng)絡(luò)

第八章 集成學(xué)習(xí)

第九章 聚類分析

第十章 關(guān)聯(lián)規(guī)則

第十一章 Web 挖掘和文本挖掘

第十二章 數(shù)據(jù)挖掘高級技術(shù)

第十三章 遺傳算法

第十四章 模糊集和模糊邏輯

第十五章 可視化方法

附錄A數(shù)據(jù)挖掘工具

附錄B數(shù)據(jù)挖掘應(yīng)用

總結(jié)

由于這本書的細(xì)節(jié)分的太多了,今天小編就整理到這里想要獲取的小伙伴可以+WX17667506182來獲取哦~~~

最后給小編一個關(guān)注就是最大的動力膳凝!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末碑隆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蹬音,更是在濱河造成了極大的恐慌上煤,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,639評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件著淆,死亡現(xiàn)場離奇詭異劫狠,居然都是意外死亡,警方通過查閱死者的電腦和手機永部,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,277評論 3 385
  • 文/潘曉璐 我一進店門独泞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人苔埋,你說我怎么就攤上這事懦砂。” “怎么了?”我有些...
    開封第一講書人閱讀 157,221評論 0 348
  • 文/不壞的土叔 我叫張陵孕惜,是天一觀的道長愧薛。 經(jīng)常有香客問我,道長衫画,這世上最難降的妖魔是什么毫炉? 我笑而不...
    開封第一講書人閱讀 56,474評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮削罩,結(jié)果婚禮上瞄勾,老公的妹妹穿的比我還像新娘。我一直安慰自己弥激,他們只是感情好进陡,可當(dāng)我...
    茶點故事閱讀 65,570評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著微服,像睡著了一般趾疚。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上以蕴,一...
    開封第一講書人閱讀 49,816評論 1 290
  • 那天糙麦,我揣著相機與錄音,去河邊找鬼丛肮。 笑死赡磅,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的宝与。 我是一名探鬼主播焚廊,決...
    沈念sama閱讀 38,957評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼习劫!你這毒婦竟也來了咆瘟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,718評論 0 266
  • 序言:老撾萬榮一對情侶失蹤榜聂,失蹤者是張志新(化名)和其女友劉穎搞疗,沒想到半個月后嗓蘑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體须肆,經(jīng)...
    沈念sama閱讀 44,176評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,511評論 2 327
  • 正文 我和宋清朗相戀三年桩皿,在試婚紗的時候發(fā)現(xiàn)自己被綠了豌汇。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,646評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡泄隔,死狀恐怖拒贱,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤逻澳,帶...
    沈念sama閱讀 34,322評論 4 330
  • 正文 年R本政府宣布闸天,位于F島的核電站,受9級特大地震影響斜做,放射性物質(zhì)發(fā)生泄漏苞氮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,934評論 3 313
  • 文/蒙蒙 一瓤逼、第九天 我趴在偏房一處隱蔽的房頂上張望笼吟。 院中可真熱鬧,春花似錦霸旗、人聲如沸贷帮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,755評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽撵枢。三九已至,卻和暖如春精居,著一層夾襖步出監(jiān)牢的瞬間诲侮,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,987評論 1 266
  • 我被黑心中介騙來泰國打工箱蟆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留沟绪,地道東北人。 一個月前我還...
    沈念sama閱讀 46,358評論 2 360
  • 正文 我出身青樓空猜,卻偏偏與公主長得像绽慈,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子辈毯,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,514評論 2 348