《python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》之挖掘建模

經(jīng)過數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理智哀,我們得到了可以直接建模的數(shù)據(jù)殖侵。根據(jù)挖掘目標和數(shù)據(jù)形式可以建立分類與預(yù)測贸呢、聚類分析、關(guān)聯(lián)規(guī)則拢军、時序模式和偏差檢測等模型楞陷。


挖掘建模

分類和預(yù)測是預(yù)測問題的兩種類型,分類主要是預(yù)測分類標號(離散屬性)茉唉,而預(yù)測主要是建立連續(xù)值函數(shù)模型固蛾,預(yù)測給定自變量對應(yīng)的因變量的值。

回歸分析:
回歸分析是確定預(yù)測屬性(數(shù)值型)與其他變量間相互依賴的定量關(guān)系最常用的統(tǒng)計學方法度陆。包括線性回歸艾凯、非線性回歸、Logistic回歸懂傀、嶺回歸趾诗、主成分回歸、偏最小二乘回歸等模型。

回歸分析

1.線性回歸:對一個或多個自變量和因變量之間的線性關(guān)系進行建模恃泪,可用最小二乘法求解模型系數(shù)郑兴。

2.非線性回歸:對一個或多個自變量和因變量之間的線性關(guān)系進行建模。如果非線性關(guān)系可以通過簡單的函數(shù)變換轉(zhuǎn)化成線性關(guān)系贝乎,用線性回歸的思想求解情连;如果不能轉(zhuǎn)化,用非線性最小二乘法求解览效。

3.Logistic回歸:是廣義線性回歸模型的特例却舀,利用Logistic函數(shù)將因變量的取值范圍控制在0和1之間,表示取值為1的概率朽肥。

4.嶺回歸:是一種改進最小二乘法估計的方法禁筏。

5.主成分回歸:主成分回歸是根據(jù)主成分分析的思想提出來的持钉,是對最小二乘法估計的一種改進衡招,它是參數(shù)估計的一種偏估計∶壳浚可以消除自變量之間的多重共線性始腾。

決策樹:
決策樹采用自頂向下的遞歸方式,在內(nèi)部節(jié)點進行屬性值的比較空执,并根據(jù)不同的屬性值從該節(jié)點向下分支浪箭,最終得到的葉節(jié)點是學習劃分的類。
1.ID3算法:其核心是在決策樹的各級節(jié)點上辨绊,使用信息增益方法作為屬性的選擇標準奶栖,來幫助確定生成每個節(jié)點時所應(yīng)采用的合適屬性。

2.C4.5算法:C4.5決策樹生成算法相對于ID3算法的重要改進是使用信息增益率來選擇節(jié)點屬性门坷。C4.5算法可以克服ID3算法存在的不足:ID3算法只適用于離散的描述屬性宣鄙,而C4.5算法既能夠處理離散的描述屬性,也可以處理連續(xù)的描述屬性默蚌。

3.CART算法:CART決策樹是一種十分有效的非參數(shù)分類和回歸方法冻晤,通過構(gòu)建樹、修剪樹绸吸、評估樹來構(gòu)建一個二叉樹鼻弧。當終結(jié)點是連續(xù)變量時,該樹為回歸樹锦茁;當終結(jié)點是分類變量時攘轩,該樹為分類樹;

人工神經(jīng)網(wǎng)絡(luò):
人工神經(jīng)網(wǎng)絡(luò)是一種模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的信息處理系統(tǒng)码俩,表示神經(jīng)網(wǎng)絡(luò)的輸入與輸出變量之間關(guān)系的模型撑刺。
1.BP神經(jīng)網(wǎng)絡(luò):是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡(luò),學習算法是誤差校正學習算法握玛,是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一够傍。

2.LM神經(jīng)網(wǎng)絡(luò):是基于梯度下降法和牛頓法結(jié)合的多層前饋網(wǎng)絡(luò)甫菠,特點:迭代次數(shù)少,收斂速度快冕屯,精確度高寂诱。

3.RBF徑向基神經(jīng)網(wǎng)絡(luò):RBF網(wǎng)絡(luò)能夠以任意精度逼近任意連續(xù)函數(shù),從輸入層到隱含層的變換是非線性的安聘,而從隱含層到輸出層的變換是線性的痰洒,特別適合于解決分類問題。

4.FNN模糊神經(jīng)網(wǎng)絡(luò):FNN模糊神經(jīng)網(wǎng)絡(luò)是具有模糊權(quán)系數(shù)或者輸入信號是模糊量的神經(jīng)網(wǎng)絡(luò)浴韭,是模糊系統(tǒng)與神經(jīng)網(wǎng)絡(luò)相結(jié)合的產(chǎn)物丘喻,它匯聚了神經(jīng)網(wǎng)絡(luò)與模糊系統(tǒng)的優(yōu)點,集聯(lián)想念颈、識別泉粉、自適應(yīng)及模糊信息于一體

5.GMDH神經(jīng)網(wǎng)絡(luò):GMDH網(wǎng)絡(luò)也稱為多項式網(wǎng)絡(luò),它是前饋神經(jīng)網(wǎng)絡(luò)中常用的一種用于預(yù)測的神經(jīng)網(wǎng)絡(luò)榴芳。它的特點是網(wǎng)路結(jié)構(gòu)不固定嗡靡,而且在訓練過程中不斷改變。

6.ANFIS自適應(yīng)神經(jīng)網(wǎng)絡(luò):神經(jīng)網(wǎng)絡(luò)鑲嵌在一個全部模糊的結(jié)構(gòu)之中窟感,在不知不覺中向訓練數(shù)據(jù)學習讨彼,自動產(chǎn)生、修正并高度概括出最佳的輸入與輸出變量的隸屬函數(shù)及模糊規(guī)則柿祈;另外哈误,神經(jīng)網(wǎng)絡(luò)的各層結(jié)構(gòu)與參數(shù)也都具有了明確的、易于理解的物理意義躏嚎。


聚類分析

貝葉斯網(wǎng)絡(luò):
貝葉斯網(wǎng)絡(luò)又稱信度網(wǎng)絡(luò)蜜自,是Bayes方法的擴展,是目前不確定知識表達和推理領(lǐng)域最有效的理論模型之一紧索。

支持向量機:
支持向量機是一種通過某種非線性映射袁辈,把低維的非線性可分轉(zhuǎn)化為高維的線性可分,在高維空間進行線性分析的算法珠漂。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末晚缩,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子媳危,更是在濱河造成了極大的恐慌荞彼,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件待笑,死亡現(xiàn)場離奇詭異鸣皂,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門寞缝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來癌压,“玉大人,你說我怎么就攤上這事荆陆√步欤” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵被啼,是天一觀的道長帜消。 經(jīng)常有香客問我,道長浓体,這世上最難降的妖魔是什么泡挺? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮命浴,結(jié)果婚禮上娄猫,老公的妹妹穿的比我還像新娘。我一直安慰自己咳促,他們只是感情好稚新,可當我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布勘伺。 她就那樣靜靜地躺著跪腹,像睡著了一般脖咐。 火紅的嫁衣襯著肌膚如雪栅迄。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天固灵,我揣著相機與錄音缅帘,去河邊找鬼轴术。 笑死,一個胖子當著我的面吹牛钦无,可吹牛的內(nèi)容都是我干的逗栽。 我是一名探鬼主播,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼失暂,長吁一口氣:“原來是場噩夢啊……” “哼彼宠!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起弟塞,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤凭峡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后决记,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體摧冀,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了索昂。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片建车。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖椒惨,靈堂內(nèi)的尸體忽然破棺而出癞志,到底是詐尸還是另有隱情,我是刑警寧澤框产,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布凄杯,位于F島的核電站,受9級特大地震影響秉宿,放射性物質(zhì)發(fā)生泄漏戒突。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一描睦、第九天 我趴在偏房一處隱蔽的房頂上張望膊存。 院中可真熱鬧,春花似錦忱叭、人聲如沸隔崎。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽爵卒。三九已至,卻和暖如春撵彻,著一層夾襖步出監(jiān)牢的瞬間钓株,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工陌僵, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留轴合,地道東北人。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓碗短,卻偏偏與公主長得像受葛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子偎谁,可洞房花燭夜當晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容