主要思考幾個(gè)問(wèn)題: 1坪创、logistic回歸的應(yīng)用場(chǎng)景 Logistic回歸是一種用于解決二分類(lèi)問(wèn)題的機(jī)器學(xué)習(xí)方法衡楞,是一種判別模型:表現(xiàn)為直接對(duì)...
疑問(wèn): 為什么要分訓(xùn)練集、驗(yàn)證集拣度、測(cè)試集短曾? 為什么采用交叉驗(yàn)證姨谷? 交叉驗(yàn)證的應(yīng)用場(chǎng)景是什么康谆? 最終預(yù)測(cè)模型是怎么得到的领斥? 預(yù)備知識(shí):什么是超參數(shù)...
1.1.1 為什么使用python 1.1.1.1 科學(xué)家的需求 獲取數(shù)據(jù)(模擬、實(shí)驗(yàn)控制) 操作和處理數(shù)據(jù) 可視化結(jié)果沃暗、快速理解月洛、繪制高質(zhì)量圖...
1、 在當(dāng)前的很多數(shù)據(jù)集上孽锥,相對(duì)其他算法有著很大的優(yōu)勢(shì)嚼黔,表現(xiàn)良好2、它能夠處理很高維度的數(shù)據(jù)忱叭,并且不用做特征選擇隔崎,因?yàn)樘卣髯蛹请S機(jī)選擇的3今艺、在...
總體思路: 理解問(wèn)題:查看每個(gè)變量并且根據(jù)他們的意義和對(duì)問(wèn)題的重要性進(jìn)行哲學(xué)分析韵丑。單因素研究:只關(guān)注因變量(SalePrice)并且進(jìn)行更深入的...
過(guò)擬合:訓(xùn)練集上表現(xiàn)很好撵彻,但是在測(cè)試集上表現(xiàn)很差,泛化性能差实牡。 降低過(guò)擬合的方法:(1)試著尋找最簡(jiǎn)單的假設(shè)(2)正則化(3)early sto...
在隨機(jī)森林bagging法中可以發(fā)現(xiàn)booststrap每次約有1/3的樣本不會(huì)出現(xiàn)在bootstrap所采集的樣本集合中,故沒(méi)有參加決策樹(shù)的建...
相同點(diǎn):(1)都是由多棵樹(shù)組成的碗短,都是集成學(xué)習(xí)算法(2)最終的結(jié)果都是由多顆樹(shù)一起決定 不同點(diǎn):(1)組成隨機(jī)森林的樹(shù)可以是分類(lèi)樹(shù),也可以是回歸...