![240](https://cdn2.jianshu.io/assets/default_avatar/15-a7ac401939dd4df837e3bbf82abaa2a8.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
主要思考幾個(gè)問題: 1、logistic回歸的應(yīng)用場(chǎng)景 Logistic回歸是一種用于解決二分類問題的機(jī)器學(xué)習(xí)方法屑埋,是一種判別模型:表現(xiàn)為直接對(duì)...
疑問: 為什么要分訓(xùn)練集、驗(yàn)證集痰滋、測(cè)試集摘能? 為什么采用交叉驗(yàn)證? 交叉驗(yàn)證的應(yīng)用場(chǎng)景是什么敲街? 最終預(yù)測(cè)模型是怎么得到的团搞? 預(yù)備知識(shí):什么是超參數(shù)...
1.1.1 為什么使用python 1.1.1.1 科學(xué)家的需求 獲取數(shù)據(jù)(模擬、實(shí)驗(yàn)控制) 操作和處理數(shù)據(jù) 可視化結(jié)果多艇、快速理解逻恐、繪制高質(zhì)量圖...
1、 在當(dāng)前的很多數(shù)據(jù)集上峻黍,相對(duì)其他算法有著很大的優(yōu)勢(shì)复隆,表現(xiàn)良好2、它能夠處理很高維度的數(shù)據(jù)姆涩,并且不用做特征選擇挽拂,因?yàn)樘卣髯蛹请S機(jī)選擇的3、在...
總體思路: 理解問題:查看每個(gè)變量并且根據(jù)他們的意義和對(duì)問題的重要性進(jìn)行哲學(xué)分析骨饿。單因素研究:只關(guān)注因變量(SalePrice)并且進(jìn)行更深入的...
過擬合:訓(xùn)練集上表現(xiàn)很好宏赘,但是在測(cè)試集上表現(xiàn)很差绒北,泛化性能差。 降低過擬合的方法:(1)試著尋找最簡(jiǎn)單的假設(shè)(2)正則化(3)early sto...
在隨機(jī)森林bagging法中可以發(fā)現(xiàn)booststrap每次約有1/3的樣本不會(huì)出現(xiàn)在bootstrap所采集的樣本集合中镇饮,故沒有參加決策樹的建...
相同點(diǎn):(1)都是由多棵樹組成的箕母,都是集成學(xué)習(xí)算法(2)最終的結(jié)果都是由多顆樹一起決定 不同點(diǎn):(1)組成隨機(jī)森林的樹可以是分類樹储藐,也可以是回歸...