模型的狀態(tài)(過(guò)擬合與欠擬合)

轉(zhuǎn)自july算法班:

模型的狀態(tài)分為過(guò)擬合和欠擬合

過(guò)擬合(overfitting/high variance) 高波動(dòng)性

欠擬合(underfitting/high bias) ?高偏差

模型的過(guò)擬合具有高波動(dòng)性
知識(shí)圖譜學(xué)習(xí)

比如給出一些樣本點(diǎn)挖腰,需要在上面畫畫豹储,第一張圖毫無(wú)規(guī)律可尋列林,稱為欠擬合枝冀。而中間圖找出了一些樣本點(diǎn)之間的關(guān)聯(lián)性智亮。最后一張圖根據(jù)樣本點(diǎn)畫出了一只貓。我們稱為過(guò)擬合洋丐『阑澹可以這樣想,如果這些點(diǎn)只能畫出貓是不是局限了我們想象力呢达椰?難道不能畫出一只仰頭的兔子來(lái)嗎翰蠢?

所以我們要尋找的規(guī)律不是一種特殊的規(guī)律,而是一種普適的一般性的規(guī)律啰劲,它既對(duì)已知數(shù)據(jù)有較好的擬合對(duì)未知數(shù)據(jù)也沒(méi)有較大的偏差性梁沧。

---模型狀態(tài)驗(yàn)證工具:學(xué)習(xí)曲線

學(xué)習(xí)曲線

---不同模型狀態(tài)的處理

---過(guò)擬合,找更多的數(shù)據(jù)來(lái)學(xué)習(xí)

---增大正則化系數(shù)

---減少特征個(gè)數(shù)(不太推薦)

注意:不要以為降維就可以解決過(guò)擬合的問(wèn)題

----2. 欠擬合

-----找到更多特征

-----減小正則化系數(shù)


---線性模型的權(quán)重分析

----1.線性或者線性kernel的model

---Linear Regression

---Logistic Regression

---Linear SVM

------2. 對(duì)權(quán)重絕對(duì)值高/低的特征

---做更細(xì)化的工作

----特征組合

-----優(yōu)化3之Bad-Case分析

1. 分類問(wèn)題

----哪些樣本分錯(cuò)了

----哪部分特征使得它分錯(cuò)了

----這些bad cases有沒(méi)有共性蝇裤?

-----是否還有沒(méi)有挖掘出的特征

2. 回歸問(wèn)題

-----哪些樣本預(yù)測(cè)結(jié)果差距大廷支,為什么

------優(yōu)化4之模型融合

1. 集體智慧

Bagging

隨機(jī)森林

2. 一萬(wàn)小時(shí)定律

Adaboost(小學(xué)-初中-高中-大學(xué)-(碩士)-(博士))

梯度提升樹(shù)(GBT)


Bagging

1. 模型很多時(shí)候效果不好的原因是因?yàn)檫^(guò)擬合

2. 如何緩解频鉴?

--每次少給一點(diǎn)樣本集

---找不同的模型來(lái)做,然后綜合一下答案(貨比三家)

--算法:

1. 不用全部的數(shù)據(jù)集恋拍,每次有放回的抽取一個(gè)子集訓(xùn)練模型【可以降低噪聲點(diǎn)對(duì)結(jié)果的影響】

2. 分類:用這些模型結(jié)果做一個(gè)vote

3. 回歸:對(duì)這些模型的結(jié)果取平均


--用不同的算法:

用這些結(jié)果做vote或求平均

----AdaBoost

1.考得不好的原因垛孔?

---不夠努力:重復(fù)迭代和訓(xùn)練

---時(shí)間分配要合理,要多做之前練習(xí)錯(cuò)的題:每次分配給分錯(cuò)的樣本更高的權(quán)重

--不聰明施敢,但是腳踏實(shí)地:最簡(jiǎn)單的分類器的疊加

Adaboost算法流程
AdaBoost模型權(quán)重相加

有可能會(huì)過(guò)擬合

解決:學(xué)習(xí)的時(shí)候不學(xué)所有的樣本集和特征周荐。減少樹(shù)的深度

對(duì)錯(cuò)誤值和噪聲敏感

回歸問(wèn)題:GDT(梯度提升樹(shù))

梯度提升樹(shù)(模型融合)

第二張圖中所有綠色的點(diǎn)是紅色的點(diǎn)對(duì)于粗糙的模型作差(殘差)得到

不斷地重復(fù)上述過(guò)程

提升得到
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市僵娃,隨后出現(xiàn)的幾起案子概作,更是在濱河造成了極大的恐慌,老刑警劉巖悯许,帶你破解...
    沈念sama閱讀 210,914評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件仆嗦,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡先壕,警方通過(guò)查閱死者的電腦和手機(jī)瘩扼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,935評(píng)論 2 383
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)垃僚,“玉大人集绰,你說(shuō)我怎么就攤上這事∽还祝” “怎么了栽燕?”我有些...
    開(kāi)封第一講書人閱讀 156,531評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)改淑。 經(jīng)常有香客問(wèn)我碍岔,道長(zhǎng),這世上最難降的妖魔是什么朵夏? 我笑而不...
    開(kāi)封第一講書人閱讀 56,309評(píng)論 1 282
  • 正文 為了忘掉前任蔼啦,我火速辦了婚禮,結(jié)果婚禮上仰猖,老公的妹妹穿的比我還像新娘捏肢。我一直安慰自己,他們只是感情好饥侵,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,381評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布鸵赫。 她就那樣靜靜地躺著,像睡著了一般躏升。 火紅的嫁衣襯著肌膚如雪辩棒。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 49,730評(píng)論 1 289
  • 那天,我揣著相機(jī)與錄音一睁,去河邊找鬼藕赞。 笑死,一個(gè)胖子當(dāng)著我的面吹牛卖局,可吹牛的內(nèi)容都是我干的斧蜕。 我是一名探鬼主播,決...
    沈念sama閱讀 38,882評(píng)論 3 404
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼砚偶,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼批销!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起染坯,我...
    開(kāi)封第一講書人閱讀 37,643評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤均芽,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后单鹿,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體掀宋,經(jīng)...
    沈念sama閱讀 44,095評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,448評(píng)論 2 325
  • 正文 我和宋清朗相戀三年仲锄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了劲妙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,566評(píng)論 1 339
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡儒喊,死狀恐怖镣奋,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情怀愧,我是刑警寧澤侨颈,帶...
    沈念sama閱讀 34,253評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站芯义,受9級(jí)特大地震影響哈垢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扛拨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,829評(píng)論 3 312
  • 文/蒙蒙 一耘分、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧鬼癣,春花似錦陶贼、人聲如沸啤贩。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,715評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)痹屹。三九已至章郁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背暖庄。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,945評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工聊替, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人培廓。 一個(gè)月前我還...
    沈念sama閱讀 46,248評(píng)論 2 360
  • 正文 我出身青樓惹悄,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親肩钠。 傳聞我的和親對(duì)象是個(gè)殘疾皇子泣港,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,440評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容