偏差和方差

1、在進(jìn)行模型選擇和評(píng)估時(shí)际度,我們經(jīng)常會(huì)關(guān)注偏差和方差葵袭,那么什么是偏差?什么是方差乖菱?

偏差:描述的是預(yù)測(cè)值的期望與真實(shí)值之間的差距坡锡。偏差越大,越偏離真實(shí)數(shù)據(jù)窒所。偏差也叫擬合能力鹉勒。
方差:描述的是預(yù)測(cè)值的變化范圍,離散程度吵取,也就是離其期望值的距離禽额。方差越大,數(shù)據(jù)的分布越分散。度量了同樣大小的訓(xùn)練集的變動(dòng)所導(dǎo)致的學(xué)習(xí)性能的變化脯倒,即刻畫(huà)了數(shù)據(jù)擾動(dòng)造成的影響实辑。

由下圖可以看出來(lái),偏差大就是與真實(shí)值的差距大藻丢,高方差跟真實(shí)值沒(méi)什么關(guān)系剪撬,只是預(yù)測(cè)值是否密集在一起,如果分散悠反,就是方差大残黑。


注意:

Bias:誤差,擬合出來(lái)的對(duì)象是單個(gè)模型斋否,期望輸出與真實(shí)標(biāo)記的差別

Variance:方差梨水,擬合對(duì)象是多個(gè)模型,從同一個(gè)數(shù)據(jù)集中茵臭,用科學(xué)的采樣方法得到幾個(gè)不同的子訓(xùn)練集疫诽,用這些訓(xùn)練集訓(xùn)練得到的模型往往并不相同。藍(lán)色和綠色分別是同一個(gè)訓(xùn)練集上采樣得到的兩個(gè)訓(xùn)練子集笼恰,由于采取了復(fù)雜的算法去擬合踊沸,兩個(gè)模型差異很大歇终。如果是拿直線擬合的話社证,顯然差異不會(huì)這么大。

Paste_Image.png

2评凝、方差與偏差trade-off


當(dāng)模型復(fù)雜度逐漸增強(qiáng)的時(shí)候追葡,偏差是逐漸減小的,方差逐漸增大奕短,它們中間有一個(gè)交點(diǎn)宜肉,就是兩者達(dá)到平衡,在適當(dāng)?shù)哪P蛷?fù)雜度下翎碑,對(duì)訓(xùn)練數(shù)據(jù)有一個(gè)良好的擬合谬返,而且泛化性能也不差。

2日杈、對(duì)于高偏差和高方差的情況應(yīng)該如何處理遣铝?

下圖是NG機(jī)器學(xué)習(xí)課的一個(gè)截圖:



解釋:
(1)增加訓(xùn)練樣本可以減小方差,以為隨著樣本量的增加莉擒,泛化性能會(huì)好一些酿炸,驗(yàn)證損失會(huì)Jcv逐漸減小,所以會(huì)減小方差
(2)取少量的特征涨冀,可以有效的防止過(guò)擬合填硕,提高泛化性能,會(huì)減小方差鹿鳖。
(3)取更多的特征扁眯,能從更多的角度學(xué)習(xí)數(shù)據(jù)的分布壮莹,減小訓(xùn)練loss,會(huì)減小偏差恋拍。
(4)增加多項(xiàng)式特征垛孔,增加了模型的復(fù)雜度,可以降低偏差施敢。
(5)減小lambda:就是削弱正則的作用周荐,增加模型復(fù)雜度,減小偏差
(6)增大lambda:增強(qiáng)正則的作用僵娃,對(duì)參數(shù)進(jìn)行有效控制概作,防止過(guò)擬合,減小方差默怨。

注意:
這里應(yīng)該學(xué)會(huì)的是讯榕,對(duì)癥下藥,我們通過(guò)觀察學(xué)習(xí)曲線匙睹,可以知道是偏差大了還是方差大了愚屁,從而進(jìn)行解決方案的選取。選取不當(dāng)?shù)脑捄勖剩粫?huì)產(chǎn)生任何優(yōu)化霎槐,比如說(shuō):如果偏差較大的話,增加訓(xùn)練樣本的個(gè)數(shù)是沒(méi)用的梦谜,必須采取其他有效的方法丘跌,可以增加特征,增加多項(xiàng)式唁桩,減小lambda等闭树。

參考文章
http://www.cnblogs.com/zhizhan/p/5002455.html
https://www.zhihu.com/question/20448464

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市荒澡,隨后出現(xiàn)的幾起案子报辱,更是在濱河造成了極大的恐慌,老刑警劉巖单山,帶你破解...
    沈念sama閱讀 218,525評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件碍现,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡饥侵,警方通過(guò)查閱死者的電腦和手機(jī)鸵赫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)躏升,“玉大人辩棒,你說(shuō)我怎么就攤上這事。” “怎么了一睁?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,862評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵钻弄,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我者吁,道長(zhǎng)窘俺,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,728評(píng)論 1 294
  • 正文 為了忘掉前任复凳,我火速辦了婚禮瘤泪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘育八。我一直安慰自己对途,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布髓棋。 她就那樣靜靜地躺著实檀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪按声。 梳的紋絲不亂的頭發(fā)上膳犹,一...
    開(kāi)封第一講書(shū)人閱讀 51,590評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音签则,去河邊找鬼须床。 笑死,一個(gè)胖子當(dāng)著我的面吹牛怀愧,可吹牛的內(nèi)容都是我干的侨颈。 我是一名探鬼主播余赢,決...
    沈念sama閱讀 40,330評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼芯义,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了妻柒?” 一聲冷哼從身側(cè)響起扛拨,我...
    開(kāi)封第一講書(shū)人閱讀 39,244評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎举塔,沒(méi)想到半個(gè)月后绑警,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,693評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡央渣,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評(píng)論 3 336
  • 正文 我和宋清朗相戀三年计盒,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片芽丹。...
    茶點(diǎn)故事閱讀 40,001評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡北启,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情咕村,我是刑警寧澤场钉,帶...
    沈念sama閱讀 35,723評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站懈涛,受9級(jí)特大地震影響逛万,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜批钠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評(píng)論 3 330
  • 文/蒙蒙 一宇植、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧埋心,春花似錦当纱、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,919評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至洋腮,卻和暖如春箫柳,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背啥供。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,042評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工悯恍, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人伙狐。 一個(gè)月前我還...
    沈念sama閱讀 48,191評(píng)論 3 370
  • 正文 我出身青樓涮毫,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親贷屎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子罢防,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容