2020-02-19

過擬合乐导、欠擬合及其解決方案

過擬合嵌巷、欠擬合的概念

權重衰減

丟棄法

模型選擇抵蚊、過擬合和欠擬合

訓練誤差和泛化誤差

在解釋上述現象之前躏升,我們需要區(qū)分訓練誤差(training error)和泛化誤差(generalization error)。通俗來講节榜,前者指模型在訓練數據集上表現出的誤差羡玛,后者指模型在任意一個測試數據樣本上表現出的誤差的期望,并常常通過測試數據集上的誤差來近似宗苍。計算訓練誤差和泛化誤差可以使用之前介紹過的損失函數稼稿,例如線性回歸用到的平方損失函數和softmax回歸用到的交叉熵損失函數。

機器學習模型應關注降低泛化誤差讳窟。

模型選擇

驗證數據集

從嚴格意義上講让歼,測試集只能在所有超參數和模型參數選定后使用一次。不可以使用測試數據選擇模型丽啡,如調參谋右。由于無法從訓練誤差估計泛化誤差,因此也不應只依賴訓練數據選擇模型补箍。鑒于此改执,我們可以預留一部分在訓練數據集和測試數據集以外的數據來進行模型選擇。這部分數據被稱為驗證數據集坑雅,簡稱驗證集(validation set)瞧省。例如宜咒,我們可以從給定的訓練集中隨機選取一小部分作為驗證集燃少,而將剩余部分作為真正的訓練集恬吕。

K折交叉驗證

由于驗證數據集不參與模型訓練,當訓練數據不夠用時蛹尝,預留大量的驗證數據顯得太奢侈后豫。一種改善的方法是K折交叉驗證(K-fold cross-validation)。在K折交叉驗證中突那,我們把原始訓練數據集分割成K個不重合的子數據集挫酿,然后我們做K次模型訓練和驗證。每一次愕难,我們使用一個子數據集驗證模型早龟,并使用其他K-1個子數據集來訓練模型惫霸。在這K次訓練和驗證中,每次用來驗證模型的子數據集都不同葱弟。最后壹店,我們對這K次訓練誤差和驗證誤差分別求平均。

過擬合和欠擬合

接下來芝加,我們將探究模型訓練中經常出現的兩類典型問題:

一類是模型無法得到較低的訓練誤差硅卢,我們將這一現象稱作欠擬合(underfitting);

另一類是模型的訓練誤差遠小于它在測試數據集上的誤差藏杖,我們稱該現象為過擬合(overfitting)将塑。 在實踐中,我們要盡可能同時應對欠擬合和過擬合蝌麸。雖然有很多因素可能導致這兩種擬合問題点寥,在這里我們重點討論兩個因素:模型復雜度和訓練數據集大小。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末来吩,一起剝皮案震驚了整個濱河市敢辩,隨后出現的幾起案子,更是在濱河造成了極大的恐慌弟疆,老刑警劉巖戚长,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異怠苔,居然都是意外死亡历葛,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進店門嘀略,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人乓诽,你說我怎么就攤上這事帜羊。” “怎么了鸠天?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵讼育,是天一觀的道長。 經常有香客問我稠集,道長奶段,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任剥纷,我火速辦了婚禮痹籍,結果婚禮上,老公的妹妹穿的比我還像新娘晦鞋。我一直安慰自己蹲缠,他們只是感情好棺克,可當我...
    茶點故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著线定,像睡著了一般娜谊。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上斤讥,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天纱皆,我揣著相機與錄音,去河邊找鬼芭商。 笑死派草,一個胖子當著我的面吹牛,可吹牛的內容都是我干的蓉坎。 我是一名探鬼主播澳眷,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蛉艾!你這毒婦竟也來了钳踊?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤勿侯,失蹤者是張志新(化名)和其女友劉穎拓瞪,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體助琐,經...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡祭埂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了兵钮。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蛆橡。...
    茶點故事閱讀 38,747評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖掘譬,靈堂內的尸體忽然破棺而出泰演,到底是詐尸還是另有隱情,我是刑警寧澤葱轩,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布睦焕,位于F島的核電站,受9級特大地震影響靴拱,放射性物質發(fā)生泄漏垃喊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一袜炕、第九天 我趴在偏房一處隱蔽的房頂上張望本谜。 院中可真熱鬧,春花似錦妇蛀、人聲如沸耕突。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽眷茁。三九已至炕泳,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間上祈,已是汗流浹背培遵。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留登刺,地道東北人籽腕。 一個月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像纸俭,于是被迫代替她去往敵國和親皇耗。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內容