深度學(xué)習(xí)中的過擬合和欠擬合問題( overfitting and underfitting)

Overfitting and underfitting in deep learning

在深度學(xué)習(xí)中,訓(xùn)練的過程中大家會(huì)經(jīng)常遇到 Overfitting and underfitting這兩種情況.
大家還記得去年NIPS上的大牛Ali Rahimi(阿里·拉希米)炮轟:機(jī)器學(xué)習(xí)已經(jīng)成了煉金術(shù)!


煉金術(shù)挺好的滥沫,煉金術(shù)沒毛病,它自有它的地位魂拦,煉金術(shù)“管用”缩宜。

除了深度學(xué)習(xí)中各種參數(shù)的不確定性,還有Overfitting and underfitting,無疑人一些人覺得,高大上的深度學(xué)習(xí)背后的理論支撐實(shí)在是太少了.
煉金術(shù)帶來了冶金祭往、紡織、現(xiàn)代玻璃制造工藝函似、醫(yī)療等等領(lǐng)域的發(fā)明, 但是無論怎樣,它能在實(shí)際中解決問題...

01.

有關(guān)過擬合和欠擬合,我們?cè)跈C(jī)器學(xué)習(xí)入門的章節(jié)早就學(xué)過,大家看看下面的圖片,應(yīng)該很明白.

過擬合和欠擬合問題.

但是,在深度學(xué)習(xí)的具體訓(xùn)練中 overfitting and underfitting的情景是如何表現(xiàn)出來的? 有何哪些因素有關(guān)?

我們就拿MNIST手寫數(shù)字識(shí)別為例吧(貌似這個(gè)已經(jīng)成了經(jīng)典了).
MNIST有60,000個(gè)用于訓(xùn)練的28*28的灰度手寫數(shù)字圖片(0-9一共10個(gè)數(shù)字)弯屈,10,000個(gè)測試圖片,是我們初學(xué)時(shí)最常用例子. 具體可以參照我以前的那篇文章keras 數(shù)據(jù)集學(xué)習(xí)筆記.

我們先構(gòu)建一個(gè)模型(original model):

# original model
from keras import models
from keras import layers
model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

這個(gè)模型很簡單3層, 前2層都是16的全連接層.
在這個(gè)模型基礎(chǔ)上,我們?cè)谠O(shè)計(jì)一個(gè)更加簡化的模型(Smaller model): 把前2層變成4.

# Smaller model
model = models.Sequential()
model.add(layers.Dense(4, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(4, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

我們跑一下訓(xùn)練比較一下這兩個(gè)模型的validation loss:


a lower validation loss signals a better model

你可以看到,小的模型開始收斂的較快,在4epoch后,收斂比原始的模型變慢,最后開始進(jìn)入 overfitting 狀態(tài).
我們?cè)僦v一個(gè)大的模型:(Bigger model)前2層變成512.

# Bigger model
model = models.Sequential()
model.add(layers.Dense(512, activation='relu', input_shape=(10000,)))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

我們比較一下結(jié)果:

Effect of model capacity on validation loss: trying a bigger model

更大的模型差不多一開始就開始o(jì)verfitting,后面就像是噪音一樣不規(guī)則的跳動(dòng).
那么我們?cè)倏匆幌铝硗庖豁?xiàng)參數(shù)(trainning loss):


Effect of model capacity on training loss: trying a bigger model

正如我們看到的,大的模型trainning loss很快接近0,但是隨后也會(huì)有些波動(dòng),會(huì)逐漸增大,這一點(diǎn)和 validation loss的結(jié)果不同.

我們看到了模型的大小直接關(guān)系到訓(xùn)練的結(jié)果.但是沒有公式可以套用,具體采用什么模型,還需要經(jīng)驗(yàn)和在應(yīng)用中的調(diào)整.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市献汗,隨后出現(xiàn)的幾起案子敢订,更是在濱河造成了極大的恐慌王污,老刑警劉巖罢吃,帶你破解...
    沈念sama閱讀 211,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異昭齐,居然都是意外死亡尿招,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門阱驾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來就谜,“玉大人,你說我怎么就攤上這事里覆∩ゼ觯” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵喧枷,是天一觀的道長虹统。 經(jīng)常有香客問我,道長隧甚,這世上最難降的妖魔是什么车荔? 我笑而不...
    開封第一講書人閱讀 56,509評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮戚扳,結(jié)果婚禮上忧便,老公的妹妹穿的比我還像新娘。我一直安慰自己帽借,他們只是感情好珠增,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評(píng)論 6 386
  • 文/花漫 我一把揭開白布超歌。 她就那樣靜靜地躺著,像睡著了一般切平。 火紅的嫁衣襯著肌膚如雪握础。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,837評(píng)論 1 290
  • 那天悴品,我揣著相機(jī)與錄音禀综,去河邊找鬼。 笑死苔严,一個(gè)胖子當(dāng)著我的面吹牛定枷,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播届氢,決...
    沈念sama閱讀 38,987評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼欠窒,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了退子?” 一聲冷哼從身側(cè)響起岖妄,我...
    開封第一講書人閱讀 37,730評(píng)論 0 267
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寂祥,沒想到半個(gè)月后荐虐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,194評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡丸凭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評(píng)論 2 327
  • 正文 我和宋清朗相戀三年福扬,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片惜犀。...
    茶點(diǎn)故事閱讀 38,664評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡铛碑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出虽界,到底是詐尸還是另有隱情汽烦,我是刑警寧澤,帶...
    沈念sama閱讀 34,334評(píng)論 4 330
  • 正文 年R本政府宣布莉御,位于F島的核電站撇吞,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏颈将。R本人自食惡果不足惜梢夯,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望晴圾。 院中可真熱鬧颂砸,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至色罚,卻和暖如春碰缔,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背戳护。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評(píng)論 1 266
  • 我被黑心中介騙來泰國打工金抡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人腌且。 一個(gè)月前我還...
    沈念sama閱讀 46,389評(píng)論 2 360
  • 正文 我出身青樓梗肝,卻偏偏與公主長得像,于是被迫代替她去往敵國和親铺董。 傳聞我的和親對(duì)象是個(gè)殘疾皇子巫击,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容