【paper】Deep Residual Learning for Image Recognition

這篇論文是2016cvpr最佳論文,該論文提出了一種殘差網(wǎng)絡的模型鹏溯,很大程度上解決了深度網(wǎng)絡難以學習的問題罢维。作者使用152的殘差網(wǎng)絡在2015 ImageNet 分類和檢測的比賽中均獲得第一名。


退化問題

隨著網(wǎng)絡深度加深丙挽,網(wǎng)絡的訓練準確率卻不斷下降肺孵,這個問題不是由過擬合引起的。


這種現(xiàn)象是不合理的颜阐。

假設我們有淺層網(wǎng)絡Net1平窘,深層網(wǎng)絡Net2,我們讓Net1完全替代Net2的前半部分網(wǎng)絡凳怨,Net2的后半部分網(wǎng)絡我們做恒等映射瑰艘。那么Net2的訓練準確率應比Net1高(至少不比Net1低)。但實際訓練情況并非如此肤舞。

這說明紫新,并不是所有的網(wǎng)絡都易于優(yōu)化。

殘差學習

作者提出了下面的網(wǎng)絡模型


網(wǎng)絡的期望輸出是H(x)李剖,我們讓F(x) + x去擬合H(x)芒率,即 H(x) := F(x) + x。
F(x) := H(x) - x
假設恒等映射是最優(yōu)解杖爽,那么敲董,訓練殘差函數(shù)F(x)等于零要比在一個多層非線性網(wǎng)絡上訓練恒等映射要容易紫皇。

解決x與F(x)維度不等的問題

作者給出兩種解決方案

  1. identity mapping
    通過給低維的x加0來增加維度,這種方式不會增加多余的參數(shù)腋寨;(parameter-free)

  2. projection shortcut
    給x乘以一個投影矩陣:

實驗表明:identity mapping is sufficient for addressing the degradation problem and is economical, and thus Ws is only used when matching dimensions.

網(wǎng)絡結構

左邊是VGG-19網(wǎng)絡聪铺,中間是沒有shortcut-connection的平凡網(wǎng)絡(plain net),右邊是34層的殘差網(wǎng)絡(ResNet-34)萄窜。
作者說ResNet-34 與VGG相比有更少的卷積核和更低的復雜度铃剔,與VGG-19相比參數(shù)減少18%。那當然了查刻,人VGG-19有兩個4096的全連接層键兜,你雖然深,但都是卷積核啊穗泵。

實驗-ImageNet Classification

一些基本設置

  1. 數(shù)據(jù)增強
  2. adopt batch normalization right after each convolution and before activation
  3. use SGD with a mini-batch size of 256
  4. the learning reate starts from 0.1 and is divided by 10 when the error plateaus
  5. the models are trained for up to 60*10^4 iterations
  6. use a weight decay of 0.0001 and a momentum of 0.9
  7. do not use dropout

Residual Networks 實驗一:Plain Net vs. ResNet


18-layer和34-layer 殘差網(wǎng)絡普气,基本結構與plain net類似,應用identity mapping 實現(xiàn) shortcuts佃延,因此相比plain net沒有增加參數(shù)现诀。

由Figure4的結果可知:

  1. ResNet很好的解決了退化問題,并且隨著深度加深履肃,準確率增高仔沿;
  2. 與Plain Net相比,ResNet-34 error減小了3.5%尺棋,這說明殘差學習在極深度網(wǎng)絡中的有效性封锉;
  3. 與Plain Net相比,RestNet能夠更快的收斂膘螟。

Residual Networks 實驗二:Identity mapping vs. Projection Shortcuts

A:需要升維的shortcuts使用zero-padding方式成福,其他的shortcuts使用identity mapping方式,沒有參數(shù)增加萍鲸;
B:需要升維的shortcuts使用projection闷叉,其他shortcuts使用identity mapping擦俐;
C:所有的shortcuts都使用projection脊阴。

Small differences among A/B/C indicate that projection shortcuts are not essential for addressing the degradation problem.

Residual Networks 實驗三:Deeper BottleNeck Architectures


這個就是設計的152層的網(wǎng)絡,top-1的錯誤率19.38%蚯瞧,top-5錯誤率4.49%嘿期,據(jù)說已經超過了人眼的識別水平。

實驗-CIFAR-10 and Analysis

然后作者又設計了一個1000多層的網(wǎng)絡并在CIFAR-10數(shù)據(jù)集上進行訓練埋合,誤差率比千層網(wǎng)絡高了一點备徐,作者猜測是數(shù)據(jù)集太小過擬合了。想想也是甚颂,拿大炮打蚊子效果肯定不好蜜猾。作者的原話是“We argure that this is because of overfitting. The 1202-layer network may be unnecessarily large(19.4M) for this small dataset.”


然后作者又做了個分析秀菱,輸出了一下每層卷基層的輸出的標準差,見下圖蹭睡。



層數(shù)越深衍菱,標準差越小。這似乎說明了什么肩豁,作者的結論是:These results support our basic motivation that the residual functions might be generally closer to zero than the non-residual functions.
說實話脊串,我沒怎么理解,因為你拿到的是標準差不是均值清钥,標準差小只說明輸出的數(shù)據(jù)比較聚合而已琼锋,怎么能說說明趨近于0呢?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末祟昭,一起剝皮案震驚了整個濱河市缕坎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌篡悟,老刑警劉巖念赶,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異恰力,居然都是意外死亡叉谜,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進店門踩萎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來停局,“玉大人,你說我怎么就攤上這事香府《裕” “怎么了?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵企孩,是天一觀的道長锭碳。 經常有香客問我,道長勿璃,這世上最難降的妖魔是什么擒抛? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮补疑,結果婚禮上歧沪,老公的妹妹穿的比我還像新娘。我一直安慰自己莲组,他們只是感情好诊胞,可當我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著锹杈,像睡著了一般撵孤。 火紅的嫁衣襯著肌膚如雪迈着。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天邪码,我揣著相機與錄音寥假,去河邊找鬼。 笑死霞扬,一個胖子當著我的面吹牛糕韧,可吹牛的內容都是我干的。 我是一名探鬼主播喻圃,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼萤彩,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了斧拍?” 一聲冷哼從身側響起雀扶,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎肆汹,沒想到半個月后愚墓,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡昂勉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年浪册,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片岗照。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡村象,死狀恐怖,靈堂內的尸體忽然破棺而出攒至,到底是詐尸還是另有隱情厚者,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布迫吐,位于F島的核電站库菲,受9級特大地震影響,放射性物質發(fā)生泄漏志膀。R本人自食惡果不足惜熙宇,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望梧却。 院中可真熱鬧奇颠,春花似錦败去、人聲如沸放航。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽广鳍。三九已至荆几,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間赊时,已是汗流浹背吨铸。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留祖秒,地道東北人诞吱。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像竭缝,于是被迫代替她去往敵國和親房维。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內容