11組-Deep Residual Learning for Image Recognition

Deep Residual Learning for Image Recognition

1.背景

深度學(xué)習(xí)發(fā)展過程中最有名的一個(gè)問題就是反向傳播過程中梯度消失或爆炸的問題(往前回傳梯度越來越小箩祥,導(dǎo)致前層參數(shù)不更新)双戳。

但是目前也已經(jīng)通過標(biāo)準(zhǔn)化輸入(Normalized Initialization)以及中間層標(biāo)準(zhǔn)化(Batch Normalization)桶唐,采用隨機(jī)梯度下降解決了該問題赋元。

雖然解決了梯度消失或爆炸的問題,但是作者通過實(shí)驗(yàn)發(fā)現(xiàn)了新問題瘾婿,由經(jīng)驗(yàn)來說網(wǎng)絡(luò)越深瞄勾,特征表示應(yīng)該越好,學(xué)習(xí)效果應(yīng)該越好辛掠。通過20層和56層網(wǎng)絡(luò)的表現(xiàn)來看谢谦,網(wǎng)絡(luò)越深train和test反而都很差释牺,所以這個(gè)問題并不是由于過擬合而發(fā)生的退化

圖片取自論文原文

作者提出假設(shè):這個(gè)問題是一個(gè)優(yōu)化問題回挽,越深的模型越難優(yōu)化没咙,起碼56層模型應(yīng)該能和20層模型表現(xiàn)一樣好,只需要56層模型的前20層和20層模型的參數(shù)一樣千劈,后面的網(wǎng)絡(luò)層參數(shù)只執(zhí)行一個(gè)恒等映射把x映射為x的策略就可以表現(xiàn)和20層模型效果一樣好祭刚。

2.殘差學(xué)習(xí)

作者基于恒等映射的思路提出了殘差學(xué)習(xí)框架以解決退化問題。假設(shè)當(dāng)前層輸入為x墙牌,通過網(wǎng)絡(luò)層之后映射為H(x)涡驮,現(xiàn)在不直接學(xué)習(xí)映射為H(x)的權(quán)重,通過一個(gè)快捷連接把映射后的結(jié)果F(x)和輸入x相加做為輸出的H(x)喜滨,這樣學(xué)習(xí)的F(x)=H(x)-x捉捅,只需要學(xué)習(xí)一個(gè)殘差即可與直接學(xué)習(xí)H(x)的映射參數(shù)達(dá)到一樣的效果。只要F(x)趨近于0虽风,就構(gòu)成了一個(gè)映射H(x) = x. 把殘差推至0和把此映射逼近另一個(gè)非線性層相比要容易的多棒口。

圖片取自論文原文

作者在ImageNet數(shù)據(jù)集上做了很多實(shí)驗(yàn)來證實(shí)退化問題,并且基于殘差學(xué)習(xí)的框架辜膝,評(píng)估自己的方法无牵。發(fā)現(xiàn)很深的殘差網(wǎng)絡(luò)也是容易優(yōu)化的,而且可以享受深度增加帶來的精度增加厂抖,成功地解決了層數(shù)增加時(shí)的退化問題茎毁。

3.相關(guān)的工作

殘差表示(Residual?Representations):

在圖像識(shí)別任務(wù)中,VLAD是基于詞典的殘差向量進(jìn)行編碼忱辅,被證明比編碼原始向量效果更好七蜘。

在低級(jí)視覺和計(jì)算機(jī)圖形學(xué)中,求解偏微分方程(PDE)耕蝉,通常是使用多重網(wǎng)格(Multigrid)法崔梗,把系統(tǒng)重建成多尺度的子問題,每個(gè)子問題負(fù)責(zé)求解出粗糙與精細(xì)尺度之間的殘差垒在,除此之外蒜魄,另一種求解PDE的方法是基于表達(dá)兩個(gè)尺度之間殘差的向量進(jìn)行的。結(jié)果證明了這些用殘差的解法收斂速度都比不用殘差的普通解法要快的多场躯。

快捷連接(Shortcut Connections):

快捷連接相關(guān)的實(shí)驗(yàn)和理論由來已久谈为。。在多層感知器網(wǎng)絡(luò)的早期實(shí)踐中就有添加少量的連接層用于解決梯度消失/爆炸的問題踢关。

Highway networks也使用了帶有門函數(shù)(gating functions)的快捷連接伞鲫。但是這些門函數(shù)需要參數(shù),而ResNet的快捷連接不需要參數(shù)签舞。而且當(dāng)Highway networks的門函數(shù)的快捷連接關(guān)閉時(shí)秕脓,相當(dāng)于沒有了殘差函數(shù)柒瓣,但是ResNet的快捷連接一直不會(huì)關(guān)閉,殘差函數(shù)能不斷學(xué)習(xí)吠架,優(yōu)化芙贫,當(dāng)層數(shù)增加后ResNet的表現(xiàn)效果也很好。

4.兩種恒等映射

自身連接:當(dāng)輸入輸出維度一致時(shí)傍药,構(gòu)造塊可這樣定義:

簡書不能敲數(shù)學(xué)公式差評(píng)磺平,取自論文原文

投影連接:當(dāng)輸入輸出維度不一致時(shí),可以對輸入進(jìn)行一個(gè)線性投影來匹配維度拐辽,構(gòu)造塊可這樣定義:

5.網(wǎng)絡(luò)結(jié)構(gòu)

設(shè)計(jì)原則:

對于輸出feature map大小相同的層拣挪,有相同數(shù)量的filters;

進(jìn)行pooling操作后俱诸,filters數(shù)量翻倍菠劝;

維度匹配用實(shí)線表示,維度不匹配用虛線表示乙埃。維度不匹配時(shí)闸英,可用zero padding來增加維度;或者乘以投影矩陣介袜。

減少了FC全連接層,參數(shù)比VGG-Net少了很多出吹,計(jì)算復(fù)雜度也降低了很多遇伞。

實(shí)現(xiàn):

采用BN,大小為256的mini-batch進(jìn)行隨機(jī)梯度下降捶牢,學(xué)習(xí)率0.1鸠珠,并進(jìn)行范圍搜索,迭代了600000次秋麸,權(quán)重衰減指數(shù)為0.0001渐排,動(dòng)量系數(shù)為0.9,沒有使用dropout灸蟆。

左圖是標(biāo)準(zhǔn)的VGG19Net驯耻,中間是作者設(shè)計(jì)的plain-Net,右圖是作者改進(jìn)之后的residual-Net炒考,在此結(jié)構(gòu)上作者進(jìn)行的實(shí)驗(yàn)對比

6.更深的瓶頸結(jié)構(gòu)

使用與GoogleNet相似的瓶頸層來提升效率可缚。結(jié)合自己的理解舉個(gè)例子說明一下(有錯(cuò)誤的話請指正)。假如input為28*28*256斋枢,使用三層連接塊的話帘靡,先用64個(gè)1*1*256的filters進(jìn)行卷積降維,然后只用一個(gè)3*3的filter瓤帚,最后用256個(gè)1*1*64的filters進(jìn)行升維描姚。

兩種設(shè)計(jì)具有相似的時(shí)間復(fù)雜度涩赢,如果把自身連接換成投影連接,時(shí)間復(fù)雜度和模型尺寸都會(huì)翻倍轩勘,瓶頸設(shè)計(jì)可以為自身連接帶來更高的效率谒主。

左圖是二層結(jié)構(gòu),右圖是三層結(jié)構(gòu)赃阀,取自論文原文

7.想法

從AlexNet霎肯,VGGNet,GoogleNet榛斯,ResNet一些列進(jìn)步可以看出認(rèn)清問題并敢于嘗試可能的解決辦法才是進(jìn)步的源泉观游,這個(gè)領(lǐng)域的實(shí)驗(yàn)當(dāng)然離不開硬件設(shè)備的支持,否則都無法進(jìn)行實(shí)驗(yàn)驮俗。雖然目前沒有很好的理論來解釋深度學(xué)習(xí)懂缕,但是可以不斷通過實(shí)驗(yàn)結(jié)果來反饋算法細(xì)節(jié)的可行性,這個(gè)領(lǐng)域還有很大的空間去進(jìn)行創(chuàng)新王凑。

參考資料:

文章地址:《Deep Residual Learning for Image Recognition》?arXiv.1512.03385

CS231n的課程視頻關(guān)于Resnet的一節(jié)? ? ? https://www.bilibili.com/video/av17204303/index_20.html?t=3629

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末搪柑,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子索烹,更是在濱河造成了極大的恐慌工碾,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件百姓,死亡現(xiàn)場離奇詭異渊额,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)垒拢,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門旬迹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人求类,你說我怎么就攤上這事奔垦。” “怎么了尸疆?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵椿猎,是天一觀的道長。 經(jīng)常有香客問我仓技,道長鸵贬,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任脖捻,我火速辦了婚禮阔逼,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘地沮。我一直安慰自己嗜浮,他們只是感情好羡亩,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著危融,像睡著了一般畏铆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上吉殃,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天辞居,我揣著相機(jī)與錄音,去河邊找鬼蛋勺。 笑死瓦灶,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的抱完。 我是一名探鬼主播贼陶,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼巧娱!你這毒婦竟也來了碉怔?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬榮一對情侶失蹤禁添,失蹤者是張志新(化名)和其女友劉穎撮胧,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體上荡,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡趴樱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了酪捡。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡纳账,死狀恐怖逛薇,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情疏虫,我是刑警寧澤永罚,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站卧秘,受9級(jí)特大地震影響呢袱,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜翅敌,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一羞福、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蚯涮,春花似錦治专、人聲如沸卖陵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽泪蔫。三九已至,卻和暖如春喘批,著一層夾襖步出監(jiān)牢的瞬間撩荣,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來泰國打工饶深, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留餐曹,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓粥喜,卻偏偏與公主長得像凸主,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子额湘,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容