殘差網(wǎng)絡

Residual Network


原文:Deep Residual Learning for Image Recognition

博文參考:

代碼參考:https://github.com/tornadomeet/ResNet


簡介

深度卷積神經(jīng)網(wǎng)絡的出現(xiàn)使得圖像分類問題的研究突飛猛進,但隨之也出現(xiàn)了兩個問題:

  • 梯度消失鹃祖、爆炸問題纵隔;
  • 退化問題(degradation problem)佑淀。

前者瑞驱,通常在初始化時捐晶,對數(shù)據(jù)進行歸一化處理冯键,以及添加正則化層處理惹盼。而后者,實驗表明除了在淺層網(wǎng)絡模型的基礎(chǔ)上添加恒等映射(identity mapping)來構(gòu)建深度網(wǎng)絡模型之外惫确,作者還沒有找到其他的好的解決方案手报。


退化問題:隨著網(wǎng)絡層數(shù)的增加,模型準確度達到某一值后迅速降低改化,如下圖一所示:

上圖為不同深度的網(wǎng)絡模型在CIFAR-10數(shù)據(jù)集上的誤差變化曲線圖掩蛤。


因此,針對退化問題本文引入了深度殘差學習框架(deep residual learning framework)陈肛,讓stacked layers擬合殘差映射(residual mapping)揍鸟,而不是直接擬合the desired underlying mapping。

注:將the desired underlying mapping記為H(x)燥爷,現(xiàn)讓stacked nonlinear layers擬合殘差映射蜈亩,即:F(x):=H(x)-x,則原映射(即the desired underlying mapping)H(x)將改寫為:F(x)+x前翎。

對此稚配,作者假設(shè)殘差映射相較于原映射更易優(yōu)化。對于殘差塊港华,采用shortcut connection來實現(xiàn)道川,如下圖二所示:

其中,shortcut connection僅執(zhí)行恒等映射,且其輸出添加至stacked layers的輸出冒萄。恒等shortcut connection既不添加額外參數(shù)臊岸,也不增加計算的復雜度。

  • 統(tǒng)計學:殘差指預測值和觀測值間的差距尊流。
  • 網(wǎng)絡的一層視為y=H(x)帅戒。
  • 恒等映射:H(x):=x
  • 殘差映射:H(x):=F(x)+x崖技,其中F(x)為殘差函數(shù)逻住。x為輸入,F(x)為卷積分支的輸出迎献,H(x)為整個結(jié)構(gòu)的輸出瞎访。
  • 由于作者在文中已言明,目前還沒有其他解決方案用于退化問題吁恍。因此扒秸,為了優(yōu)化恒等映射(即通過stacked layer擬合很困難),作者提出殘差映射方法冀瓦。在原始的方法中伴奥,為了實現(xiàn)恒等映射,通過stacked layers來擬合H(x)咕幻。但在殘差映射中渔伯,只需令殘差函數(shù)F(x)為0即可實現(xiàn)。

深度殘差學習

殘差學習

在簡介部分已經(jīng)說明了肄程,原始的恒等映射需要多個非線性層來擬合锣吼,但在實際實現(xiàn)過程中很難實現(xiàn)。因此蓝厌,作者引入了殘差映射玄叠。理論上,只要恒等映射達到最佳時拓提,則可迫使多個非線性層的權(quán)重趨向于0即可實現(xiàn)恒等映射读恃。

雖然在實際情況中,恒等映射是不太可能為最佳的代态,但若存在最優(yōu)的函數(shù)接更近于恒等映射而不是接近于0寺惫,則網(wǎng)絡會更易發(fā)現(xiàn)擾動因素。實驗表明學習到的殘差函數(shù)響應值通常較小蹦疑,同時也表明了恒等映射提供了合理的預處理西雀,如下圖三所示。

上圖為在CIFAR-10數(shù)據(jù)集上各網(wǎng)絡的層響應值的標準差變化曲線圖歉摧。其中艇肴,響應值為每個大小為3*3層的BN之后非線性之前的輸出腔呜。上下兩幅圖其層的順序有所不同:前者為原始順序,后者為以響應值從大到小排列再悼。

以shortcut的恒等映射

在每個stacked layer都使用殘差學習核畴,其結(jié)構(gòu)如圖二所示,數(shù)學表達式為:

y=F(x,\{W_i\})+x

其中冲九,yx均為殘差塊所在層的輸入與輸出向量谤草,函數(shù)F(x, \{W_i\})為訓練殘差映射所學習到的。

以圖二的殘差塊為例娘侍,其殘差函數(shù)為F=W_2\sigma(W_1x)咖刃,其中\sigma表示ReLU激活函數(shù),出于簡化省略偏置項憾筏。對于F(x)+x運算,由一個shortcut connection和以element-wise方式累加實現(xiàn)的花鹅,其值為二階非線性氧腰。

對于y=F(x,\{W_i\})+x,要求xF維數(shù)相同刨肃。若出現(xiàn)維數(shù)不同的情況古拴,則在shortcut connection上添加一個線性投影W_s來匹配維度:

y=F(x,\{W_i\})+W_sx

注:殘差函數(shù)F同樣適用于卷積層,且形式靈活真友。

網(wǎng)絡結(jié)構(gòu)

Plain Network

卷積層的filter大多為3*3大小黄痪,且遵循兩個設(shè)計原則:

  • 對于相同大小的輸出特征圖,其層需含有相同數(shù)量的filter盔然;
  • 若特征圖的大小減半桅打,則filter的數(shù)量需翻倍,以保證每層的時間復雜度愈案。

在卷積層上以步長為2進行下采樣操作挺尾。在網(wǎng)絡末端以全局的均值池化層和1000個激活函數(shù)為softmax函數(shù)的全連接層結(jié)束。含權(quán)重的層總數(shù)為34層站绪。

ResNet

在plain network的基礎(chǔ)上添加shortcut connection遭铺,將網(wǎng)絡變?yōu)镽esNet。當維度增加時恢准,可考慮如下兩個方法:

  • 使用0來填補增加的維數(shù)魂挂,且此方法不會引入額外參數(shù);
  • 在shortcut connection上添加一個線性投影W_s來匹配維數(shù)(通過卷積核大小為1*1的卷積實現(xiàn))馁筐。

對于以上兩種方法涂召,其步長均為2。


注:

對于添加線性投影眯漩,實際上有兩種情況:

  • 只對維數(shù)增加的數(shù)據(jù)進行處理芹扭;
  • 對所有數(shù)據(jù)進行處理麻顶。

后續(xù)實驗表明,后者比前者效果好舱卡,但引入了額外參數(shù)辅肾,且線性投影與退化問題無關(guān)。因此轮锥,為了降低內(nèi)存的使用矫钓、時間復雜度以及模型大小,作者采用前者進行處理舍杜。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末新娜,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子既绩,更是在濱河造成了極大的恐慌概龄,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件饲握,死亡現(xiàn)場離奇詭異私杜,居然都是意外死亡,警方通過查閱死者的電腦和手機救欧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進店門衰粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人笆怠,你說我怎么就攤上這事铝耻。” “怎么了蹬刷?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵瓢捉,是天一觀的道長。 經(jīng)常有香客問我箍铭,道長泊柬,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任诈火,我火速辦了婚禮兽赁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘冷守。我一直安慰自己刀崖,他們只是感情好,可當我...
    茶點故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布拍摇。 她就那樣靜靜地躺著亮钦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪充活。 梳的紋絲不亂的頭發(fā)上蜂莉,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天蜡娶,我揣著相機與錄音,去河邊找鬼映穗。 笑死窖张,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的蚁滋。 我是一名探鬼主播宿接,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼辕录!你這毒婦竟也來了睦霎?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤走诞,失蹤者是張志新(化名)和其女友劉穎副女,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蚣旱,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡肮塞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了姻锁。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡猜欺,死狀恐怖位隶,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情开皿,我是刑警寧澤涧黄,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站赋荆,受9級特大地震影響笋妥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜窄潭,卻給世界環(huán)境...
    茶點故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一春宣、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧嫉你,春花似錦月帝、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至距误,卻和暖如春簸搞,著一層夾襖步出監(jiān)牢的瞬間扁位,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工趁俊, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留域仇,地道東北人。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓则酝,卻偏偏與公主長得像殉簸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子沽讹,可洞房花燭夜當晚...
    茶點故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容