ResNet的發(fā)展歷程的總結(jié)和一點思考

這里不再講特別多的基礎(chǔ)知識,也基本不會放圖片翻斟,其實抑片,到了2019年并且做深度學(xué)習(xí)的人,真的有誰不知道或者沒看過ResNet的文章杨赤、或者博文嗎敞斋。

ResNet剛剛提出來的時候,想法就是很簡單疾牲,就是H(x)=F(x)+x植捎,原因也很直白,層數(shù)太多會有degradation的情況阳柔,那么不如把前邊的給它直接懟過去焰枢?作者一開始說了那么多話,也掩飾不住這個連接是拍腦袋搞出來的舌剂,或者說是最簡單的試試就work了济锄,所以開始的比較也并沒有比如為參數(shù)是1不是0.5之類的問題(這些都在v2中給了實驗)。而另一個比較神奇的地方就是bottleneck霍转,作者敢在16年就這么大規(guī)模的用荐绝,確實很有勇氣。后來的注解也說明了避消,普通的building\:block也是OK的低滩,這么用就是為了省點參數(shù),梯度的問題也完全沒有被1\times1\:conv所解決岩喷,而這樣的結(jié)構(gòu)就如此廣泛地被所有后續(xù)paper所接受恕沫,感覺還是有一些改進(jìn)的空間。

不得不說纱意,ResNet這篇paper寫的是真的好婶溯,娓娓道來,實驗充分偷霉,圖表充足迄委,這樣的paper不得best還有誰能得呢?

后續(xù)給出了ResNet-v2腾它,這個paper作者確實是用力了跑筝,把之前沒討論的形式基本都討論了一遍,比如為啥+x這一部分的系數(shù)是1而不是0.5:

L層可以被表示為:
x_L=x_l+\sum^{L-1}_{i=l}F(x_i,W_i)
那么Loss對第l層的偏導(dǎo)就是:
\frac{\partial Loss}{\partial x_l}=\frac{\partial Loss}{\partial x_L}\:\frac{\partial x_L}{\partial x_l}=\frac{\partial Loss}{\partial x_L}(1+\frac{\partial}{\partial x_l} \sum^{L-1}_{i=l} F(x_i,W_i))
因此瞒滴,如果第i+x_i項有個系數(shù)\lambda_i曲梗,第L層就會被表示為:
x_L=(\prod_{i=l}^{L-1}\lambda_i)x_i+\sum^{L-1}_{i=l}\hat{F}(x_i,W_i)\hat{F}代表省略后續(xù)累加項的常數(shù)參數(shù))
則第l層對Loss的偏導(dǎo)就變成了:
\frac{\partial Loss}{\partial x_l}=\frac{\partial Loss}{\partial x_L}((\prod_{i=l}^{L-1}\lambda_i)+\frac{\partial}{\partial x_l}(\hat{F}(x_i,W_i))
所以你看,前邊的系數(shù)就參與了BP妓忍,大了吧梯度爆炸虏两,小了吧梯度消失。

還有很多實驗分析這里不一一介紹世剖,但是結(jié)論還是要知道的:
(1)直接累加就挺好
(2)當(dāng)H(x)項的順序是BN \rightarrow relu \rightarrow conv \rightarrow BN \rightarrow relu \rightarrow conv時是最好的定罢。

然后一個有意思但是至今一個意見不太統(tǒng)一的地方就是,shortcut的時候究竟要不要一個1\times1\:conv旁瘫。v1說要祖凫,v2說不要琼蚯,不過很多后續(xù)paper或者工程其實還是要了的,不過作者也說了惠况,層數(shù)少可以搞一個遭庶,層數(shù)多了就算了,這也是蠻神奇的地方稠屠,我覺得思路可能和ResNet本身要解決的問題倒有一點相似峦睡,層數(shù)變多、結(jié)構(gòu)復(fù)雜未必好权埠,或者說榨了,未必好訓(xùn)。一般來講攘蔽,ResNet-50差不多可以用龙屉,我明天試試。之所以單獨提50秩彤,就是因為這基本上是個工業(yè)界非常喜歡的結(jié)構(gòu)叔扼,用的非常非常多。

然后時過境遷漫雷,就到了ResNeXt瓜富,這個工作作者說直接motivation是Inception,恩降盹,看起來也很沒有創(chuàng)意的樣子与柑。作者吭哧吭哧畫了3個圖,然后就說蓄坏,我們使用group\:conv的版本實現(xiàn)了下价捧,它們其實差不多等價!我去涡戳,這也太不嚴(yán)謹(jǐn)了吧结蟋,好歹在cifar上驗證下也行啊。打算閑下來了也同樣做個實驗渔彰。這里有個需要注意的就是嵌屎,參數(shù)量差不多的時候ResNeXt的(輸入)channel可以更多一點(畢竟每個conv的數(shù)量減少了嘛),這樣就可以把模型搞得寬恍涂,效果也好一點宝惰。

然后就很有意思了,既然有了group\:conv再沧,那為啥不把它搞到group=channel呢尼夺,于是就將其命名為deepwise\:conv,(注:這里我沒有完全按照時間線來分析,只是這個思路確實比較好懂淤堵,有利于大腦理解)寝衫,也就有了mobile net。

然后就向2條不同的路延伸了粘勒,一條在優(yōu)化mobile\:net的路上一路向前竞端,有了v2,v3庙睡,shuffle net,順便說下v2技俐,它的改進(jìn)好像只有2個乘陪,1.relu\rightarrow relu6,2.最后一個1\times 1\:conv換了個identity()作為激活雕擂,這不就是把原來ResNet的bottleneck抄了過來嘛(當(dāng)然維度變化情況是不一樣的)啡邑;是另一條在“如何創(chuàng)建更好的shortcut”上一路向前,有了densenet井赌,甚至還有了“是不是shortcut點別的東西也會有奇效”的路谤逼,比如residual-attention net,senet仇穗,cbam流部。其實最后者一般被稱為attention,不過圖像attention這個東西吧纹坐,本來就不算特別讓人信服枝冀,它的實現(xiàn)機制簡直就是一個并聯(lián)的conv。要是說senet真的讀取了channel attention的信息耘子,那么它根本不應(yīng)該gap之后去做fc果漾,畢竟fc也實現(xiàn)了每個channel信息的交互啊谷誓!作者要么應(yīng)該gap后之間連绒障,要么用deepwise\:conv去做一點處理,總的來說捍歪,不應(yīng)該有信息的交互户辱。這也是一個我打算嘗試下的點。倒不是說這幾個點有什么用费封,只是為了解疑答惑焕妙,讓自己信服。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末弓摘,一起剝皮案震驚了整個濱河市焚鹊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖末患,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件研叫,死亡現(xiàn)場離奇詭異,居然都是意外死亡璧针,警方通過查閱死者的電腦和手機嚷炉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來探橱,“玉大人申屹,你說我怎么就攤上這事∷砀啵” “怎么了哗讥?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長胞枕。 經(jīng)常有香客問我杆煞,道長,這世上最難降的妖魔是什么腐泻? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任决乎,我火速辦了婚禮,結(jié)果婚禮上派桩,老公的妹妹穿的比我還像新娘构诚。我一直安慰自己,他們只是感情好窄坦,可當(dāng)我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布唤反。 她就那樣靜靜地躺著,像睡著了一般鸭津。 火紅的嫁衣襯著肌膚如雪彤侍。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天逆趋,我揣著相機與錄音盏阶,去河邊找鬼。 笑死闻书,一個胖子當(dāng)著我的面吹牛名斟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播魄眉,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼砰盐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了坑律?” 一聲冷哼從身側(cè)響起岩梳,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后冀值,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體也物,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年列疗,在試婚紗的時候發(fā)現(xiàn)自己被綠了滑蚯。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡抵栈,死狀恐怖告材,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情古劲,我是刑警寧澤创葡,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站绢慢,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏洛波。R本人自食惡果不足惜胰舆,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蹬挤。 院中可真熱鬧缚窿,春花似錦、人聲如沸焰扳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽吨悍。三九已至扫茅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間育瓜,已是汗流浹背葫隙。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留躏仇,地道東北人恋脚。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像焰手,于是被迫代替她去往敵國和親糟描。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容