論文---模糊濾波器的抗鋸齒版最大池化保持平移不變性讓CNN有了平移不變性,同時提升ImageNet成績

論文在此:
2019 ICML Making Convolutional Networks Shift-Invariant Again
項目主頁:
https://richzhang.github.io/antialiased-cnns/
開源代碼:
https://github.com/adobe/antialiased-cnns#1-quickstart-load-an-antialiased-model


image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png

古往今來淑际,大家都知道:只要圖像一平移,CNN就認(rèn)不出來了淡溯。

原因就在降采樣身上米间。不管是最大池化屈糊,跨步卷積,還是平均池化昧诱,都對平移太敏感:

比如,0、0稚配、1、1愤惰、0扇单、0施流、1、1……這樣的周期银受,最大池化是這樣:

image

但如果平移一格,最大池化完全變了一個樣子:

image

雖然,有著名的抗鋸齒(Anti-Aliasing蓝厌,AA) 方法,致力解決這個問題崎苗。但把這種模塊直接插進(jìn)網(wǎng)絡(luò),會嚴(yán)重影響模型的表現(xiàn)。

現(xiàn)在判莉,來自Adobe的Richard Zhang (簡稱“理查”) ,讓抗鋸齒和各種降采樣和平共處了锰镀。

在保留平移不變性的情況下,還能提升ImageNet上的分類準(zhǔn)確率。VGG古拴、ResNet、DenseNet……各種架構(gòu)都適用。

不止如此油额, 面對其他干擾更穩(wěn)定了崇众,如旋轉(zhuǎn)如縮放;面對輸入圖像的損壞芹扭,還更魯棒了队萤。

研究登上了ICML 2019,代碼已經(jīng)開源,還有演講可以看。Reddit熱度已經(jīng)超過了250互拾,觀眾紛紛表達(dá)了謝意:

論文很厲害,演講也很好。

怎樣和解的箍铭?

想知道怎樣幫助CNN保留平移不變形,就要了解平移不變性是怎樣打破的。

理查觀察了VGG的第一個卷積層,發(fā)現(xiàn)它對平移毫無波瀾授翻,并不是在這里打破的翎蹈。

但再觀察第一個池化層,對平移有了反應(yīng):平移偶數(shù)個像素,表征還不改變低剔,平移奇數(shù)個像素猜欺,表征就完全變了。

向網(wǎng)絡(luò)深處走,經(jīng)過的池化層越多挽鞠,問題就越嚴(yán)重均抽。

image

抗鋸齒

想解決這個問題,就要把抗鋸齒降采樣友好地結(jié)合到一起。

于是,理查又仔細(xì)查看了降采樣過程沽讹,把它 (按順序) 分成了兩個部分:

一是取最大值盲链,用密集的方式排拷。

二是在中間特征圖 (Intermediate Feature Map) 上做子采樣 (Sub-Sampling) 。

第一步?jīng)]有問題,完全不會出現(xiàn)鋸齒。

第二步就要改了吧雹。理查給中間特征圖丁鹉,加了個模糊濾波器(Blur Filter) 來抗鋸齒,然后再做子采樣:

image

(2)為濾波器

那么记靡,“抗鋸齒版最大池化”效果怎么樣?

平移不變性與準(zhǔn)確率兼得

理查用ImageNet分類任務(wù)測試了一下進(jìn)化后的VGG,原以為會損失一些準(zhǔn)確率兵罢,結(jié)果:

image

右為抗鋸齒

image

空心為抗鋸齒

在解鎖平移不變性的同時裆赵,準(zhǔn)確率還提升了。

如果降采樣方法不是最大池化,又怎么樣呢?

所以,理查還測試了ResNetMobileNetv2,它們用的是跨步卷積血当;以及DenseNet离熏,它用的是平均池化:

image

空心為抗鋸齒

這些架構(gòu)也獲得了類似的提升奸鸯。全面成功。

上面只講了分類這一項任務(wù)申窘。而進(jìn)化后的降采樣,在圖到圖翻譯任務(wù)上也同樣有效。

不懼各種變換,以及圖像損壞

不只是平移,像旋轉(zhuǎn)侥锦、縮放這樣的干擾番挺,都可以應(yīng)對自如懂扼;另外瑰妄,面對輸入圖像損壞(Image Corruption) 竹宋,也變得更加魯棒了莫矗。

ImageNet-P數(shù)據(jù)集里,有受到各類干擾的圖像;而ImageNet-C數(shù)據(jù)集里,包含了系統(tǒng)性損壞的圖像。

image

mCE=Mean Corruption Rate, mFR=Mean Flip Rate

左邊一欄 (除了Baseline) 之外区转,是不同的濾波器,從上到下依次變強柿扣。mCEmFR析桥,都是越小越好。

數(shù)據(jù)顯示,各種濾波器都能有效增強旦事,應(yīng)對干擾的穩(wěn)定性卖鲤,和應(yīng)對圖像損壞的魯棒性。其中,最強的過濾器Bin-5表現(xiàn)最佳。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末震肮,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件啦租,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門喉悴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來勺像,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵隔缀,是天一觀的道長须妻。 經(jīng)常有香客問我渊鞋,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任爹袁,我火速辦了婚禮根时,結(jié)果婚禮上替裆,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瞧壮。 梳的紋絲不亂的頭發(fā)上秦忿,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的床蜘。 我是一名探鬼主播丹擎,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤欣舵,失蹤者是張志新(化名)和其女友劉穎糟把,沒想到半個月后缠犀,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體滔迈,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡仁热,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年秽褒,在試婚紗的時候發(fā)現(xiàn)自己被綠了蚂踊。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涝动。...
    茶點故事閱讀 38,789評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡提前,死狀恐怖拓哺,靈堂內(nèi)的尸體忽然破棺而出烤礁,到底是詐尸還是另有隱情鲤脏,我是刑警寧澤硫嘶,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布煌茬,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏竭鞍。R本人自食惡果不足惜晒夹,卻給世界環(huán)境...
    茶點故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一舔亭、第九天 我趴在偏房一處隱蔽的房頂上張望矛洞。 院中可真熱鬧抽兆,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽糟趾。三九已至交汤,卻和暖如春戒洼,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工祥山, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓脚草,卻偏偏與公主長得像倔撞,于是被迫代替她去往敵國和親躏啰。 傳聞我的和親對象是個殘疾皇子蔓同,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,697評論 2 351

推薦閱讀更多精彩內(nèi)容