[譯]Rethinking Atrous Convolution for Semantic Image Segmentation

Abstract

在本文中震肮,我們重溫一下Atrous Convolution的妙用,Atrous Convolution能在調(diào)整濾波器的感受野的的同時,解決DCNNs造成的分辨率降低的問題。同時蹦玫,為了解決圖像語義分割的多尺度問題,設(shè)計了很多模型刘绣,包括并行或者串行的使用不同的rate的Atrous Convolution樱溉。更進(jìn)一步的提出了ASPP。接下來會詳細(xì)的說明實現(xiàn)的具體的細(xì)節(jié)和訓(xùn)練過程纬凤,我們的Deeplabv3在沒有Dense crf的后期處理的條件下取得了非常不錯的成績福贞,達(dá)到了state-of-art

1. Introduction

對使用DCNNs進(jìn)行圖片語義分割的任務(wù)來說停士,我們認(rèn)為主要有兩大挑戰(zhàn)肚医,第一是由DCNNs中的下采樣(如pooling,convolution stride等)造成的特征圖分辨率降低绢馍,這種局部的不變性會對密集的預(yù)測任務(wù)造成干擾向瓷,因為丟失了很多空間信息肠套。為了解決這一問題,提出了Atrous Convolution猖任,也稱為Dilated convolution你稚,被證明對圖片語義分割的任務(wù)很有效。通過使用Atrous Convolution朱躺,允許我們使用在ImageNet 上預(yù)訓(xùn)練好的模型來提取更加密集的特征圖刁赖,也就是空間分辨率更高的特征圖。

`Atrous Convolution`示意圖

第二個則是物體存在的多尺度問題长搀,主要有4種策略來解決這個問題宇弛。

如上圖所示,第一種辦法是對不同的sacleimage進(jìn)行并行的處理源请,再融合在一起枪芒。第二辦法是使用編碼和解碼的對稱結(jié)構(gòu),利用來自編碼器部分的多尺度特征并從解碼器部分恢復(fù)空間分辨率谁尸。第三種辦法是在原始的網(wǎng)絡(luò)上級聯(lián)一些模塊舅踪,用以捕獲更多的信息。第四則是大名鼎鼎的SPP的使用了良蛮。

在級聯(lián)模塊和SPP的框架下抽碌,我們使用Atrous Convolution來增大濾波器的感受野去融合多尺度的語境信息。特別的是决瞳,我們提出的網(wǎng)絡(luò)由不同rate的Atrous Convolution货徙,BN層等組成。我們在并聯(lián)或者串聯(lián)的模塊上做實驗皮胡,發(fā)現(xiàn)一個重要的實際問題痴颊,就是當(dāng)使用3×3的卷積核(Atrous Convolution的rate很大)時,由于圖片邊界的影響并不能捕獲遠(yuǎn)程信息胸囱,有效簡單地退化為1×1卷積祷舀,并提出將圖像級特征納入ASPP模塊。此外烹笔,我們詳細(xì)介紹實施細(xì)節(jié)裳扯,分享訓(xùn)練模型的經(jīng)驗,包括一個簡單而有效的引導(dǎo)方法谤职,用于處理稀有和精細(xì)注釋的對象饰豺。最后再提出模型Deeplabv3,在PASCAL VOC 2012的test set上的mIOU取得了85.7%的成績(沒有Dense crf的后期處理的條件下)允蜈。

2. Related Work

Image pyramid
Encoder-decoder
Context module
Spatial pyramid pooling
具體的請看原paper

3. Methods

在本節(jié)中冤吨,我們將回顧如何應(yīng)用Atrous Convolution來提取密集特征圖用于語義分割蒿柳。然后,我們討論使用級聯(lián)或并聯(lián)的Atrous Convolution模塊漩蟆。

3.1. Atrous Convolution for Dense Feature Extraction

前面還一堆已經(jīng)講過的垒探,就不贅述了。如下怠李,一個二維的信號的Atrous Convolution的輸出表達(dá)式

i是輸出y中的位置圾叼,w是濾波器,x是輸入捺癞,r是`Atrous Convolution`的rate

rate的具體含義可見上面的Atrous Convolution示意圖夷蚊。

再提出一個概念output_stride,個人認(rèn)為可以簡要的理解為輸出的特征圖是輸入的多少分之一。如output_stride=32時髓介,輸入即為輸出的32倍惕鼓,而這也是一般的image classification任務(wù)常用的倍率(在全連接層或者全局最大/平均池化層之前的輸出)。因此為了得到密集的特征圖就應(yīng)該減小output_stride唐础,我們把下采樣的Convolution全部換成了Atrous Convolution(rate=2),可參考這里箱歧。

3.2. Going Deeper with Atrous Convolution


如上圖,在級聯(lián)模型中(類似于原始的ResNet)彻犁,每個Block都是幾個卷積層的疊加叫胁,使用了Atrous Convolution比沒有的 能夠獲取更密集的特征圖,這正是其優(yōu)勢所在之處汞幢。

3.2.1 Multigrid


這個比較有意思了驼鹅,final atrous rate = Multi Grid * corresponding rate.(每個Block有三個卷積層)

3.3. Atrous Spatial Pyramid Pooling(ASPP)

這是deeplab中關(guān)于ASPP的描述,如下圖


ASPP能捕獲到多尺度的信息森篷,但是隨著rate的增大输钩,出現(xiàn)了如下圖的情況:


就是說,當(dāng)atrous rate在極限的情況下(等于特征圖的大兄僦恰)买乃,3×3的卷積退化成為了1×1的卷積(只有一個權(quán)重(中心)是有效的)

為了解決這個問題,并且將全局的上下文信息合并到模型中钓辆,在模型最后得到的特征圖中采用全局平均池化剪验,再給256個1×1的卷積(BN),然后雙線性地將特征圖 上采樣 到所需的空間維度前联。最后功戚,改善的ASPP由一個1×1的卷積,三個3×3的卷積似嗤,且rate=(6,12,18)當(dāng)output_stride=16時啸臀,如下圖所示:


當(dāng)output_stride=8時,rate=2×(6,12,18).并行處理后的特征圖在集中通過256個1×1卷積(BN),最后就是輸出了烁落,依舊是1×1卷積乘粒。

4. Experimental Evaluation

VOC 2012 dataset

4.1. Training Protocol

分別介紹了:
Learning rate policy
Crop size
Batch normalization
Upsampling logits
Data augmentation

4.2. Going Deeper with Atrous Convolution


這是加了block7ResNet-50在不同output_stride的條件下的試驗結(jié)果豌注。


這是層次變深的結(jié)果。


這是Multi-Grid的不同rate的結(jié)果灯萍。


不同的辦法在VAL set上的結(jié)果轧铁。

4.3. Atrous Spatial Pyramid Pooling


這是不同rate的ASPP的結(jié)果。


不同的辦法在VAL set上的結(jié)果竟稳。

不同Net結(jié)果

5. Conclusions

詳情請看原paper
[完]

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末属桦,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子他爸,更是在濱河造成了極大的恐慌,老刑警劉巖果善,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件诊笤,死亡現(xiàn)場離奇詭異,居然都是意外死亡巾陕,警方通過查閱死者的電腦和手機(jī)讨跟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鄙煤,“玉大人晾匠,你說我怎么就攤上這事√莞眨” “怎么了凉馆?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長亡资。 經(jīng)常有香客問我澜共,道長,這世上最難降的妖魔是什么锥腻? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任嗦董,我火速辦了婚禮,結(jié)果婚禮上瘦黑,老公的妹妹穿的比我還像新娘京革。我一直安慰自己,他們只是感情好幸斥,可當(dāng)我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布匹摇。 她就那樣靜靜地躺著,像睡著了一般睡毒。 火紅的嫁衣襯著肌膚如雪来惧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天演顾,我揣著相機(jī)與錄音供搀,去河邊找鬼隅居。 笑死,一個胖子當(dāng)著我的面吹牛葛虐,可吹牛的內(nèi)容都是我干的胎源。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼屿脐,長吁一口氣:“原來是場噩夢啊……” “哼涕蚤!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起的诵,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤万栅,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后西疤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體烦粒,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年代赁,在試婚紗的時候發(fā)現(xiàn)自己被綠了扰她。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡芭碍,死狀恐怖徒役,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情窖壕,我是刑警寧澤忧勿,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站艇拍,受9級特大地震影響狐蜕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜卸夕,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一层释、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧快集,春花似錦贡羔、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至院溺,卻和暖如春楣嘁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工逐虚, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留聋溜,地道東北人。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓叭爱,卻偏偏與公主長得像撮躁,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子买雾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容