DeepLab系列之V3

  1. DeepLab系列之V1
  2. DeepLab系列之V2
  3. DeepLab系列之V3
  4. DeepLab系列之V3+

概述

  1. DCNNs中語義分割存在三個挑戰(zhàn):
  • 連續(xù)下采用和重復(fù)池化,導(dǎo)致最后特征圖分辨率低
  • 圖像中存在多尺度的物體
    注:當(dāng)前版本沒有使用CFR
  1. 作者把解決多尺度物體問題的方法分成四類:


  • 把輸入圖片縮放成不同尺度怠缸,經(jīng)過同一個網(wǎng)絡(luò)诗轻,最終融合多尺度下的物體信息
  • 使用編解碼結(jié)構(gòu),在decoder時融合encoder網(wǎng)絡(luò)不同階段的特征
  • 在原網(wǎng)絡(luò)最后層增加額外的context模塊揭北,比如DenseCRF扳炬,或者串聯(lián)幾個不同感受野的卷積模塊
  • 在原網(wǎng)絡(luò)最后層添加并行結(jié)構(gòu)—空間金字塔池化吏颖,獲取不同尺度的物體信息
  1. 作者的處理方案:
  • 使用空洞卷積,防止分辨率過低情況
  • 串聯(lián)不同膨脹率的空洞卷積或者并行不同膨脹率的空洞卷積(v2的ASPP)恨樟,來獲取更多上下文信息
  1. 優(yōu)勢
  • 當(dāng)時在PASCAL VOC 2012 test上效果最好半醉,并且沒有使用DenseCRF
  1. 本文主要工作
  • 探索更深結(jié)構(gòu)下的空洞卷積探索(串行結(jié)構(gòu))
  • 優(yōu)化atrous spatial pyramid pooling—ASPP(并行結(jié)構(gòu))

膨脹卷積

v1、v2中已詳細(xì)說明劝术,略....

更深結(jié)構(gòu)下的空洞卷積

  1. 串聯(lián)結(jié)構(gòu)
    把resnet最后一個block缩多,下圖中的Block4拷貝幾份串聯(lián)起來:



    每個block的最后一個卷積stride都為2(除了最后一個block),連續(xù)的下采樣保證獲取更大范圍的特征夯尽,但是這樣不利于語義分割瞧壮。
    使用不同膨脹率的空洞卷積保證了分辨率和大的感受野,如上圖b所示匙握。

  2. multi-grid
    作者考慮了multi-grid方法咆槽,即每個block中的三個卷積有各自unit rate,例如Multi Grid = (1, 2, 4)圈纺,block的dilate rate=2秦忿,則block中每個卷積的實際膨脹率=2* (1, 2, 4)=(2,4,8)

優(yōu)化Atrous Spatial Pyramid Pooling

作者通過實驗發(fā)現(xiàn),膨脹率越大蛾娶,卷積核中的有效權(quán)重越少灯谣,當(dāng)膨脹率足夠大時,只有卷積核最中間的權(quán)重有效蛔琅,即退化成了1x1卷積核胎许,并不能獲取到全局的context信息。3x3的卷積核中有效權(quán)重與膨脹率的對應(yīng)如下:


為了解決這個問題罗售,作者在最后一個特征上使用了全局平均池化(global everage pooling)(包含1x1卷積核辜窑,輸出256個通道,正則化寨躁,通過bilinear上采樣還原到對應(yīng)尺度)
修改后的ASPP結(jié)構(gòu)如下:

所有的分支都包含256個通道和正則化穆碎,最終concat到一起,1x1卷積將通道數(shù)為256职恳。

實驗

  1. 訓(xùn)練策略
  • Learning rate policy:
    poly所禀,學(xué)習(xí)率下降方式如下:


  • Crop size:
    513,保證更大的膨脹率有效
  • Batch normalization:
    先在增強數(shù)據(jù)集上output stride = 16(輸入圖像與輸出特征大小的比例)放钦,batch size=16色徘,BN參數(shù)衰減為0.9997,訓(xùn)練30k個iter最筒。
    之后在官方PASCAL VOC 2012的trainval集上凍結(jié)BN參數(shù)贺氓, output stride = 8,batch size=8,訓(xùn)練30k個iter辙培。
  • Upsampling logits:
    v1蔑水、v2中都是下采樣的真值來計算loss,這里上采樣最后的輸出結(jié)果扬蕊。
  • Data augmentation:
    輸入圖片隨機縮放(0.5-2.0)搀别,隨機左右翻轉(zhuǎn)
  1. 串行結(jié)構(gòu)下的結(jié)果
  • block串聯(lián)個數(shù)不同,在resnet50和resnet101下的mIOU:


  • ResNet-101尾抑,output stride = 16下不同multi-grid的mIOU:


  • 消融實驗:


  1. ASPP結(jié)構(gòu)下的結(jié)果
  • output stride = 16歇父,不同multi-grid和膨脹率的結(jié)果:


  • 消融實驗:


經(jīng)驗track

  1. 如何在MS COCO上預(yù)訓(xùn)練?
    trainval_minus_minival挑選包含PASCAL分類并且目標(biāo)區(qū)域像素個數(shù)大于1000的圖片再愈,大概有60k的圖片用于訓(xùn)練榜苫,除了PASCAL分類區(qū)域,其它都看成背景翎冲。從上述實驗結(jié)果中發(fā)現(xiàn)提升了3個百分點垂睬。
  2. 對于有些類準(zhǔn)確率比較低,怎么辦抗悍?
    針對包含namely bicycle驹饺、chair、table缴渊、potted- plant赏壹、and sofa分類的圖片,在訓(xùn)練集中增加它們比列衔沼。通過BN策略和這里的策略蝌借,達(dá)到85.7%IOU,再次提升3個百分點指蚁。
  3. Cityscapes上的小策略:
    cropsize 769 iters 90k
  • output stride = 16時:77.23%
  • output stride = 8時:77.82%
  • 多尺度輸入(0.75,1,1.25):79.30%
  • 事先在trainval coarse上預(yù)訓(xùn)練骨望,scales = {0.75, 1, 1.25, 1.5, 1.75, 2} ,output stride = 4欣舵,output stride = 8,最終結(jié)果:81.3%
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末缀磕,一起剝皮案震驚了整個濱河市缘圈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌袜蚕,老刑警劉巖糟把,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異牲剃,居然都是意外死亡遣疯,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進(jìn)店門凿傅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缠犀,“玉大人数苫,你說我怎么就攤上這事”嬉海” “怎么了虐急?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長滔迈。 經(jīng)常有香客問我止吁,道長,這世上最難降的妖魔是什么燎悍? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任敬惦,我火速辦了婚禮,結(jié)果婚禮上谈山,老公的妹妹穿的比我還像新娘俄删。我一直安慰自己,他們只是感情好勾哩,可當(dāng)我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布抗蠢。 她就那樣靜靜地躺著,像睡著了一般思劳。 火紅的嫁衣襯著肌膚如雪迅矛。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天潜叛,我揣著相機與錄音秽褒,去河邊找鬼。 笑死威兜,一個胖子當(dāng)著我的面吹牛销斟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播椒舵,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼蚂踊,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了笔宿?” 一聲冷哼從身側(cè)響起犁钟,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎泼橘,沒想到半個月后涝动,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡炬灭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年醋粟,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡米愿,死狀恐怖厦凤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情吗货,我是刑警寧澤泳唠,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站宙搬,受9級特大地震影響空猜,放射性物質(zhì)發(fā)生泄漏持痰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望铝侵。 院中可真熱鬧赁项,春花似錦挪挤、人聲如沸洞拨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽肥照。三九已至,卻和暖如春勤众,著一層夾襖步出監(jiān)牢的瞬間舆绎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工们颜, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留吕朵,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓窥突,卻偏偏與公主長得像努溃,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子阻问,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,685評論 2 360