論文閱讀:BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

face++ eccv2008的paper,主要提出bisenet锭汛,用于實(shí)時(shí)語義分割尚洽。感覺寫的還是蠻不錯(cuò)的,結(jié)構(gòu)清晰缤底,通俗易懂嗅定。自己需要學(xué)習(xí)的是怎么說這個(gè)story自娩,怎么create出創(chuàng)新點(diǎn),其實(shí)架構(gòu)很簡(jiǎn)單渠退,但是說的特別好忙迁,為什么要這么做,還給了每一個(gè)部分起了一個(gè)好title.主要設(shè)計(jì)了BiSeNet,其中spatial path 負(fù)責(zé)保留空間信息并且生成高分辨率特征(三個(gè)卷積)碎乃,context path 獲取足夠的感受野(用了快速的下采樣动漾,用FFM模塊(feature fusion module)對(duì)特征進(jìn)行融合,還add了類似與senet的注意力機(jī)制對(duì)特征進(jìn)行加權(quán)荠锭。該網(wǎng)絡(luò)在titian xp 上105FPS 且MIOU為0.684(cityscape數(shù)據(jù)集)。

首先晨川,先介紹了現(xiàn)有加速的方法:1.crop或者resize圖片 2. 減少特征通道數(shù)证九,尤其在網(wǎng)絡(luò)的早期3.丟棄網(wǎng)絡(luò)的最后階段(ENet),使模型變得緊湊共虑。三種方式的缺點(diǎn)如下 1.損失了空間細(xì)節(jié)愧怜,特別是邊緣 2.弱化了空間信息 3. 少了最后階段的下采樣,感受野變小妈拌,影響大物體的分割(對(duì)自己來說特別重要)這些方法為了速度犧牲了acc,在實(shí)際中處于劣勢(shì)拥坛。為了彌補(bǔ)空間信息,u-shape結(jié)構(gòu)被提出來尘分,粗暴的對(duì)特征進(jìn)行融合猜惋。但是這種方法計(jì)算太慢而且不能還原通過剪裁和resize的空間信息。so,還是我家提出的BiSeNet好培愁。


main contribution:

Spatial Path

在語義分割任務(wù)中著摔,空間分辨率和感受野很難兩全,尤其是在實(shí)時(shí)語義分割的情況下定续,現(xiàn)有方法通常是利用小的輸入圖像或者輕量主干模型實(shí)現(xiàn)加速谍咆。但是小圖像相較于原圖像缺失了很多空間信息禾锤,而輕量級(jí)模型則由于裁剪通道而損害了空間信息。

本文提出 Spatial Path來保留原輸入圖像的空間尺度摹察,并編碼豐富的空間信息恩掷。Spatial Path為三個(gè)(stride為 2 的卷積+bn+ ReLU)。因此供嚎,該path輸出的feature map為原圖像 1/8 黄娘。其含有豐富的空間信息due to 巨大的size。

Context path

用來獲取足夠的感受野查坪,在語義分割中寸宏,感受野十分重要,現(xiàn)有的增大感受野的方式 pyramid pooling, atrous spatial pyramid pooling,large kernel等偿曙,消耗內(nèi)存和計(jì)算氮凝,降低速度。

Context path 通過初始化輕量模型與global average pooling 來提供大的感受野并加速望忆。輕量模型(xception) 快速下采樣罩阵。全局均勻池化,獲取全局語義信息启摄。然后借鑒unet稿壁,融合最后兩個(gè)階段的語義信息。



還添加了特征優(yōu)化模塊Attention refinement module(就是senet的特征加權(quán))

Network architecture

Context path用的是xception39,Spatial Path用的是三層卷積歉备。用FFM來融合傅是。具體結(jié)構(gòu)如上圖所示。FFM不是簡(jiǎn)單的特征相加蕾羊,是先concacte,然后bn喧笔,在后類似與senet reweight特征。
損失函數(shù):有輔助損失 兩個(gè)輔助損失和一個(gè)主損失龟再,用參數(shù) α來平衡书闸。輔助損失在Context path模塊的兩個(gè)出口那里。都是softmax利凑。


實(shí)現(xiàn)細(xì)節(jié)
(SGD)batch size 16, momentum 0.9 and weight decay 1e ?4“poly” learning rate strategy power 0.9. The initial learning rate is 2.5e .
Data augmentation: mean subtraction, random horizontal flip
and random scale on the input images to augment the dataset in training process.
The scales contains { 0.75, 1.0, 1.5, 1.75, 2.0}. Finally, we randomly crop the
image into fix size for training.

experiment:
采用改版的 Xception39(不知道改哪里了浆劲,據(jù)說code會(huì)公開),并在 Cityscapes哀澈,CamVid 和 COCO-Stuff 三個(gè)數(shù)據(jù)集進(jìn)行評(píng)估牌借。具體實(shí)驗(yàn)結(jié)果就不一一列出。

給自己的思考:
自己是個(gè)二分類問題割按,然后道路占比又大走哺,屬于大物體,那么自己crop的時(shí)候是否要注意,最好能夠cover整個(gè)道路丙躏,然后择示,感受野確實(shí)也要大。沒有小物體晒旅,所以栅盲,特征融合模塊估計(jì)不太需要。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末废恋,一起剝皮案震驚了整個(gè)濱河市谈秫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鱼鼓,老刑警劉巖拟烫,帶你破解...
    沈念sama閱讀 211,348評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異迄本,居然都是意外死亡硕淑,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門嘉赎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來置媳,“玉大人,你說我怎么就攤上這事公条∧茨遥” “怎么了?”我有些...
    開封第一講書人閱讀 156,936評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵靶橱,是天一觀的道長(zhǎng)寥袭。 經(jīng)常有香客問我,道長(zhǎng)关霸,這世上最難降的妖魔是什么传黄? 我笑而不...
    開封第一講書人閱讀 56,427評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮谒拴,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘涉波。我一直安慰自己英上,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,467評(píng)論 6 385
  • 文/花漫 我一把揭開白布啤覆。 她就那樣靜靜地躺著苍日,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窗声。 梳的紋絲不亂的頭發(fā)上相恃,一...
    開封第一講書人閱讀 49,785評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音笨觅,去河邊找鬼拦耐。 笑死耕腾,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的杀糯。 我是一名探鬼主播扫俺,決...
    沈念sama閱讀 38,931評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼固翰!你這毒婦竟也來了狼纬?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,696評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤骂际,失蹤者是張志新(化名)和其女友劉穎疗琉,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體歉铝,經(jīng)...
    沈念sama閱讀 44,141評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡盈简,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,483評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了犯戏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片送火。...
    茶點(diǎn)故事閱讀 38,625評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖先匪,靈堂內(nèi)的尸體忽然破棺而出种吸,到底是詐尸還是另有隱情,我是刑警寧澤呀非,帶...
    沈念sama閱讀 34,291評(píng)論 4 329
  • 正文 年R本政府宣布坚俗,位于F島的核電站,受9級(jí)特大地震影響岸裙,放射性物質(zhì)發(fā)生泄漏猖败。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,892評(píng)論 3 312
  • 文/蒙蒙 一降允、第九天 我趴在偏房一處隱蔽的房頂上張望恩闻。 院中可真熱鬧,春花似錦剧董、人聲如沸幢尚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尉剩。三九已至,卻和暖如春毅臊,著一層夾襖步出監(jiān)牢的瞬間理茎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留皂林,地道東北人朗鸠。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像式撼,于是被迫代替她去往敵國(guó)和親童社。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,492評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容