從ROI Pooling到ROI Align

ROI Align 是在Mask-RCNN這篇論文里提出的一種區(qū)域特征聚集方式, 很好地解決了ROI Pooling操作中兩次量化造成的區(qū)域不匹配(mis-alignment)的問題歌粥。實(shí)驗(yàn)顯示男窟,在檢測測任務(wù)中將 ROI Pooling 替換為 ROI Align 可以提升檢測模型的準(zhǔn)確性碘裕。

ROI Pooling過程:

1、首先根據(jù)后面網(wǎng)絡(luò)要求的輸入尺寸求網(wǎng)格大小,如輸入特征圖尺寸為5*5,而網(wǎng)絡(luò)輸入尺寸為2*2,那么網(wǎng)格的劃分結(jié)果為


2丹壕、對于每個(gè)小網(wǎng)格,求最大值作為該網(wǎng)格最大池化之后的值薇溃。

在這個(gè)過程中會(huì)有兩次量化操作菌赖。對于一個(gè)region proposal,首先從原圖經(jīng)過全卷積網(wǎng)絡(luò)到特征圖沐序,得到的候選框位置可能存在浮點(diǎn)數(shù)琉用,進(jìn)行取整操作從而出現(xiàn)第一次量化;其次策幼,在ROI Pooling求取每個(gè)小網(wǎng)格的位置時(shí)也同樣存在浮點(diǎn)數(shù)取整的情況邑时。這兩次量化的結(jié)果都使得候選框的位置會(huì)出現(xiàn)偏差,在論文里特姐,作者把它總結(jié)為“不匹配問題(misalignment)晶丘。如下圖所示,假設(shè)圖片經(jīng)過主干網(wǎng)絡(luò)提取特征后唐含,特征圖縮放步長(stride)為32浅浮,則該層特征圖上0.1個(gè)像素的偏差,縮放到原圖就是3.2個(gè)像素捷枯。


ROI Align過程:

為了解決ROI Pooling的上述缺點(diǎn)滚秩,作者提出了ROI Align這一改進(jìn)的方法。ROI Align的思路很簡單:取消量化操作淮捆,使用雙線性內(nèi)插的方法獲得坐標(biāo)為浮點(diǎn)數(shù)的像素點(diǎn)上的圖像數(shù)值,從而將整個(gè)特征聚集過程轉(zhuǎn)化為一個(gè)連續(xù)的操作郁油,。值得注意的是攀痊,在具體的算法操作上桐腌,ROI Align并不是簡單地補(bǔ)充出候選區(qū)域邊界上的坐標(biāo)點(diǎn),然后將這些坐標(biāo)點(diǎn)進(jìn)行池化蚕苇,而是重新設(shè)計(jì)了一套比較優(yōu)雅的流程哩掺,如圖3所示:

遍歷每一個(gè)候選區(qū)域,保持浮點(diǎn)數(shù)邊界不做量化涩笤。

將候選區(qū)域分割成k x k個(gè)單元嚼吞,每個(gè)單元的邊界也不做量化。

在每個(gè)單元中計(jì)算固定四個(gè)坐標(biāo)位置蹬碧,用雙線性內(nèi)插的方法計(jì)算出這四個(gè)位置的值舱禽,然后進(jìn)行最大池化操作。

這里對上述步驟的第三點(diǎn)作一些說明:這個(gè)固定位置是指在每一個(gè)矩形單元(bin)中按照固定規(guī)則確定的位置恩沽。比如底扳,如果采樣點(diǎn)數(shù)是1捻勉,那么就是這個(gè)單元的中心點(diǎn)随抠。如果采樣點(diǎn)數(shù)是4蓉驹,那么就是把這個(gè)單元平均分割成四個(gè)小方塊以后它們分別的中心點(diǎn)捂掰。顯然這些采樣點(diǎn)的坐標(biāo)通常是浮點(diǎn)數(shù),所以需要使用插值的方法得到它的像素值。在相關(guān)實(shí)驗(yàn)中,作者發(fā)現(xiàn)將采樣點(diǎn)設(shè)為4會(huì)獲得最佳性能脖镀,甚至直接設(shè)為1在性能上也相差無幾。事實(shí)上狼电,ROI Align 在遍歷取樣點(diǎn)的數(shù)量上沒有ROIPooling那么多蜒灰,但卻可以獲得更好的性能,這主要?dú)w功于解決了misalignment的問題肩碟。值得一提的是强窖,我在實(shí)驗(yàn)時(shí)發(fā)現(xiàn),ROI Align在VOC2007數(shù)據(jù)集上的提升效果并不如在COCO上明顯削祈。經(jīng)過分析翅溺,造成這種區(qū)別的原因是COCO上小目標(biāo)的數(shù)量更多,而小目標(biāo)受misalignment問題的影響更大(比如髓抑,同樣是0.5個(gè)像素點(diǎn)的偏差未巫,對于較大的目標(biāo)而言顯得微不足道,但是對于小目標(biāo)启昧,誤差的影響就要高很多)。


反向傳播公式:

常規(guī)的ROI Pooling的反向傳播公式如下:


這里劈伴,xi代表池化前特征圖上的像素點(diǎn)密末;yrj代表池化后的第r個(gè)候選區(qū)域的第j個(gè)點(diǎn);i*(r,j)代表點(diǎn)yrj像素值的來源(最大池化的時(shí)候選出的最大像素值所在點(diǎn)的坐標(biāo))跛璧。由上式可以看出严里,只有當(dāng)池化后某一個(gè)點(diǎn)的像素值在池化過程中采用了當(dāng)前點(diǎn)Xi的像素值(即滿足i=i*(r,j))追城,才在xi處回傳梯度刹碾。

類比于ROIPooling,ROIAlign的反向傳播需要作出稍許修改:首先座柱,在ROIAlign中迷帜,xi*(r,j)是一個(gè)浮點(diǎn)數(shù)的坐標(biāo)位置(前向傳播時(shí)計(jì)算出來的采樣點(diǎn)),在池化前的特征圖中色洞,每一個(gè)與 xi*(r,j) 橫縱坐標(biāo)均小于1的點(diǎn)都應(yīng)該接受與此對應(yīng)的點(diǎn)yrj回傳的梯度戏锹,故ROI Align 的反向傳播公式如下:


上式中,d(.)表示兩點(diǎn)之間的距離火诸,Δh和Δw表示 xi 與 xi*(r,j) 橫縱坐標(biāo)的差值锦针,這里作為雙線性內(nèi)插的系數(shù)乘在原始的梯度上。


參考文獻(xiàn):

http://blog.csdn.net/u011918382/article/details/79455407

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市奈搜,隨后出現(xiàn)的幾起案子悉盆,更是在濱河造成了極大的恐慌,老刑警劉巖馋吗,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件焕盟,死亡現(xiàn)場離奇詭異,居然都是意外死亡耗美,警方通過查閱死者的電腦和手機(jī)京髓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來商架,“玉大人堰怨,你說我怎么就攤上這事∩呙” “怎么了备图?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長赶袄。 經(jīng)常有香客問我揽涮,道長,這世上最難降的妖魔是什么饿肺? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任蒋困,我火速辦了婚禮,結(jié)果婚禮上敬辣,老公的妹妹穿的比我還像新娘雪标。我一直安慰自己,他們只是感情好溉跃,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布村刨。 她就那樣靜靜地躺著,像睡著了一般撰茎。 火紅的嫁衣襯著肌膚如雪嵌牺。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天龄糊,我揣著相機(jī)與錄音逆粹,去河邊找鬼。 笑死炫惩,一個(gè)胖子當(dāng)著我的面吹牛枯饿,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播诡必,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼奢方,長吁一口氣:“原來是場噩夢啊……” “哼搔扁!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蟋字,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤稿蹲,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后鹊奖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苛聘,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年忠聚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了设哗。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,117評論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡两蟀,死狀恐怖网梢,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赂毯,我是刑警寧澤战虏,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站党涕,受9級特大地震影響烦感,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜膛堤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一手趣、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧肥荔,春花似錦回懦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽潜圃。三九已至缸棵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間谭期,已是汗流浹背堵第。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留隧出,地道東北人踏志。 一個(gè)月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像胀瞪,于是被迫代替她去往敵國和親针余。 傳聞我的和親對象是個(gè)殘疾皇子饲鄙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,060評論 2 355