基于CNN的目標(biāo)檢測(cè)之GA-RPN

Region Proposal by Guided Anchoring（CVPR2019）

簡(jiǎn)介：GA-RPN（Guided Anchoring）是一種新的anchor 生成方法原献，其通過(guò)圖像特征來(lái)指導(dǎo)anchor 的生成。通過(guò)CNN預(yù)測(cè) anchor 的位置和形狀埂淮，生成稀疏而且形狀任意的 anchor姑隅，并且設(shè)計(jì)Feature Adaption 模塊來(lái)修正特征圖使之與預(yù)測(cè)生成得 anchor精確匹配。GA-RPN相比RPN減少90%的anchor倔撞，并且提高9.1%的召回率讲仰，將其用于不同的物體檢測(cè)器Fast R-CNN, Faster R-CNN and RetinaNet，分別提高檢測(cè)mAP 2.2%,2.7% ,1.2%痪蝇。

貢獻(xiàn)：

提出了一種新的anchor策略鄙陡，用于產(chǎn)生稀疏的任意形狀的anchor；

設(shè)計(jì)了基于anchor形狀的特征適應(yīng)模塊來(lái)refine特征躏啰；

提出了一種改進(jìn)模型性能的方案.

一趁矾、Motivation：

現(xiàn)有的Anchor-based方法生成Anchor的過(guò)程存在兩大問(wèn)題:

為了保證召回率，需要生成密集的anchor给僵，引入過(guò)多負(fù)樣本同時(shí)影響模型的速率愈魏。

anchor的尺度和長(zhǎng)寬比需要預(yù)先定義，針對(duì)不同類型的檢測(cè)任務(wù)需要調(diào)整這些超參數(shù)想际，預(yù)先定義好的 anchor 形狀不一定能滿足極端大小或者長(zhǎng)寬比懸殊的物體。

基于上述兩點(diǎn)溪厘，作者就嘗試使用特征去指導(dǎo)Anchor box中心位置胡本，寬高比的生成，這樣不僅可以提高生成Anchor的效率畸悬，而且還可以生成任意大小的Anchor侧甫，這對(duì)于一些比較極端長(zhǎng)寬比的物體是非常有效的。

注意：作者假設(shè)待檢測(cè)圖像中的目標(biāo)是不均勻分布的且稀疏的。

二披粟、模型結(jié)構(gòu)

作者提出使用圖像特征去指導(dǎo)Anchor生成咒锻，該結(jié)構(gòu)稱為Guided Anchoring，Guided Anchoring可以嵌入到任意的Anchor生成模塊之中守屉。下面是一個(gè)嵌入到FPN中的例子：

?? ???上圖左邊是一個(gè)FPN結(jié)構(gòu)惑艇，F(xiàn)PN每一層的特征都可以嵌入一個(gè)Guided Anchoring模塊用于預(yù)測(cè)proposals。Guided Anchoring的具體結(jié)構(gòu)則如上圖右邊所示拇泛，主要由兩個(gè)模塊組成：

Anchor generation模塊：

?? ??? ?添加兩個(gè)分支分別用于預(yù)測(cè)特征圖上每個(gè)像素（對(duì)應(yīng)的感受野）是目標(biāo)的置信度滨巴，以及對(duì)應(yīng)寬和高。目標(biāo)的置信度大于一個(gè)特定域值俺叭，則被認(rèn)為是目標(biāo)恭取。顯然，這個(gè)proposal獲取的過(guò)程不同于滑窗熄守，可以減少大量負(fù)樣本（每個(gè)Feature map上的像素點(diǎn)做多只產(chǎn)生一個(gè)proposal）蜈垮。此外，由于寬和高也是CNN回歸出來(lái)的裕照，所以沒(méi)有對(duì)物體的scale攒发，寬高比作任何先驗(yàn)假設(shè)。

1牍氛、anchor Location Prediction

位置預(yù)測(cè)分支的目標(biāo)是預(yù)測(cè)那些區(qū)域應(yīng)該作為中心點(diǎn)來(lái)生成 anchor晨继，是一個(gè)二分類問(wèn)題，預(yù)測(cè)是不是物體的中心搬俊。

FPN特征圖經(jīng)過(guò)位置預(yù)測(cè)子網(wǎng)絡(luò)生成位置得分圖：對(duì)基礎(chǔ)feature map先通過(guò)1*1卷積紊扬，然后逐元素Sigmoid轉(zhuǎn)換為概率值。然后根據(jù)閾值篩選唉擂，可以過(guò)濾掉90%的區(qū)域而保持相同的召回率

我們將整個(gè) feature map 的區(qū)域分為物體中心區(qū)域餐屎，外圍區(qū)域和忽略區(qū)域：即將 ground truth 框的中心一小塊對(duì)應(yīng)在 feature map 上的區(qū)域標(biāo)為物體中心區(qū)域，在訓(xùn)練的時(shí)候作為正樣本玩祟，其余區(qū)域按照離中心的距離標(biāo)為忽略或者負(fù)樣本腹缩。通過(guò)位置預(yù)測(cè)，可以篩選出一小部分區(qū)域作為 anchor 的候選中心點(diǎn)位置空扎，使得 anchor 數(shù)量大大降低藏鹊。

2、Anchor Shape Prediction

針對(duì)每個(gè)檢測(cè)出的中心點(diǎn)转锈，選取一個(gè)最佳的anchor box盘寡。最佳a(bǔ)nchor box的定義為：與預(yù)測(cè)的候選中心點(diǎn)的鄰近ground truth box產(chǎn)生最大IOU的anchor box。

形狀預(yù)測(cè)分支的目標(biāo)是給定 anchor 中心點(diǎn)撮慨，預(yù)測(cè)最佳的長(zhǎng)和寬竿痰，這是一個(gè)回歸問(wèn)題脆粥。論文直接使用 IoU 作為監(jiān)督，來(lái)學(xué)習(xí) w 和 h影涉。無(wú)法直接計(jì)算w 和 h变隔，而計(jì)算 IoU 又是可導(dǎo)的操作，所以使用基于bounded IoU Loss網(wǎng)絡(luò)優(yōu)化使得 IoU 最大蟹倾。

作者認(rèn)為匣缘，直接預(yù)測(cè)anchor box的寬高的話，范圍太廣不易學(xué)習(xí)喊式，故將寬高值使用指數(shù)及比例縮放進(jìn)行壓縮：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?ω =σ·s·exp(dw) , h=σ·s·exp(dh )

該分支預(yù)測(cè)dw,dh,通過(guò)上式進(jìn)行壓縮孵户，s為stride，σ是經(jīng)驗(yàn)尺度因子（論文取8）岔留，該映射將[0,1000]壓縮至[-1,1]夏哭。該分支輸出dw和dh。首先通過(guò)1*1卷積層產(chǎn)生兩個(gè)通道的map（包括dw和dh的值）献联，然后經(jīng)過(guò)逐元素轉(zhuǎn)換層實(shí)現(xiàn)w和h的轉(zhuǎn)化竖配。得益于任意形狀的anchor，所以對(duì)于寬高比夸張的目標(biāo)也具有更好的效果（比如火車等）里逆。

Feature adaption模塊：這個(gè)模塊實(shí)際上借鑒了可變性卷積的思想进胯。

由于每個(gè)位置的形狀不同，大的anchor對(duì)應(yīng)較大感受野原押，小的anchor對(duì)應(yīng)小的感受野胁镐。所以不能像之前基于anchor的方法那樣直接對(duì)feature map進(jìn)行卷積來(lái)預(yù)測(cè)，而是要對(duì)feature map進(jìn)行feature adaptation诸衔。作者利用變形卷積的思想盯漂，根據(jù)形狀對(duì)各個(gè)位置單獨(dú)進(jìn)行轉(zhuǎn)換。

其中笨农，fi是第i個(gè)位置的特征就缆，(wi, hi)是對(duì)應(yīng)的anchor形狀。NT通過(guò)3*3的變形卷積實(shí)現(xiàn)谒亦。首先通過(guò)形狀預(yù)測(cè)分支預(yù)測(cè)offset field竭宰，然后對(duì)帶偏移的原始feature map做變形卷積獲得adapted features。之后進(jìn)一步做分類和bounding box回歸份招。

三切揭、Training

采用多任務(wù)loss進(jìn)行端到端的訓(xùn)練，損失函數(shù)為：

1锁摔、anchor location

利用groundtruth bounding box來(lái)指導(dǎo)label生成伴箩，1代表有效位置，0代表無(wú)效位置鄙漏。中心附近的anchor應(yīng)該較多嗤谚，而遠(yuǎn)離中心的anchor數(shù)目應(yīng)該少一些。假定R(x, y, w, h)表示以(x, y)為中心怔蚌，w和h分別為寬高的矩形區(qū)域巩步。將groundtruth的bbox(xg, yg, wg, hg)映射到feature map的尺度得到(x'g, y'g, w'g, h'g)。

a.定義中心區(qū)域CR=R(x'g, y'g, σ1w', σ1h')桦踊，CR區(qū)域內(nèi)的像素標(biāo)記為正樣本椅野；

b.定義ignore區(qū)域IR=R(x'g, y'g, σ2w', σ2h')\CR，該區(qū)域的像素標(biāo)記為ignore籍胯；

c.其余區(qū)域標(biāo)記為外部區(qū)域OR竟闪，該區(qū)域所有像素標(biāo)記為負(fù)樣本。

考慮到基于FPN利用了多層feature杖狼，所以只有當(dāng)feature map與目標(biāo)的尺度范圍匹配時(shí)才標(biāo)記為CR炼蛤，而臨近層相同區(qū)域標(biāo)記為IR，如下圖所示蝶涩。文中使用Focal Loss來(lái)訓(xùn)練定位分支理朋。

2）anchor shape

首先將anchor與groundtruth的bbox匹配，然后計(jì)算最佳寬和高（可以最大化IoU）绿聘。因此重新定義了變化的anchor與gt bbox的vIoU：

變化anchor：awh=(x0, y0, w, h)

groundtruth bbox：gt=(xg, yg, wg, hg)

其中IoUnormal是IoU的常規(guī)定義嗽上，w和h是變量。由于對(duì)任意位置的anchor與ground truth熄攘，對(duì)vIOU進(jìn)行明確的表示是非常困難的兽愤，因此給定（x0,y0），本文采用近似的方法挪圾，采樣一些可能的w和h浅萧。文中采樣了9組常見的w、h洛史。實(shí)驗(yàn)表明結(jié)果對(duì)sample的組數(shù)不敏感惯殊。文中采用有界IoU損失來(lái)最大化IoU。

作者使用Guided Anchoring策略來(lái)改進(jìn)RPN（稱為GA-RPN)也殖。下圖對(duì)比了RPN和GA-RPN產(chǎn)生的proposal的IoU分布：

很顯然土思，GA-RPN產(chǎn)生的正樣本數(shù)目更多，而且高IoU的proposal占的比例更大忆嗜。訓(xùn)練時(shí)相比于RPN己儒，GA-RPN采用更高的閾值、使用更少的樣本（使用高質(zhì)量proposal的前提是根據(jù)proposal的分布調(diào)整訓(xùn)練樣本的分布）捆毫。

四闪湾、優(yōu)缺點(diǎn)分析

優(yōu)點(diǎn)：

1、論文提出anchor設(shè)計(jì)的兩個(gè)準(zhǔn)則：alignment 和 consistency绩卤，指導(dǎo)基于anchor優(yōu)化的方向途样。采用位置預(yù)測(cè)和形狀預(yù)測(cè)兩個(gè)分支江醇，不需要像FPN預(yù)先設(shè)置尺度和長(zhǎng)寬比，同時(shí)使用可變形卷積對(duì)feature map調(diào)整何暇，生成高質(zhì)量低密度的proposal陶夜，提高IoU的閾值進(jìn)行訓(xùn)練。

2裆站、提出了一種新的anchor策略条辟，用于產(chǎn)生稀疏的任意形狀的anchor；

3宏胯、論文提出的GA-RPN可以完全替代RPN羽嫡，在Fast R-CNN, Faster R-CNN and RetinaNet等模型基礎(chǔ)上提高目標(biāo)檢測(cè)模型的精度。

缺點(diǎn)：

1肩袍、論文假設(shè)圖像中的目標(biāo)是稀疏的杭棵。如果是稠密圖像，比如車站或廣場(chǎng)的擁擠人群了牛，檢測(cè)效果有待檢驗(yàn)颜屠。

2、每一個(gè)點(diǎn)只產(chǎn)生一個(gè)anchor鹰祸，那么對(duì)于那些目標(biāo)中心重合甫窟，即一個(gè)點(diǎn)需要負(fù)責(zé)檢測(cè)兩個(gè)目標(biāo)，似乎無(wú)法處理蛙婴。

3粗井、采用deformable卷積會(huì)相對(duì)地降低速度，同時(shí)根據(jù)DCN v2的分析街图，在deformable卷積中加入可調(diào)節(jié)的機(jī)制可能會(huì)更好浇衬。

思考：

?? ?? ? 1、可以借鑒采用雙分支預(yù)測(cè)：一個(gè)分支預(yù)測(cè)目標(biāo)的中心點(diǎn)餐济，另一個(gè)分支預(yù)測(cè)物體的長(zhǎng)框耘擂，這個(gè)思想的實(shí)現(xiàn)和看完cornerNet和CenterNet的想法實(shí)現(xiàn)是類似的，但是出發(fā)點(diǎn)不同絮姆。

?? ?? ? 之前做雙分支預(yù)測(cè)是想利用anchor free中的中心點(diǎn)的預(yù)測(cè)看能否增加物體的內(nèi)部感知能力∽碓現(xiàn)在的雙分支預(yù)測(cè)是為了減少先驗(yàn)框anchor的數(shù)量，減少正負(fù)樣本的不平衡問(wèn)題篙悯。兩者出發(fā)點(diǎn)不同蚁阳，但是采用的操作是類似的，有效性有待考證鸽照。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末螺捐，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌定血，老刑警劉巖赔癌，帶你破解...
沈念sama閱讀 217,907評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異澜沟，居然都是意外死亡届榄，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,987評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門倔喂，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人靖苇，你說(shuō)我怎么就攤上這事席噩。” “怎么了贤壁？”我有些...
開封第一講書人閱讀 164,298評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵悼枢，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我脾拆，道長(zhǎng)馒索，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,586評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任名船，我火速辦了婚禮绰上，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘渠驼。我一直安慰自己蜈块，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,633評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布迷扇。她就那樣靜靜地躺著百揭，像睡著了一般。火紅的嫁衣襯著肌膚如雪蜓席。梳的紋絲不亂的頭發(fā)上器一，一...
開封第一講書人閱讀 51,488評(píng)論 1贊 302
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音厨内，去河邊找鬼祈秕。笑死，一個(gè)胖子當(dāng)著我的面吹牛隘庄，可吹牛的內(nèi)容都是我干的踢步。我是一名探鬼主播，決...
沈念sama閱讀 40,275評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼丑掺，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼胳喷！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起驳庭，我...
開封第一講書人閱讀 39,176評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎玻孟，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體鳍征，經(jīng)...
沈念sama閱讀 45,619評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡黍翎，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,819評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了艳丛。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片匣掸。...
茶點(diǎn)故事閱讀 39,932評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖氮双，靈堂內(nèi)的尸體忽然破棺而出碰酝，到底是詐尸還是另有隱情，我是刑警寧澤戴差，帶...
沈念sama閱讀 35,655評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布送爸，位于F島的核電站，受9級(jí)特大地震影響暖释，放射性物質(zhì)發(fā)生泄漏袭厂。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,265評(píng)論 3贊 329
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一球匕、第九天我趴在偏房一處隱蔽的房頂上張望纹磺。院中可真熱鬧，春花似錦谐丢、人聲如沸爽航。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,871評(píng)論 0贊 22
一樁弒父案乾忱，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)讥珍。三九已至，卻和暖如春窄瘟，著一層夾襖步出監(jiān)牢的瞬間衷佃，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,994評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工蹄葱，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留氏义，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,095評(píng)論 3贊 370
代替公主和親
正文我出身青樓图云，卻偏偏與公主長(zhǎng)得像惯悠，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子竣况，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,884評(píng)論 2贊 354