Faster R-CNN 中 RPN 的總結(jié)和疑惑解答

RPN 的全稱為 Region Proposal Networks嗓化,提取用于目標(biāo)檢測(cè)的 regions,這一步驟意在取代傳統(tǒng) R-CNN中利用 selective search 提取候選框的過(guò)程墩弯。
Region Proposal Networks.png

特征圖中每個(gè)紅色框的中心點(diǎn)都可以對(duì)應(yīng)到原圖的某個(gè)點(diǎn)启昧,原圖中的這個(gè)點(diǎn)被稱為錨點(diǎn)(anchor)。對(duì)于每個(gè)錨點(diǎn)正驻,我們都會(huì)以它為中心點(diǎn)選擇 9 個(gè)不同大小和長(zhǎng)寬比例的框(論文中為 128 * 128,256 * 256抢腐,512 * 512 的三種尺寸姑曙,每種尺寸按 1:1,1:2,2:1的長(zhǎng)寬比例縮放,共 9 個(gè)迈倍,它們?cè)陬A(yù)測(cè)時(shí)的順序是固定的)伤靠,作為 RPN 需要評(píng)估的候選框。RPN 的目標(biāo)就是對(duì)原圖中的每個(gè)錨點(diǎn)對(duì)應(yīng)的 9 個(gè)框啼染,預(yù)測(cè)他是否是一個(gè)存在目標(biāo)的框(并不一定包含完整的目標(biāo)宴合,只要這個(gè)框與 groud truth 的 IoU>0.7就認(rèn)為這個(gè)框是一個(gè) region proposal)。并且對(duì)于預(yù)測(cè)為 region proposal 的框迹鹅, RPN 還會(huì)預(yù)測(cè)一種長(zhǎng)寬縮放和位置平移的位置修正卦洽,使得對(duì)這個(gè) anchor box 修正后與 groud truth 的位置盡可能重疊度越高,修正后的框作為真正的 region proposal斜棚。

RPN 的主要步驟如下:
1阀蒂、利用 VGG16 等卷積神經(jīng)網(wǎng)絡(luò)的卷積層的到一些特征圖,例如圖中的 256 個(gè) H * W 的特征圖
2弟蚀、在特征圖上用 3 * 3 的滑動(dòng)窗口進(jìn)行卷積蚤霞,得到進(jìn)一步的 256 * H * W 的特征圖,從特征的維度看可以看成 H * W 的特征圖上每個(gè)點(diǎn)都有一個(gè) 256 維的特征向量
3义钉、將特征圖上每個(gè)點(diǎn)的 256 維特征與兩個(gè)全連接層連接昧绣。第一個(gè)全連接層輸出 2 * 9 個(gè)值,即這個(gè)錨點(diǎn)對(duì)應(yīng)的 9 個(gè) achor box捶闸,每個(gè) box 兩個(gè)值分別表示包含目標(biāo)的概率與不包含的概率(使用了 softmax loss 所以需要兩個(gè)值)夜畴。例如前兩個(gè)值表示 128 * 128 的 box 包含與不包含目標(biāo)的概率。第二個(gè)全連接層輸出 4 * 9 個(gè)值鉴嗤,每個(gè) anchor box 對(duì)應(yīng) 4 個(gè)值斩启,它們分別表征對(duì) groud truth 的長(zhǎng)寬與x、y坐標(biāo)的預(yù)測(cè)醉锅。(訓(xùn)練時(shí)只有包含目標(biāo)(即與 groud truth 的 IoU>0.7)的 anchor box 對(duì) groud truth 位置與大小預(yù)測(cè)的誤差才會(huì)對(duì) loss 有貢獻(xiàn))
4兔簇、對(duì)步驟 3 中預(yù)測(cè)包含目標(biāo)的 anchor box,利用 4 個(gè)位置回歸值對(duì) box 進(jìn)行平移和縮放硬耍,就能產(chǎn)生大量的候選框垄琐,此時(shí)利用非極大值抑制篩選一些預(yù)測(cè)分較高的候選框,作為最終的 region proposals

疑問(wèn)一:為什么 RPN能夠預(yù)測(cè) groud truth 的位置(輸入特征只有圖像像素的卷積特征经柴,完全沒(méi)有位置信息)狸窘?
實(shí)際上步驟 3 中預(yù)測(cè)的 4 個(gè)值不是直接預(yù)測(cè) H, W, x, y,很顯然由于特征圖上每個(gè)點(diǎn)都是共享權(quán)值的坯认,它們根本沒(méi)法對(duì)不同的長(zhǎng)寬和位置做出直接的預(yù)測(cè)(想象一下輸入的特征只是圖像的卷積特征翻擒,完全沒(méi)有當(dāng)前 anchor box 的位置大小信息氓涣,顯然不可能預(yù)測(cè)出 groud truth 的絕對(duì)位置和大小)陋气。這 4 個(gè)值是預(yù)測(cè)如何經(jīng)過(guò)平移與縮放使得當(dāng)前這個(gè) anchor box 能與 groud truth 盡可能重合(見(jiàn) R-CNN 論文附錄C):

位置與大小修正公式.png
公式中 P 表示預(yù)測(cè)包含目標(biāo)的 region proposal劳吠,G 表示這個(gè) region proposal 對(duì)應(yīng)的 groud truth,x, y, w, h分別表示橫坐標(biāo)巩趁、縱坐標(biāo)痒玩、寬和高。dx(P), dy(P), dw(P), dh(P) 即 RPN 預(yù)測(cè)的 4 個(gè)值议慰,它們表征的是對(duì)位置平移與大小縮放的系數(shù)蠢古。
由于 4 個(gè) G 值與 4 個(gè) P 值都是已知的,那么我們訓(xùn)練時(shí)就有了 dx(P), dy(P), dw(P), dh(P) 的目標(biāo)值如圖所示:
位置與大小回歸的目標(biāo)值.png
全連接層就是一個(gè)回歸函數(shù)别凹,用于預(yù)測(cè) 4 個(gè)系數(shù) d:
位置回歸目標(biāo)函數(shù).png

只有圖像像素卷積信息確實(shí)沒(méi)法預(yù)測(cè) groud truth 的絕對(duì)位置和大小草讶,但是利用圖像信息完全有可能預(yù)測(cè)當(dāng)前 region proposal 在 grouth truth 中的相對(duì)位置,我們也就可以預(yù)測(cè)怎么對(duì)當(dāng)前 anchor box 進(jìn)行平移與縮放得到包含整個(gè)目標(biāo)的候選框炉菲。例如一輛自行車到涂,可能當(dāng)前的 anchor box 中包含著自行車的前輪與把手部分,當(dāng) cnn 檢測(cè)到這樣的特征時(shí)颁督,他就能預(yù)測(cè)將這個(gè) box 向右平移并且水平方向擴(kuò)大一倍就是整個(gè)自行車目標(biāo)的 groud truth部分践啄。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市沉御,隨后出現(xiàn)的幾起案子屿讽,更是在濱河造成了極大的恐慌,老刑警劉巖吠裆,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件伐谈,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡试疙,警方通過(guò)查閱死者的電腦和手機(jī)诵棵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)祝旷,“玉大人履澳,你說(shuō)我怎么就攤上這事』初耍” “怎么了距贷?”我有些...
    開(kāi)封第一講書人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)吻谋。 經(jīng)常有香客問(wèn)我忠蝗,道長(zhǎng),這世上最難降的妖魔是什么漓拾? 我笑而不...
    開(kāi)封第一講書人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任阁最,我火速辦了婚禮戒祠,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘速种。我一直安慰自己得哆,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布哟旗。 她就那樣靜靜地躺著,像睡著了一般栋操。 火紅的嫁衣襯著肌膚如雪闸餐。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 49,036評(píng)論 1 285
  • 那天矾芙,我揣著相機(jī)與錄音舍沙,去河邊找鬼。 笑死剔宪,一個(gè)胖子當(dāng)著我的面吹牛拂铡,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播葱绒,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼感帅,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了地淀?” 一聲冷哼從身側(cè)響起失球,我...
    開(kāi)封第一講書人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎帮毁,沒(méi)想到半個(gè)月后实苞,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡烈疚,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年黔牵,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片爷肝。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡猾浦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出灯抛,到底是詐尸還是另有隱情跃巡,我是刑警寧澤,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布牧愁,位于F島的核電站素邪,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏猪半。R本人自食惡果不足惜兔朦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一偷线、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧沽甥,春花似錦声邦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至恨诱,卻和暖如春媳瞪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背照宝。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工蛇受, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人厕鹃。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓兢仰,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親剂碴。 傳聞我的和親對(duì)象是個(gè)殘疾皇子把将,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容