目標檢測算法之Fast-RCNN

前言

接著昨天介紹的RCNN形真,我們知道RCNN需要把每一個可能有目標的候選框搜索出來抡砂,然后把每個候選框傳入CNN提取特征,每一張圖片要產(chǎn)生大約2K個候選框窒篱,而每個框?qū)?yīng)的圖像都要傳入CNN焕刮,這個時間開銷肯定是很難承受的∩嗉粒基于RCNN這個致命問題济锄,F(xiàn)ast-RCNN出現(xiàn)了。

算法介紹

Fast-RCNN是在SPPNet和RCNN的基礎(chǔ)上進行改進的霍转。SPPNet的主要貢獻是在整張圖像上計算全局特征圖荐绝,然后對于特定的proposal,只需要在全局特征圖上取出對應(yīng)坐標的特征圖就可以了避消。但SPPNet仍然需要將特征保存在磁盤中低滩,速度還是很慢。結(jié)合RCNN的思想岩喷,論文提出直接將候選框區(qū)域應(yīng)用于特征圖恕沫,并使用ROI Pooling將其轉(zhuǎn)化為固定大小的特征圖,最后再連接兩個并行的分類頭和回歸頭完成檢測任務(wù)纱意。整個算法可以用下面的圖來表示:

在這里插入圖片描述

貢獻&創(chuàng)新點

  • Fast-RCNN 只對整個圖像進行一次特征提取婶溯,避免R-CNN的上千次特征提取褥影。
  • 使用ROI Pooling層替換最后一層的Max Pooling層哑芹,巧妙避免RCNN中的將每個候選框Resize到固定大小的操作唬党。
  • Fast RCNN在網(wǎng)絡(luò)的尾部采用并行的全連接層冒嫡,可同時輸出分類結(jié)果和窗口回歸結(jié)果,實現(xiàn)了端到端的多任務(wù)訓(xùn)練倦青,且不需要額外的特征存儲空間(在R-CNN中特征需要保存到磁盤羹唠,以供SVM和線性回歸器訓(xùn)練)志鹃。
  • 使用SVD矩陣分解算法對網(wǎng)絡(luò)末端并行的全連接層進行分解硫狞,加速運算信轿。

ROI Pooling層

Fast-RCNN的核心是ROI池化層晃痴,它的作用是輸入特征圖的大小不定,但輸出大小固定的輸出特征圖财忽。而什么是ROI呢倘核?ROI就是經(jīng)過區(qū)域建議算法(Selective Search)生成的框經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)提取特征后的特征圖上的區(qū)域,每一個ROI對應(yīng)了原圖的一個區(qū)域建議框定罢,只有大小變化了笤虫,相對位置沒有發(fā)生改變旁瘫。這個過程可以用下圖表示:

在這里插入圖片描述
ROI Pooling層的輸入有特征圖和ROIs祖凫,特征圖是經(jīng)過CNN提取后的結(jié)果,ROIs表示Selective Search的結(jié)果酬凳,形狀為惠况,其中代表ROI的個數(shù),5代表宁仔。這里需要注意的是稠屠,坐標系的參數(shù)是針對原圖的。

ROI Pooling的具體操作

  • 根據(jù)輸入圖片翎苫,將ROI映射到特征圖對應(yīng)位置(映射規(guī)則就是直接把各個坐標除以“輸入圖片和特征圖大小的比值”)
  • 將映射后的區(qū)域劃分為相同大小的sections权埠,其中sections代表輸出維度,例如7煎谍。
  • 對每個sections進行最大池化操作攘蔽。

最后上傳一張經(jīng)典動態(tài)圖片,更好的表示這個過程:

在這里插入圖片描述

源碼

Fast-RCNN的作者rgbirshick依然給出了源碼呐粘,有興趣可以讀一下:
https://github.com/rbgirshick/fast-rcnn

歡迎關(guān)注我的微信公眾號GiantPadaCV满俗,期待和你一起交流機器學(xué)習(xí),深度學(xué)習(xí)作岖,圖像算法唆垃,優(yōu)化技術(shù),比賽及日常生活等痘儡。


圖片.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末辕万,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子沉删,更是在濱河造成了極大的恐慌渐尿,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件丑念,死亡現(xiàn)場離奇詭異涡戳,居然都是意外死亡,警方通過查閱死者的電腦和手機脯倚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門渔彰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來嵌屎,“玉大人,你說我怎么就攤上這事恍涂”Χ瑁” “怎么了?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵再沧,是天一觀的道長尼夺。 經(jīng)常有香客問我,道長炒瘸,這世上最難降的妖魔是什么淤堵? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮顷扩,結(jié)果婚禮上拐邪,老公的妹妹穿的比我還像新娘。我一直安慰自己隘截,他們只是感情好扎阶,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著婶芭,像睡著了一般东臀。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上犀农,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天惰赋,我揣著相機與錄音,去河邊找鬼井赌。 笑死谤逼,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的仇穗。 我是一名探鬼主播流部,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼纹坐!你這毒婦竟也來了枝冀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤耘子,失蹤者是張志新(化名)和其女友劉穎果漾,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體谷誓,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡绒障,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了捍歪。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片户辱。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡鸵钝,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出庐镐,到底是詐尸還是另有隱情恩商,我是刑警寧澤,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布必逆,位于F島的核電站怠堪,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏名眉。R本人自食惡果不足惜粟矿,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望璧针。 院中可真熱鬧嚷炉,春花似錦、人聲如沸探橱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽隧膏。三九已至,卻和暖如春嚷那,著一層夾襖步出監(jiān)牢的瞬間胞枕,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工魏宽, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留腐泻,地道東北人。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓队询,卻偏偏與公主長得像派桩,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子蚌斩,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容