Fast R-CNN

Fast R-CNN的提出是基于前面的R-CNN及SPP-NET的改進(jìn)版本,那么首先再來說明一下R-CNN和SPP-NET各自的不足之處吧~~

R-CNN最明顯的不足之處在于對(duì)于一幅圖片的2000個(gè)region proposals需要分別輸入CNN進(jìn)行特征提取,這將變得很耗時(shí)。另外因?yàn)槿B接層的存在寂曹,其需要每個(gè)輸入的region proposal的尺度一樣,而這使得其對(duì)尺度敏感,不利于實(shí)際處理時(shí)的應(yīng)用霞溪。整個(gè)網(wǎng)絡(luò)的訓(xùn)練過程不是端到端的,分為region proposal的Selective Search階段中捆,CNN精調(diào)階段鸯匹,SVM分類器訓(xùn)練階段,同時(shí)在進(jìn)行SVM分類之前泄伪,需要將提取到的每個(gè)region proposal存儲(chǔ)在磁盤中(殴蓬??蟋滴?)染厅,然后再進(jìn)行SVM階段的處理。整個(gè)過程是很耗時(shí)的津函。

SPP-NET針對(duì)R-CNN中的尺度問題進(jìn)行了改進(jìn)肖粮,引入了SPP(spatial pyramid pooling)以此來實(shí)現(xiàn)對(duì)輸入圖片的大小不作限制,同時(shí)不是對(duì)每個(gè)region proposal單獨(dú)輸入CNN球散,而是將整張圖片輸入后得到feature map然后將每個(gè)region proposal映射到feature map上的對(duì)應(yīng)位置尿赚。以此提升了速度。但整個(gè)網(wǎng)絡(luò)的訓(xùn)練過程和R-CNN一樣蕉堰,也是分為多個(gè)階段的凌净,且需將提取到的特征存放至磁盤再進(jìn)行SVM的操作。并且屋讶,由于SPP的加入冰寻,使得其在反向傳播時(shí)不能對(duì)SPP之前的卷積網(wǎng)絡(luò)進(jìn)行更新,這限制了最后結(jié)果準(zhǔn)確率的提升皿渗。

綜上斩芭,R-CNN和SPP-NET的時(shí)間和空間消耗都較大。

于是一種end-to-end的joint training的pipeline誕生了~~~
個(gè)人覺得乐疆,F(xiàn)ast-RCNN是一種聯(lián)合訓(xùn)練簡(jiǎn)化版的SPP-NET划乖,至于原因,就從下面的details吧~

訓(xùn)練階段:

Step1:原始圖像的數(shù)據(jù)處理

文中在訓(xùn)練時(shí)與之前的不同是采用了一些訓(xùn)練的小trick挤土,作者在進(jìn)行SGD時(shí)取的mini-batch是兩張圖中各取64個(gè)region proposals共128個(gè)作為一次訓(xùn)練的數(shù)據(jù)琴庵。這比從128張圖片中各1取一個(gè)proposal的方式要快64倍。類似于SPP-NET,將整張圖輸入至網(wǎng)絡(luò)迷殿。

Step2:利用模型對(duì)整幅圖提取特征

采用VGG16模型儿礼,和SPP-NET中類似,只是將其SPP網(wǎng)絡(luò)的三層結(jié)構(gòu)換成了單一結(jié)構(gòu)庆寺,即只有一層金字塔蚊夫,此時(shí)稱其為ROI Pooling。使不同尺度的region proposals形成相同尺寸的特征向量懦尝。其整體結(jié)構(gòu)可視為(13個(gè)卷積層+4個(gè)pooling層+ROI層+2fc層+2個(gè)平及層【softmaxLoss層和SmoothL1loss層】)

Step3:多任務(wù)訓(xùn)練階段

要說相比于SPP-NET有明顯不同的地方知纷,大概就是這一步多任務(wù)訓(xùn)練了。從上圖的網(wǎng)絡(luò)結(jié)構(gòu)可以看出陵霉,在最后fc層處有兩個(gè)并列的輸出屈扎,一個(gè)是用于分類的Softmax,另一個(gè)是用于bounding box的回歸撩匕,以此實(shí)現(xiàn)一個(gè)完全端到端的網(wǎng)絡(luò)結(jié)構(gòu)。此時(shí)墨叛,對(duì)于Step2中提取到的特征止毕,可不必存于磁盤而是直接輸入到softmax和regression中進(jìn)行訓(xùn)練(?漠趁?)注:此時(shí)的正樣本需滿足余groundtruth的IoU>0.5.(可理解為扁凛,在之前如SPP-NET,R-CNN中在對(duì)CNN網(wǎng)絡(luò)進(jìn)行精調(diào)時(shí)闯传,需要IoU>0.5谨朝,在對(duì)SVM訓(xùn)練時(shí)IoU>0.3,故在此進(jìn)行聯(lián)合訓(xùn)練時(shí)取其較大值0.5)

多任務(wù)損失:分類采用softmax損失甥绿,回歸采用SmoothL1Loss字币,兩者的權(quán)比例為1:1.如下圖:

total loss
SmoothL1Loss

(??對(duì)于回歸部分的損失)

另外,為了加快速度共缕,作者對(duì)于全連接層處的矩陣進(jìn)行了SVD分解洗出,這樣使得RoI數(shù)目較大時(shí)可以使速度明顯提升。

************
在進(jìn)行訓(xùn)練時(shí)图谷,多尺度圖像訓(xùn)練Fast R-CNN與單尺度圖像訓(xùn)練相比翩活,只提升了微小的mAP,但是時(shí)間成本卻增加了很多,故綜合考慮便贵,作者建議直接用一種尺度的圖像訓(xùn)練Fast R-CNN菠镇。(如何訓(xùn)練的?)

scale choose

************

Step4 預(yù)測(cè)階段:

與SPP-NET類似承璃,對(duì)圖片利用Selective Search提取region proposals利耍,然后將整張圖片輸入網(wǎng)絡(luò),經(jīng)過卷積層提取特征后,可利用ROI pooling層對(duì)不同尺寸的region proposal形成相同長(zhǎng)度的特征向量堂竟,然后輸入之后的fc層和softmax即regression進(jìn)行分類及boundingbox回歸魂毁。并進(jìn)行非極大值抑制對(duì)boundingbox進(jìn)行篩選。

********
并不是proposal提取越多效果就會(huì)越好出嘹,提取得太多席楚,效果反而會(huì)使mAP值下降。

********

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末税稼,一起剝皮案震驚了整個(gè)濱河市烦秩,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌郎仆,老刑警劉巖只祠,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異扰肌,居然都是意外死亡抛寝,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門曙旭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盗舰,“玉大人,你說我怎么就攤上這事桂躏∽昵鳎” “怎么了?”我有些...
    開封第一講書人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵剂习,是天一觀的道長(zhǎng)蛮位。 經(jīng)常有香客問我,道長(zhǎng)鳞绕,這世上最難降的妖魔是什么失仁? 我笑而不...
    開封第一講書人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮们何,結(jié)果婚禮上陶因,老公的妹妹穿的比我還像新娘。我一直安慰自己垂蜗,他們只是感情好楷扬,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著贴见,像睡著了一般烘苹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上片部,一...
    開封第一講書人閱讀 51,521評(píng)論 1 304
  • 那天镣衡,我揣著相機(jī)與錄音,去河邊找鬼。 笑死廊鸥,一個(gè)胖子當(dāng)著我的面吹牛望浩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播惰说,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼磨德,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了吆视?” 一聲冷哼從身側(cè)響起典挑,我...
    開封第一講書人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎啦吧,沒想到半個(gè)月后您觉,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡授滓,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年琳水,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片般堆。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡炫刷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出郁妈,到底是詐尸還是另有隱情,我是刑警寧澤绍申,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布噩咪,位于F島的核電站,受9級(jí)特大地震影響极阅,放射性物質(zhì)發(fā)生泄漏胃碾。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一筋搏、第九天 我趴在偏房一處隱蔽的房頂上張望仆百。 院中可真熱鬧,春花似錦奔脐、人聲如沸俄周。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽峦朗。三九已至,卻和暖如春排龄,著一層夾襖步出監(jiān)牢的瞬間波势,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留尺铣,地道東北人拴曲。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像凛忿,于是被迫代替她去往敵國(guó)和親澈灼。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容