Fast R-CNN

Fast R-CNN的提出是基于前面的R-CNN及SPP-NET的改進(jìn)版本，那么首先再來說明一下R-CNN和SPP-NET各自的不足之處吧~~

R-CNN最明顯的不足之處在于對(duì)于一幅圖片的2000個(gè)region proposals需要分別輸入CNN進(jìn)行特征提取，這將變得很耗時(shí)。另外因?yàn)槿B接層的存在寂曹，其需要每個(gè)輸入的region proposal的尺度一樣，而這使得其對(duì)尺度敏感，不利于實(shí)際處理時(shí)的應(yīng)用霞溪。整個(gè)網(wǎng)絡(luò)的訓(xùn)練過程不是端到端的，分為region proposal的Selective Search階段中捆，CNN精調(diào)階段鸯匹，SVM分類器訓(xùn)練階段，同時(shí)在進(jìn)行SVM分類之前泄伪，需要將提取到的每個(gè)region proposal存儲(chǔ)在磁盤中（殴蓬？？蟋滴？）染厅，然后再進(jìn)行SVM階段的處理。整個(gè)過程是很耗時(shí)的津函。

SPP-NET針對(duì)R-CNN中的尺度問題進(jìn)行了改進(jìn)肖粮，引入了SPP(spatial pyramid pooling)以此來實(shí)現(xiàn)對(duì)輸入圖片的大小不作限制，同時(shí)不是對(duì)每個(gè)region proposal單獨(dú)輸入CNN球散，而是將整張圖片輸入后得到feature map然后將每個(gè)region proposal映射到feature map上的對(duì)應(yīng)位置尿赚。以此提升了速度。但整個(gè)網(wǎng)絡(luò)的訓(xùn)練過程和R-CNN一樣蕉堰，也是分為多個(gè)階段的凌净，且需將提取到的特征存放至磁盤再進(jìn)行SVM的操作。并且屋讶，由于SPP的加入冰寻，使得其在反向傳播時(shí)不能對(duì)SPP之前的卷積網(wǎng)絡(luò)進(jìn)行更新，這限制了最后結(jié)果準(zhǔn)確率的提升皿渗。

綜上斩芭，R-CNN和SPP-NET的時(shí)間和空間消耗都較大。

于是一種end-to-end的joint training的pipeline誕生了~~~
個(gè)人覺得乐疆，F(xiàn)ast-RCNN是一種聯(lián)合訓(xùn)練簡(jiǎn)化版的SPP-NET划乖，至于原因，就從下面的details吧~

訓(xùn)練階段：

Step1：原始圖像的數(shù)據(jù)處理

文中在訓(xùn)練時(shí)與之前的不同是采用了一些訓(xùn)練的小trick挤土，作者在進(jìn)行SGD時(shí)取的mini-batch是兩張圖中各取64個(gè)region proposals共128個(gè)作為一次訓(xùn)練的數(shù)據(jù)琴庵。這比從128張圖片中各1取一個(gè)proposal的方式要快64倍。類似于SPP-NET，將整張圖輸入至網(wǎng)絡(luò)迷殿。

Step2：利用模型對(duì)整幅圖提取特征

采用VGG16模型儿礼，和SPP-NET中類似，只是將其SPP網(wǎng)絡(luò)的三層結(jié)構(gòu)換成了單一結(jié)構(gòu)庆寺，即只有一層金字塔蚊夫，此時(shí)稱其為ROI Pooling。使不同尺度的region proposals形成相同尺寸的特征向量懦尝。其整體結(jié)構(gòu)可視為（13個(gè)卷積層+4個(gè)pooling層+ROI層+2fc層+2個(gè)平及層【softmaxLoss層和SmoothL1loss層】）

Step3：多任務(wù)訓(xùn)練階段

要說相比于SPP-NET有明顯不同的地方知纷，大概就是這一步多任務(wù)訓(xùn)練了。從上圖的網(wǎng)絡(luò)結(jié)構(gòu)可以看出陵霉，在最后fc層處有兩個(gè)并列的輸出屈扎，一個(gè)是用于分類的Softmax，另一個(gè)是用于bounding box的回歸撩匕，以此實(shí)現(xiàn)一個(gè)完全端到端的網(wǎng)絡(luò)結(jié)構(gòu)。此時(shí)墨叛，對(duì)于Step2中提取到的特征止毕，可不必存于磁盤而是直接輸入到softmax和regression中進(jìn)行訓(xùn)練（？漠趁？）注：此時(shí)的正樣本需滿足余groundtruth的IoU>0.5.（可理解為扁凛，在之前如SPP-NET，R-CNN中在對(duì)CNN網(wǎng)絡(luò)進(jìn)行精調(diào)時(shí)闯传，需要IoU>0.5谨朝，在對(duì)SVM訓(xùn)練時(shí)IoU>0.3，故在此進(jìn)行聯(lián)合訓(xùn)練時(shí)取其較大值0.5）

多任務(wù)損失：分類采用softmax損失甥绿，回歸采用SmoothL1Loss字币，兩者的權(quán)比例為1:1.如下圖：

total loss

SmoothL1Loss

(??對(duì)于回歸部分的損失)

另外，為了加快速度共缕，作者對(duì)于全連接層處的矩陣進(jìn)行了SVD分解洗出，這樣使得RoI數(shù)目較大時(shí)可以使速度明顯提升。

************
在進(jìn)行訓(xùn)練時(shí)图谷，多尺度圖像訓(xùn)練Fast R-CNN與單尺度圖像訓(xùn)練相比翩活，只提升了微小的mAP,但是時(shí)間成本卻增加了很多，故綜合考慮便贵，作者建議直接用一種尺度的圖像訓(xùn)練Fast R-CNN菠镇。（如何訓(xùn)練的？）

scale choose

************

Step4 預(yù)測(cè)階段：

與SPP-NET類似承璃，對(duì)圖片利用Selective Search提取region proposals利耍，然后將整張圖片輸入網(wǎng)絡(luò)，經(jīng)過卷積層提取特征后，可利用ROI pooling層對(duì)不同尺寸的region proposal形成相同長(zhǎng)度的特征向量堂竟，然后輸入之后的fc層和softmax即regression進(jìn)行分類及boundingbox回歸魂毁。并進(jìn)行非極大值抑制對(duì)boundingbox進(jìn)行篩選。

********
并不是proposal提取越多效果就會(huì)越好出嘹，提取得太多席楚，效果反而會(huì)使mAP值下降。

********

最后編輯于：2017.12.08 06:10:17

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末税稼，一起剝皮案震驚了整個(gè)濱河市烦秩，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌郎仆，老刑警劉巖只祠，帶你破解...
沈念sama閱讀 218,036評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異扰肌，居然都是意外死亡抛寝，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,046評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門曙旭，熙熙樓的掌柜王于貴愁眉苦臉地迎上來盗舰，“玉大人，你說我怎么就攤上這事桂躏∽昵鳎” “怎么了？”我有些...
開封第一講書人閱讀 164,411評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵剂习，是天一觀的道長(zhǎng)蛮位。經(jīng)常有香客問我，道長(zhǎng)鳞绕，這世上最難降的妖魔是什么失仁？我笑而不...
開封第一講書人閱讀 58,622評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮们何，結(jié)果婚禮上陶因，老公的妹妹穿的比我還像新娘。我一直安慰自己垂蜗，他們只是感情好楷扬，可當(dāng)我...
茶點(diǎn)故事閱讀 67,661評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著贴见，像睡著了一般烘苹。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上片部，一...
開封第一講書人閱讀 51,521評(píng)論 1贊 304
城市分裂傳說
那天镣衡，我揣著相機(jī)與錄音，去河邊找鬼。笑死廊鸥，一個(gè)胖子當(dāng)著我的面吹牛望浩，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播惰说，決...
沈念sama閱讀 40,288評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼磨德，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了吆视？” 一聲冷哼從身側(cè)響起典挑，我...
開封第一講書人閱讀 39,200評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎啦吧，沒想到半個(gè)月后您觉，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,644評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡授滓，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,837評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年琳水，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片般堆。...
茶點(diǎn)故事閱讀 39,953評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡炫刷，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出郁妈，到底是詐尸還是另有隱情，我是刑警寧澤绍申，帶...
沈念sama閱讀 35,673評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布噩咪，位于F島的核電站，受9級(jí)特大地震影響极阅，放射性物質(zhì)發(fā)生泄漏胃碾。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,281評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一筋搏、第九天我趴在偏房一處隱蔽的房頂上張望仆百。院中可真熱鬧，春花似錦奔脐、人聲如沸俄周。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,889評(píng)論 0贊 22
一樁弒父案髓迎，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽峦朗。三九已至，卻和暖如春排龄，著一層夾襖步出監(jiān)牢的瞬間波势，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,011評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留尺铣，地道東北人拴曲。一個(gè)月前我還...
沈念sama閱讀 48,119評(píng)論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像凛忿，于是被迫代替她去往敵國(guó)和親澈灼。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,901評(píng)論 2贊 355

Fast R-CNN

推薦閱讀更多精彩內(nèi)容