目標(biāo)檢測(cè)算法經(jīng)典論文回顧（二）

第一篇 FCN

論文題目：Fully Convolutional Networks for Semantic Segmentation

提出時(shí)間：2015年

論文地址：https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf

針對(duì)問(wèn)題：

過(guò)往的檢測(cè)網(wǎng)絡(luò)大都采用了全連接層來(lái)對(duì)CNN提取到的特征進(jìn)行處理轨帜。作者嘗試討論那能否設(shè)計(jì)一個(gè)全部由卷積層構(gòu)建的網(wǎng)絡(luò)模型疮装，來(lái)達(dá)到更精細(xì)的檢測(cè)效果展懈。

創(chuàng)新點(diǎn)：

設(shè)計(jì)了一種全卷機(jī)的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)對(duì)輸入圖像的像素級(jí)分割任務(wù)。采用反卷積層對(duì)最后一個(gè)卷積層的feature map進(jìn)行上采樣, 使它恢復(fù)到輸入圖像相同的尺寸逊抡，從而可以對(duì)每個(gè)像素都產(chǎn)生了一個(gè)預(yù)測(cè), 同時(shí)保留了原始輸入圖像中的空間信息, 最后在上采樣的特征圖上進(jìn)行逐像素分類南誊。最后逐個(gè)像素計(jì)算softmax分類的損失, 相當(dāng)于每一個(gè)像素對(duì)應(yīng)一個(gè)訓(xùn)練樣本了罪。

詳解博客：https://blog.csdn.net/qq_36269513/article/details/80420363

第二篇 OHEM

論文題目：Training Region-based Object Detectors with Online Hard Example Mining

提出時(shí)間：2016年

論文地址：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Shrivastava_Training_Region-Based_Object_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

本文作者的出發(fā)點(diǎn)是對(duì)faster rcnn論文算法的訓(xùn)練流程進(jìn)行改進(jìn)飒赃，從而提高該模型的檢測(cè)精度利花。該操作也側(cè)面說(shuō)明了網(wǎng)絡(luò)的訓(xùn)練過(guò)程，難例對(duì)模型性能提升是重要的盒揉。

創(chuàng)新點(diǎn)：

利用難例挖掘技術(shù)在CNN中的應(yīng)用來(lái)優(yōu)化訓(xùn)練流程晋被，從而使得Fast RCNN網(wǎng)絡(luò)模型的檢測(cè)精度提高。在第t次迭代時(shí)刚盈，輸入圖片到卷積網(wǎng)絡(luò)中得到特征圖，然后把特征圖和所有的RoIs輸入到RoI網(wǎng)絡(luò)中并計(jì)算所有RoIs的損失挂脑，把損失從高到低排序藕漱，然后選擇B/N個(gè)RoIs欲侮。這里有個(gè)小問(wèn)題，位置上相鄰的RoIs通過(guò)RoI網(wǎng)絡(luò)后會(huì)輸出相近的損失肋联，這樣損失就翻倍威蕉。作者為了解決這個(gè)問(wèn)題，使用了NMS(非最大值抑制)算法橄仍，先把損失按高到低排序韧涨，然后選擇最高的損失，并計(jì)算其他RoI這個(gè)RoI的IoU(交叉比)侮繁，移除IoU大于一定閾值的RoI虑粥，然后反復(fù)上述流程直到選擇了B/N個(gè)RoIs。

詳解博客：https://zhuanlan.zhihu.com/p/58162337

第三篇 YOLOv1

論文題目：You Only Look Once: Unified, Real-Time Object Detection

提出時(shí)間：2016年

論文地址：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Redmon_You_Only_Look_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

主流的檢測(cè)網(wǎng)絡(luò)都是兩段式的宪哩，因?yàn)橐忍崛∫伤颇繕?biāo)框娩贷，再對(duì)目標(biāo)框進(jìn)行精細(xì)定位和分類，所以耗時(shí)都會(huì)很高锁孟，那么能不能設(shè)計(jì)一種一段式的網(wǎng)絡(luò)彬祖，既能達(dá)到檢測(cè)的效果，又能降低耗時(shí)呢品抽？

創(chuàng)新點(diǎn)：

作者創(chuàng)新的提出了储笑，依賴回歸和在輸出特征圖上劃分grid直接進(jìn)行回歸和分類的網(wǎng)絡(luò)模型，從而去掉了顯式的提取疑似目標(biāo)框的流程圆恤，回歸的思路一定程度上突倍，可以參考第二章第二篇，該網(wǎng)絡(luò)模型設(shè)計(jì)思路降低了檢測(cè)流程的耗時(shí)哑了，形成了新的一段式檢測(cè)網(wǎng)絡(luò)設(shè)計(jì)模式赘方。

詳解博客：http://www.reibang.com/p/cad68ca85e27

第四篇 G-CNN

論文題目：G-CNN: an Iterative Grid Based Object Detector

提出時(shí)間：2016年

論文地址：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Najibi_G-CNN_An_Iterative_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

既然yolov1創(chuàng)新的提出了grid劃分網(wǎng)格并在網(wǎng)格內(nèi)直接回歸目標(biāo)框的思路來(lái)替換顯式提取目標(biāo)框的方案，那能不能將該方案應(yīng)用到兩段式的網(wǎng)絡(luò)模型中弱左，從而即利用了兩段式的精度又加快了速度窄陡？

創(chuàng)新點(diǎn)：

作者在fast rcnn上做試驗(yàn)，用grid來(lái)替換selective search算法拆火，并逐步迭代回歸到目標(biāo)的真實(shí)位置跳夭。

詳解博客：http://www.reibang.com/p/17139e4c5580

第五篇 AZ-Net

論文題目：Adaptive Object Detection Using Adjacency and ZoomPrediction

提出時(shí)間：2016年CVPR

論文地址：https://openaccess.thecvf.com/content_cvpr_2016/papers/Lu_Adaptive_Object_Detection_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

作者嘗試對(duì)faster rcnn中的RPN部分進(jìn)行優(yōu)化，主要是在保證精度的前提下们镜，提高該部分的目標(biāo)框提取速度币叹，從而實(shí)現(xiàn)對(duì)faster rcnn的優(yōu)化。

創(chuàng)新點(diǎn)：

AZ-net模狭，主要對(duì)深度檢測(cè)網(wǎng)絡(luò)中的RPN部分進(jìn)行優(yōu)化颈抚，利用遞歸的思路來(lái)避免生成Region proposal時(shí)候的大量重復(fù)操作和計(jì)算資源浪費(fèi)。也就是對(duì)輸入圖像分塊嚼鹉，再逐步向下分塊直到當(dāng)前塊判斷無(wú)目標(biāo)贩汉。

詳解博客：https://blog.csdn.net/qq_34135560/article/details/84951384

第六篇 Inside-OutsideNet

論文題目：Inside-OutsideNet:Detecting Objects in Context with Skip Poolingand Recurrent Neural Networks

提出時(shí)間：2016年

論文地址：https://openaccess.thecvf.com/content_cvpr_2016/papers/Bell_Inside-Outside_Net_Detecting_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

由第一章第九篇論文驱富，我們可以知悉網(wǎng)絡(luò)的淺層和深層所獲取到的圖像特征是從局部到整體逐漸抽象的。那么對(duì)最終的目標(biāo)檢測(cè)任務(wù)來(lái)說(shuō)匹舞，我們就需要淺層的特征信息來(lái)對(duì)較小目標(biāo)進(jìn)行檢測(cè)褐鸥，還需要深層的特征信息來(lái)對(duì)較大目標(biāo)實(shí)現(xiàn)檢測(cè)，如何協(xié)調(diào)淺層和深層的特征來(lái)達(dá)到對(duì)不同尺度的目標(biāo)都比較好的檢測(cè)效果呢赐稽？

創(chuàng)新點(diǎn)：

提取不同層的特征叫榕，經(jīng)過(guò)L2正則后拼接，并使用了iRNN結(jié)構(gòu)來(lái)提高檢測(cè)效果姊舵，是2016年精度最高的監(jiān)測(cè)模型晰绎，最早的利用多層特征融合來(lái)進(jìn)行檢測(cè)的論文。

詳解博客：https://blog.csdn.net/u014119694/article/details/88423331

第七篇 HyperNet

論文題目：HyperNet: Towards Accurate Region Proposal Generationand Joint Object Detection

提出時(shí)間：2016年

論文地址：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Kong_HyperNet_Towards_Accurate_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

有faster rcnn網(wǎng)絡(luò)里的RPN子網(wǎng)絡(luò)以后蠢莺，雖然將先驗(yàn)的目標(biāo)框從幾千減少到了幾百寒匙，但是還是存在著大量的冗余，如何近一步提高先驗(yàn)框提取部分的性能并改進(jìn)檢測(cè)網(wǎng)絡(luò)躏将？

創(chuàng)新點(diǎn)：

作者嘗試跳層提取特征锄弱，即分別從網(wǎng)絡(luò)的淺層和深層提取特征。既能獲取高層語(yǔ)義祸憋，又可以得到低層高分辨率的位置信息会宪。提高小目標(biāo)檢測(cè)效果。

詳解博客：https://blog.csdn.net/qq_35608277/article/details/80432907

第八篇 CRAFT

論文題目：CRAFT Objects from Images

提出時(shí)間：2016年

論文地址：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Yang_CRAFT_Objects_From_CVPR_2016_paper.pdf

針對(duì)問(wèn)題：

作者在本篇論文中蚯窥，認(rèn)為faster rcnn網(wǎng)絡(luò)模型仍舊存在改進(jìn)的空間掸鹅，通過(guò)任務(wù)細(xì)化，來(lái)改進(jìn)網(wǎng)絡(luò)RPN部分和分類部分的性能拦赠。

創(chuàng)新點(diǎn)：

對(duì)于生成目標(biāo)proposals階段巍沙，論文在RPN的后面加了一個(gè)二值的Fast RCNN分類器來(lái)對(duì)RPN生成的proposals進(jìn)行進(jìn)一步的篩選，留下一些高質(zhì)量的proposals荷鼠；對(duì)于第二階段的目標(biāo)proposals分類句携，論文在原來(lái)的分類器后又級(jí)聯(lián)了N個(gè)類別(不包含背景類)的二值分類器以進(jìn)行更精細(xì)的目標(biāo)檢測(cè)

詳解博客：https://blog.csdn.net/scarecrowliu/article/details/53067529

第九篇 MultiPathNet

論文題目：A MultiPath Network for Object Detection

提出時(shí)間：2016年

論文地址：https://arxiv.org/pdf/1604.02135.pdf

針對(duì)問(wèn)題：

本篇論文也是在總結(jié)跳層提取特征、輸入訓(xùn)練樣本的多個(gè)不同IOU等模型訓(xùn)練技巧的基礎(chǔ)上允乐，對(duì)faster rcnn模型進(jìn)行的改進(jìn)矮嫉。

創(chuàng)新點(diǎn)：

MPN網(wǎng)絡(luò)，是對(duì)Fast R-CNN的改進(jìn)牍疏，改進(jìn)的點(diǎn)主要有三個(gè)：

(1)跳躍結(jié)構(gòu)：在VGG網(wǎng)絡(luò)里蠢笋，從conv1到conv4，每層conv之后都有一次2*2的max pooling鳞陨，4次max pooling之后昨寞，特征圖將下采樣到原先的1/16，這會(huì)導(dǎo)致信息的丟失。所以將具有豐富信息的較早層連接至后面的網(wǎng)絡(luò)编矾。(2)中心區(qū)域：背景信息對(duì)于小目標(biāo)檢測(cè)識(shí)別來(lái)說(shuō)是很有用的熟史，所以作者使用了4種不同大小的region crops馁害，分別是1x窄俏，1.5x，2x和4x碘菜。在每種情況下凹蜈，使用RoI Pooling技術(shù)將它們固定到相同大小。送入全連接層忍啸。四個(gè)輸出連接成一個(gè)長(zhǎng)向量仰坦，用于打分和框回歸。(3)積分損失函數(shù)：Fast R-CNN里所有IoU>50%的proposals的得分是相等的计雌，作者改進(jìn)了損失函數(shù)悄晃，設(shè)置6個(gè)不同大小的IoU，分別計(jì)算得分然后求平均凿滤。這樣的話妈橄，IoU越高，得分就越高

詳解博客：https://blog.csdn.net/qq_37124765/article/details/54906517

第十篇 SSD

論文題目：SSD: Single Shot MultiBox Detector

提出時(shí)間：2016年ECCV

論文地址：https://link.springer.com/chapter/10.1007/978-3-319-46448-0_2

針對(duì)問(wèn)題：

一段式的網(wǎng)絡(luò)從yolov1推出以后翁脆，因其對(duì)遮擋多目標(biāo)檢測(cè)效果不理想眷蚓、小目標(biāo)檢測(cè)不理想等原因，仍舊存在很大的提升空間反番，本篇論文的作者通過(guò)結(jié)合多層特征的檢測(cè)結(jié)果沙热，對(duì)yolov1進(jìn)行改進(jìn)，從而增強(qiáng)其對(duì)目標(biāo)尤其是小目標(biāo)的檢測(cè)能力罢缸，成為了一段式檢測(cè)網(wǎng)絡(luò)的里程碑篙贸。

創(chuàng)新點(diǎn)：

繼yolov1之后，一段式目標(biāo)檢測(cè)的又一里程碑枫疆，相較于yolov1爵川，采用了多個(gè)卷積層的特征來(lái)進(jìn)行檢測(cè)，顯著提升對(duì)小目標(biāo)的檢測(cè)能力养铸；第二點(diǎn)是引入了初始框的設(shè)計(jì)雁芙，也就是對(duì)用于檢測(cè)的特征圖，也就是說(shuō)在每個(gè)特征圖的單元格的中心設(shè)置一系列尺度和大小不同的初始框钞螟，這些初始框都會(huì)反向映射到原圖的某一個(gè)位置兔甘，如果某個(gè)初始框的位置正好和真實(shí)目標(biāo)框的位置重疊度很高，那么就通過(guò)損失函數(shù)預(yù)測(cè)這個(gè)初始框的類別鳞滨，同時(shí)對(duì)這些初始框的形狀進(jìn)行微調(diào)洞焙，以使其符合我們標(biāo)記的真實(shí)目標(biāo)框。以這種設(shè)計(jì)來(lái)完成一段式網(wǎng)絡(luò)的anchor設(shè)定。

詳解博客：https://blog.csdn.net/u013044310/article/details/89380273

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

禁止轉(zhuǎn)載澡匪，如需轉(zhuǎn)載請(qǐng)通過(guò)簡(jiǎn)信或評(píng)論聯(lián)系作者熔任。

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市唁情，隨后出現(xiàn)的幾起案子疑苔，更是在濱河造成了極大的恐慌，老刑警劉巖甸鸟，帶你破解...
沈念sama閱讀 218,546評(píng)論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件惦费，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡抢韭，警方通過(guò)查閱死者的電腦和手機(jī)薪贫，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)刻恭，“玉大人瞧省，你說(shuō)我怎么就攤上這事△⒓郑” “怎么了鞍匾？”我有些...
開封第一講書人閱讀 164,911評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)贾漏。經(jīng)常有香客問(wèn)我候学，道長(zhǎng)，這世上最難降的妖魔是什么纵散？我笑而不...
開封第一講書人閱讀 58,737評(píng)論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任梳码，我火速辦了婚禮，結(jié)果婚禮上伍掀，老公的妹妹穿的比我還像新娘掰茶。我一直安慰自己，他們只是感情好蜜笤，可當(dāng)我...
茶點(diǎn)故事閱讀 67,753評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布濒蒋。她就那樣靜靜地躺著，像睡著了一般把兔。火紅的嫁衣襯著肌膚如雪沪伙。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,598評(píng)論 1贊 305
城市分裂傳說(shuō)
那天县好，我揣著相機(jī)與錄音围橡，去河邊找鬼。笑死缕贡，一個(gè)胖子當(dāng)著我的面吹牛翁授，可吹牛的內(nèi)容都是我干的拣播。我是一名探鬼主播，決...
沈念sama閱讀 40,338評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼收擦，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼贮配！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起塞赂，我...
開封第一講書人閱讀 39,249評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤泪勒，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后减途，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體酣藻，經(jīng)...
沈念sama閱讀 45,696評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,888評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年鳍置，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片送淆。...
茶點(diǎn)故事閱讀 40,013評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡税产，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出偷崩，到底是詐尸還是另有隱情辟拷，我是刑警寧澤，帶...
沈念sama閱讀 35,731評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布阐斜，位于F島的核電站衫冻，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏谒出。R本人自食惡果不足惜隅俘，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,348評(píng)論 3贊 330
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望笤喳。院中可真熱鬧为居，春花似錦、人聲如沸杀狡。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)呜象。三九已至膳凝，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間恭陡，已是汗流浹背蹬音。一陣腳步聲響...
開封第一講書人閱讀 33,048評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留子姜，地道東北人祟绊。一個(gè)月前我還...
沈念sama閱讀 48,203評(píng)論 3贊 370
代替公主和親
正文我出身青樓楼入，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親牧抽。傳聞我的和親對(duì)象是個(gè)殘疾皇子嘉熊，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,960評(píng)論 2贊 355

目標(biāo)檢測(cè)算法經(jīng)典論文回顧（二）

第一篇 FCN

第二篇 OHEM

第三篇 YOLOv1

第四篇 G-CNN

第五篇 AZ-Net

第六篇 Inside-OutsideNet

第七篇 HyperNet

第八篇 CRAFT

第九篇 MultiPathNet

第十篇 SSD

推薦閱讀更多精彩內(nèi)容