目標(biāo)檢測(cè)研究綜述+LocNet: Improving Localization Accuracy for Object Detection CVPR2016 閱讀

一. localization accuracy

更準(zhǔn)確的bounding box孩等，提高IOU

二. 目標(biāo)檢測(cè)的發(fā)展

1. 傳統(tǒng)的目標(biāo)檢測(cè)（滑動(dòng)窗口的框架）：

(1).滑動(dòng)窗口
(2).提取特征（SIFT,HOG,LBP)
(3).分類器(SVM)

2. 基于深度學(xué)習(xí)的目標(biāo)檢測(cè):

具體發(fā)展

(1).R-CNN
Motivation：目標(biāo)檢測(cè)進(jìn)展緩慢杈笔，CNN在圖片分類中取得重大成功
Contribution：應(yīng)用CNN將檢測(cè)問(wèn)題轉(zhuǎn)化成分類問(wèn)題

RCNN

(2).SPPNet
Motivation：CNN要求輸入圖片尺寸固定
Contribution：引入SPP層解除固定尺寸約束

SPPNet

(3).Fast R-CNN
Motivation：候選框的重復(fù)計(jì)算問(wèn)題
Contribution：加入RoI池化層、將BB回歸融入網(wǎng)絡(luò)

Fast R-CNN

(4).faster RCNN
Motivation： Selective Search作為一個(gè)獨(dú)立的操作脾拆，速度依然不夠快
Contribution：拋棄了Selective Search，引入了RPN網(wǎng)絡(luò)誊稚，使得區(qū)域提名旗笔、分類、回歸一起共用卷積特征斩箫，從而得到了進(jìn)一步的加速吏砂。

faster rcnn

(5).YOLO
Motivation：先前提出的算法都是將檢測(cè)問(wèn)題轉(zhuǎn)化為分類解決
Contribution：將檢測(cè)回歸到回歸方法，提高實(shí)時(shí)性能

YOLO

(6).SSD
Motivation：yolo S×S的網(wǎng)格就是一個(gè)比較啟發(fā)式的策略,難以檢測(cè)小目標(biāo)
Contribution：借鑒了Faster R-CNN中的Anchor機(jī)制乘客，使用了多尺度特征金字塔

SSD

三.目標(biāo)檢測(cè)的幾個(gè)名詞

(1). MAP(mean average precision)

每一個(gè)類別都可以根據(jù)recall和precision繪制一條曲線狐血，那么AP就是該曲線下的面積，而mAP是多個(gè)類別AP的平均值易核，這個(gè)值介于0到1之間匈织，且越大越好。這個(gè)指標(biāo)是目標(biāo)檢測(cè)算法最為重要的一個(gè)牡直。

(2).IOU

綠色框是人工標(biāo)注的groundtruth缀匕，紅色框是目標(biāo)檢測(cè)算法最終給出的結(jié)果，顯然綠色框?qū)τ陲w機(jī)這個(gè)物體檢測(cè)的更加準(zhǔn)確（機(jī)翼機(jī)尾都全部包含在綠色框中）碰逸，IOU正是表達(dá)這種bounding box和groundtruth的差異的指標(biāo)乡小。算法產(chǎn)生的bbox VS 人工標(biāo)注的數(shù)據(jù)

IOU定義了兩個(gè)bounding box的重疊度，可以說(shuō)饵史，當(dāng)算法給出的框和人工標(biāo)注的框差異很小時(shí)劲件，或者說(shuō)重疊度很大時(shí)，可以說(shuō)算法產(chǎn)生的boundingbox就很準(zhǔn)確约急。
矩形框A零远、B的一個(gè)重合度IOU計(jì)算公式為：
IOU=(A∩B)/(A∪B)

(3). NMS(非極大值抑制)

目標(biāo)檢測(cè)算法一般會(huì)給出目標(biāo)很多的粗略結(jié)果，對(duì)一個(gè)目標(biāo)成百上千的粗略結(jié)果都進(jìn)行調(diào)整肯定是不可行的厌蔽。那么我們就需要對(duì)這些粗略結(jié)果先進(jìn)行一個(gè)大體的挑選牵辣。挑選出其中最具代表性的結(jié)果。再對(duì)這些挑選后的結(jié)果進(jìn)行調(diào)整奴饮，這樣可以加快算法效率纬向。
消除多余的框择浊，找到最佳的bbox
根據(jù)這些框的分類器類別分類概率做排序: A<B<C<D<E<F
(1)從最大概率矩形框F開始，分別判斷A~E與F的重疊度IOU是否大于某個(gè)設(shè)定的閾值;

(2)假設(shè)B逾条、D與F的重疊度超過(guò)閾值琢岩，那么就扔掉B、D师脂；并標(biāo)記第一個(gè)矩形框F担孔，是我們保留下來(lái)的。

(3)從剩下的矩形框A吃警、C糕篇、E中，選擇概率最大的E酌心，然后判斷E與A拌消、C的重疊度，重疊度大于一定的閾值安券，那么就扔掉墩崩；并標(biāo)記E是我們保留下來(lái)的第二個(gè)矩形框。

就這樣一直重復(fù)侯勉，找到所有被保留下來(lái)的矩形框

(4) 邊界框回歸(Bounding-box regression )

由前面介紹的IOU指標(biāo)可知鹦筹，這里算法給出的紅色框可以認(rèn)為是檢測(cè)失敗的，因?yàn)樗途G色的groundtruth的 IOU值小于了0.5壳鹤，也就是說(shuō)重疊度不夠盛龄。那么我們就需要對(duì)這個(gè)紅色框進(jìn)行微調(diào)。使得經(jīng)過(guò)微調(diào)后的窗口跟Ground Truth 更接近芳誓。

紅色的框 P 代表原始的Proposal
**綠色的框 G **代表目標(biāo)的 Ground Truth
目標(biāo)是：尋找一種關(guān)系使得輸入原始的窗口 P 經(jīng)過(guò)映射得到一個(gè)跟真實(shí)窗口 G 更接近的回歸窗口 G~
G~≈G

四. 從cvpr2016看目標(biāo)檢測(cè)的發(fā)展趨勢(shì)

（a）檢測(cè)精度
如何提高檢測(cè)精度的指標(biāo)mAP余舶？
代表性的工作是ResNet、ION和HyperNet

（b）識(shí)別效率
如何提高檢測(cè)速度锹淌？
YOLO：這個(gè)工作在識(shí)別效率方面的優(yōu)勢(shì)很明顯匿值，可以做到每秒鐘45幀圖像，處理視頻是完全沒(méi)有問(wèn)題的

（c）定位精度
如何產(chǎn)生更準(zhǔn)確的bounding box? 如何逐步提高評(píng)價(jià)參數(shù)IOU赂摆？（Pascal VOC中挟憔，這個(gè)值為0.5）
LocNet：拋棄boundingbox回歸，利用概率模型（本文）

從單純的一律追求檢測(cè)精度烟号，到想方法加快檢測(cè)結(jié)果绊谭，到最后追求更加準(zhǔn)確的結(jié)果。側(cè)面反映了目標(biāo)檢測(cè)研究的不斷進(jìn)步*汪拥。

五. LocNet: Improving Localization Accuracy for Object Detection

1. background

localization accuracy 少人問(wèn)津
PASCAL VOC IOU=0.5 (object has been successfully detected)
Real life higher localization accuracy (e.g. IoU> 0.7) is normally required
COCO detection challenge 把IOU值也作為了最終的評(píng)價(jià)指標(biāo)（MAP+IOU）
提高目標(biāo)檢測(cè)的IOU（而不僅是MAP）將會(huì)成為未來(lái)目標(biāo)檢測(cè)的主要挑戰(zhàn)达传。
傳統(tǒng)的bbox回歸：嘗試直接通過(guò)回歸的方式直接得到bbox的坐標(biāo)，很難得到很準(zhǔn)確的bbox。

2. Contributions

可以很方便的和現(xiàn)在最先進(jìn)的目標(biāo)檢測(cè)系統(tǒng)結(jié)合
提出了兩種基于行列的概率模型解決定位準(zhǔn)確率宪赶，而不是回歸的方式宗弯，并與回歸方式進(jìn)行了
對(duì)比
對(duì)傳統(tǒng)方法和最先進(jìn)的方法不同iou下的map都有所提高
未來(lái)可以完全取代bbox回歸的方法

3.兩種概率模型

黃色框是檢測(cè)系統(tǒng)給出的，紅色框是由黃色框擴(kuò)大常數(shù)倍得到的search region搂妻，LOCNet會(huì)在這個(gè)搜索區(qū)域建立概率模型得到最終的定位區(qū)域藍(lán)色框

邊界概率：
計(jì)算該行或該列是目標(biāo)邊界的概率（所以蒙保，行列兩個(gè)概率圖各選兩個(gè)極大值，即可得到目標(biāo)邊界）
in-out概率：
計(jì)算目標(biāo)在該行或該列的概率（所以欲主，行列兩個(gè)概率圖分別選擇最高并且最平滑的區(qū)域邓厕，即可得到目標(biāo)的區(qū)域）

4. detection pipeline

輸入的候選bounding box（使用selective search或者sliding windows獲得），通過(guò)迭代的方法岛蚤，獲得更精確的box
兩個(gè)過(guò)程：

Recognition model：

輸入候選box

為每個(gè)box產(chǎn)生一個(gè)置信度

Localization model：

輸入候選box

調(diào)整box的邊界生成新的候選box

為降低算法復(fù)雜度邑狸，會(huì)參與一個(gè)后處理NMS操作懈糯。

5. Model predictions

輸入的box涤妒，把它擴(kuò)大一個(gè)因子的倍數(shù)，獲取一個(gè)更大的區(qū)域R赚哗，區(qū)域R劃分成M*M的格子

In-Out probabilities

產(chǎn)生兩個(gè)概率她紫，分別代表區(qū)域R的每一行或者列包含在bounding box中的概率

ground truth box而言，對(duì)于邊界內(nèi)的行或列概率為1屿储，否則為0

**Border probabilities **

產(chǎn)生4個(gè)概率贿讹，left (l), right (r), top (t) and bottom (b)

ground truth box

6. Network Architecture

（1）對(duì)于輸入的box，把它擴(kuò)大一個(gè)因子的倍數(shù)够掠，獲取一個(gè)更大的區(qū)域R民褂，把R投影到feature map中
（2）經(jīng)過(guò)一個(gè)類似于ROI pooling的層，輸出固定大小的map
（3）經(jīng)過(guò)幾個(gè)卷積層和ReLU激活之后疯潭，出現(xiàn)兩個(gè)分支赊堪，分別對(duì)應(yīng)兩個(gè)向量。然后經(jīng)過(guò)max pooling得到
row竖哩、column對(duì)應(yīng)的向量

（4）經(jīng)過(guò)FC層之后哭廉，使用sigmoid函數(shù)輸出In –Out概率或者邊界概率

7.Loss function

每行或列有兩種可能（是或者不是），伯努利分布的模型相叁，log對(duì)數(shù)損失函數(shù)假設(shè)樣本服從伯努
利分布（0-1分布）

logistic 回歸常用的損失函數(shù)交叉熵

In-Out

Borders

平衡因子遵绰，因?yàn)樽鳛檫吔绲男谢蛄休^少，所以增大他們的權(quán)重

8.results

結(jié)果表明增淹，與不同的檢測(cè)系統(tǒng)結(jié)合椿访，基于邊界概率的模型在不同的IOU下都提高了mAP值，并且效果優(yōu)于bbox回歸虑润。

不同IOU下的MAP

我的另一篇關(guān)于Object Detection的文章

最后編輯于：2017.12.04 12:30:37

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末成玫，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌梁剔，老刑警劉巖虽画，帶你破解...
沈念sama閱讀 206,839評(píng)論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異荣病，居然都是意外死亡码撰，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門个盆，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)脖岛，“玉大人，你說(shuō)我怎么就攤上這事颊亮〔癜穑” “怎么了？”我有些...
開封第一講書人閱讀 153,116評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵终惑，是天一觀的道長(zhǎng)绍在。經(jīng)常有香客問(wèn)我，道長(zhǎng)雹有，這世上最難降的妖魔是什么偿渡？我笑而不...
開封第一講書人閱讀 55,371評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮霸奕，結(jié)果婚禮上溜宽，老公的妹妹穿的比我還像新娘。我一直安慰自己质帅，他們只是感情好适揉，可當(dāng)我...
茶點(diǎn)故事閱讀 64,384評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布。她就那樣靜靜地躺著煤惩，像睡著了一般嫉嘀。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上盟庞，一...
開封第一講書人閱讀 49,111評(píng)論 1贊 285
城市分裂傳說(shuō)
那天吃沪，我揣著相機(jī)與錄音，去河邊找鬼什猖。笑死票彪，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的不狮。我是一名探鬼主播降铸，決...
沈念sama閱讀 38,416評(píng)論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼摇零！你這毒婦竟也來(lái)了推掸？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,053評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎谅畅，沒(méi)想到半個(gè)月后登渣，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,558評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡毡泻，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,007評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年胜茧，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仇味。...
茶點(diǎn)故事閱讀 38,117評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡呻顽，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出丹墨，到底是詐尸還是另有隱情廊遍，我是刑警寧澤，帶...
沈念sama閱讀 33,756評(píng)論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布贩挣，位于F島的核電站喉前，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏揽惹。R本人自食惡果不足惜被饿，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,324評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一四康、第九天我趴在偏房一處隱蔽的房頂上張望搪搏。院中可真熱鬧，春花似錦闪金、人聲如沸疯溺。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評(píng)論 0贊 19
一樁弒父案哎垦，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)囱嫩。三九已至，卻和暖如春漏设，著一層夾襖步出監(jiān)牢的瞬間墨闲，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,539評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工郑口，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留鸳碧，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,578評(píng)論 2贊 355
代替公主和親
正文我出身青樓犬性，卻偏偏與公主長(zhǎng)得像瞻离，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子乒裆，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,877評(píng)論 2贊 345