本文相關(guān)
-
Paper Summary
:https://github.com/FDU-VTS/CVPaper -
Code
:https://github.com/FDU-VTS/CVCode
原文鏈接
定義
- region proposal(region of interest): 候選區(qū)域
- ground truth: 樣本區(qū)域
- IoU: 計(jì)算重疊面積 = (A∩B) / (A∪B)
算法流程
CNN訓(xùn)練
- 數(shù)據(jù)集準(zhǔn)備
- 選取訓(xùn)練集中的
ground truth
,并使用selective search
計(jì)算出region proposals
- 計(jì)算
ground truth
和roi
之間的IoU
,選取其中值大于0.5的roi
s,然后選取25%計(jì)入正樣本中 - 第二步中
IoU
小于0.5中選取正樣本3倍的數(shù)量記為background
- 選取訓(xùn)練集中的
- 訓(xùn)練網(wǎng)絡(luò)
-
alex_net
/VGG-16
-
- 損失函數(shù)
- cross entropy
SVM訓(xùn)練
- 數(shù)據(jù)集準(zhǔn)備
- 按照CNN訓(xùn)練中的,不過這次挑選
IoU
大于0.5的proposals
, 和ground truth
一起組成正樣本集合 -
IoU
小于0.3的歸為負(fù)樣本集合
- 按照CNN訓(xùn)練中的,不過這次挑選
- 訓(xùn)練m個(gè)類別的SVM
bounding box regression
- 坐標(biāo)和尺度變換:
- 損失函數(shù)
- 正確值