原文鏈接:http://www.cnblogs.com/sandy-t/p/7208568.html
RCNN:
候選區(qū)生成(Selective Search)。
分割成2000左右的候選小區(qū)域
合并規(guī)則:顏色之众、紋理相近拙毫,尺度均勻,合并后形狀規(guī)則
特征提取棺禾。
歸一候選區(qū)尺寸為227×227缀蹄,歸一方法。
使用在imageNet上的分類網(wǎng)絡(luò)作為預(yù)訓(xùn)練網(wǎng)絡(luò)膘婶,預(yù)訓(xùn)練網(wǎng)絡(luò)輸出4096維特征
預(yù)訓(xùn)練網(wǎng)絡(luò)加上全連接層在分類數(shù)據(jù)集上預(yù)訓(xùn)練
每一類使用SVM分類器
對預(yù)訓(xùn)練網(wǎng)絡(luò)輸出的4096維特征缺前,使用多個SVM分類器進行判斷
對于負樣本過多的問題,使用hard negative mining悬襟,將重疊框小于閾值的作為負類衅码。
位置回歸
訓(xùn)練回歸器輸出x,y,d,h偏移量
fast RCNN
使用整張圖片傳入網(wǎng)絡(luò)提取特征
使用Selective search等方法得到候選區(qū)域,復(fù)用前面階段的網(wǎng)絡(luò)特征
對候選區(qū)使用Roi Pooling層規(guī)定尺寸圖像(全連接層需要相同大小的輸入)
輸入到兩個并行的全連接層中古胆,分別計算損失
例如:
對于輸入圖像:
候選區(qū)域:
最后一個卷積層:
放大
歸一尺寸的候選區(qū)域的特征:
和
faster RCNN
主要思想是使用最后一個卷積層來得到候選區(qū)域肆良,faster RCNN相當(dāng)于:候選區(qū)域生成網(wǎng)絡(luò)+fast RCNN。
特征提取網(wǎng)絡(luò)逸绎,VGG-16等惹恃。網(wǎng)絡(luò)輸出5139256維特征
使用3種面積,3種長寬總共9種候選窗口棺牧,稱為:anchor巫糙,如圖:
訓(xùn)練過程中有四種損失:
區(qū)域生成網(wǎng)絡(luò)的前后景分類損失(Object or not object)
區(qū)域生成網(wǎng)絡(luò)的區(qū)域位置損失(Bounding box proposal)
Fast RCNN物體分類損失(Normal object classification)
Fast RCNN區(qū)域位置損失(Improve previous Bounding box proposal)
訓(xùn)練方式:
輪流訓(xùn)練
近似聯(lián)合訓(xùn)練
聯(lián)合訓(xùn)練
整個結(jié)構(gòu):
有些人,一輩子都沒有得到過自己想要的颊乘,因為他們總是半途而廢