RCNN算法分為4個(gè)步驟 :
- 候選區(qū)域生成: 一張圖像生成1K~2K個(gè)候選區(qū)域 (采用Selective Search 方法)
- 特征提戎搿: 對每個(gè)候選區(qū)域番宁,使用深度卷積網(wǎng)絡(luò)提取特征 (CNN)
- 類別判斷: 特征送入每一類的SVM 分類器,判別是否屬于該類
- 位置精修: 使用回歸器精細(xì)修正候選框位置
RCNN :許多候選框(比如兩千個(gè))-->CNN-->得到每個(gè)候選框的特征-->分類+回歸赖阻;
Fast RCNN :一張完整圖片-->CNN-->得到每張候選框的特征-->分類+回歸蝶押;
Faster R-CNN:基于Fast RCNN的問題做出了改進(jìn);
------Fast R-CNN存在的問題:存在瓶頸火欧,選擇性搜索棋电,找出所有的候選框,這個(gè)也非常耗時(shí)苇侵。那我們能不能找出一個(gè)更加高效的方法來求出這些候選框呢赶盔?
解決:加入一個(gè)提取邊緣的神經(jīng)網(wǎng)絡(luò),也就說找到候選框的工作也交給神經(jīng)網(wǎng)絡(luò)來做了衅檀。
做這樣的任務(wù)的神經(jīng)網(wǎng)絡(luò)叫做區(qū)域生成網(wǎng)絡(luò)Region Proposal Network(RPN)招刨,是一個(gè)全卷積網(wǎng)絡(luò)霎俩。
Faster R-CNN具體做法:
? 將RPN放在最后一個(gè)卷積層的后面
? RPN直接訓(xùn)練得到候選區(qū)域
最后總結(jié)一下各大算法的步驟:
RCNN:
1. 在圖像中確定約1000-2000個(gè)候選框 (使用選擇性搜索)
2. 每個(gè)候選框內(nèi)圖像塊縮放至相同大小哀军,并輸入到CNN內(nèi)進(jìn)行特征提取
3. 對候選框中提取出的特征,使用分類器判別是否屬于一個(gè)特定類
4. 對于屬于某一特征的候選框打却,用回歸器進(jìn)一步調(diào)整其位置
Fast RCNN:
1. 在圖像中確定約1000-2000個(gè)候選框 (使用選擇性搜索)
2. 對整張圖片輸進(jìn)CNN杉适,得到feature map
3. 找到每個(gè)候選框在feature map上的映射patch,將此patch作為每個(gè)候選框的卷積特征輸入到SPP layer和之后的層
4. 對候選框中提取出的特征柳击,使用分類器判別是否屬于一個(gè)特定類
5. 對于屬于某一特征的候選框猿推,用回歸器進(jìn)一步調(diào)整其位置
Faster RCNN:
1. 對整張圖片輸進(jìn)CNN,得到feature map
2. 卷積特征輸入到區(qū)域生成網(wǎng)絡(luò)RPN捌肴,得到候選框的特征信息
3. 對候選框中提取出的特征蹬叭,使用分類器判別是否屬于一個(gè)特定類
4. 對于屬于某一特征的候選框,用回歸器進(jìn)一步調(diào)整其位置