Fast R-CNN存在瓶頸:
SS(選擇性搜索)導(dǎo)致要找出所有的候選框苗胀,這個過程非常耗時搞乏。
Faster R-CNN
可以簡單看成是 區(qū)域生成網(wǎng)絡(luò) + Fast R-CNN
區(qū)域生成網(wǎng)絡(luò)(RPN)
步驟
1、輸入任意大小圖片
2哮幢、圖片首先會經(jīng)過一個預(yù)訓(xùn)練過的卷積特征提取層來提取圖片的特征畸裳,這里會輸出圖片的特征圖feature map箱靴,用作下一階段的輸入
3、通過一個叫做Region Proposal Network(RPN)的網(wǎng)絡(luò)著拭,替代了SS纱扭,RPN可以幫我們找出可能包含物體的那些區(qū)域(僅僅是找出可能包含物體的區(qū)域,這里不區(qū)分物體的種類)
RPN通過使用固定大小的anchor(參考框)來解決這個可變長的問題儡遮,這些anchor將會均勻地放置在整個原始圖像中(后面會詳細(xì)展開解釋)乳蛾。不同于原來我們要檢測物體在哪里,我們現(xiàn)在利用anchor將問題轉(zhuǎn)換為另外兩部分:
某個框內(nèi)是否含有物體
某個框是否框的準(zhǔn)鄙币,如果框的不準(zhǔn)我們要如何調(diào)整框
4屡久、通過RPN之后我們會獲得一些可能含有物體的框,我們用這些框再結(jié)合第一部分原圖片提取的特征圖爱榔,使用RoI(Region of Interest)就可以將對應(yīng)物體找出來并把他們的特征提取到新的張量里面進行分類
5被环、后續(xù)和fast-RCNN一樣
faster r-cnn的訓(xùn)練
faster r-cnn的訓(xùn)練分為兩部分,即兩個網(wǎng)絡(luò)的訓(xùn)練详幽。
classification over classes 所有類別加1
regression bbox