檢測資源合集http://objectdetection.cn/2018/05/14/awesome-object-detection/
R-CNN
這位博主寫的真好趁舀,沒有找到源頭,這里地址也是轉(zhuǎn)載的https://blog.csdn.net/weixin_41923961/article/details/80246244
Fast-RCNN
關(guān)于ROI池化層解釋https://blog.csdn.net/gusui7202/article/details/80651416
1.將圖片用選擇搜索算法(selective search)得到2000個候選區(qū)域(region proposals)的坐標信息祝沸。
2.將整張圖片歸一化224*224輸入到CNN 矮烹,整張圖片送入CNN。
3.圖片然后經(jīng)過5層卷積操作后罩锐,得到一張?zhí)卣鲌D奉狈。(feature maps),利用開始得到的坐標(步驟1)通過一定的映射關(guān)系轉(zhuǎn)換為對應(yīng)特征圖上的坐標涩惑,截取對應(yīng)的候選區(qū)域仁期。
4.每個候選區(qū)經(jīng)過RoI pooling后提取到固定長度的特征向量如上圖3*3的特征,送入全連接層竭恬。
5.然后分別經(jīng)過為21和84維的全連接層(并列的跛蛋,前者是分類輸出,后者是回歸輸出)痊硕。一個為多個目標類生成softmax概率估計赊级,而另一個為每個目標類生成4個實數(shù)值。這4個數(shù)字表示每個目標的邊界框的位置岔绸。
優(yōu)點
不需要先分類再回歸(R-CNN 中的步驟5和6),將這兩個任務(wù)合并
Fast R-CNN通過CNN直接獲取整張圖像的特征圖理逊,再使用RoI Pooling Layer在特征圖上獲取對應(yīng)每個候選框的特征,避免了R-CNN中的對每個候選框串行進行卷積(耗時較長)
Faster-RCNN
Faster R-CNN 取代selective search盒揉,直接通過一個網(wǎng)絡(luò)學(xué)習(xí)【Region Proposal Network (RPN)】生成待檢測區(qū)域晋被。
Object Instance Mining for WeaklySupervised Object Detection
挖掘可靠的proposal