1.下載VOC數(shù)據(jù)集
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
2.按照順序解壓VOC數(shù)據(jù)集贝淤,以防解壓后格式錯誤
tar xvf VOCtrainval_06-Nov-2007.tar
tar xvf VOCtest_06-Nov-2007.tar
tar xvf VOCdevkit_08-Jun-2007.tar
3.解壓后生成VOCdevkit目錄,結(jié)構(gòu)如下
$VOCdevkit/? ? ? ? ? ? ? ? ? ? # development kit
$VOCdevkit/VOCcode/? ? ? ? ? ? ? ? ? # VOC utility code
$VOCdevkit/VOC2007? ? ? ? ? ? ? ? ? # image sets, annotations, etc.
# ... and several other directories ...
4.在FRCN根路徑下的data目錄放棒,創(chuàng)建VOCdevkit2007鏈接(快捷方式)
cd $FRCN_ROOT/data
ln -s $VOCdevkit VOCdevkit2007
5.下載預(yù)訓(xùn)練的VGG16網(wǎng)絡(luò).復(fù)制該網(wǎng)絡(luò)文件到如下路徑
mv VGG_imagenet.npy $FRCN_ROOT/data/pretrain_model/VGG_imagenet.npy
6.運行命令谍咆,訓(xùn)練模型測試模型
cd $FRCN_ROOT/experiments/scripts/faster_rcnn_end2end.sh $DEVICE $DEVICE_ID VGG16 pascal_voc
相關(guān)背景知識
-RCNN、Fast RCNN哼转、Faster RCNN
? 1.? RCNN到fast RCNN沮峡,再到faster RCNN吮旅,目標(biāo)檢測的四個基本步驟(候選區(qū)域生成抖坪,特征提取萍鲸,分類,位置精修)終于被統(tǒng)一到一個深度網(wǎng)絡(luò)框架之內(nèi)擦俐。所有計算沒有重復(fù)脊阴,完全在GPU中完成,大大提高了運行速度。
? 2.原始特征提群倨凇(上圖灰色方框)包含若干層conv+relu品擎,直接套用ImageNet上常見的分類網(wǎng)絡(luò)即可。如本文步驟5秽五,就是直接調(diào)用VGG16
? ? 3.VGG16: VGG16 的叫法來自于 網(wǎng)絡(luò)包含 16 層卷積孽查,包括 13層的卷積+3層的全連接,如下圖:
? ? 4.詳細的結(jié)構(gòu)信息的閱讀參考:VGG16深度學(xué)習(xí)入門:https://blog.csdn.net/Errors_In_Life/article/details/65950699
- VOC2007結(jié)構(gòu)詳解
? ? - 文件存放內(nèi)容如下:
? ? - Annotations目錄下放的是標(biāo)注文件饥悴,xml格式坦喘,這是用于目標(biāo)檢測任務(wù)的一個總的標(biāo)注集合,里面存放有大而全的xml文件西设;具體是在ImageSets/Main目錄中去劃分訓(xùn)練機瓣铣、驗證集、測試集贷揽;
? ? - JPEGImages目錄下是所有的jpg圖片棠笑;
? ? - ImageSets目錄下有3個子目錄:Layout, Main, Segmentation
? ? - Main 目錄下每一行都是同一文件名+后綴(train、val禽绪、trainval蓖救、test),分別對應(yīng)來自JPEGImages的同名文件和對應(yīng)來自Annotation里的標(biāo)注文件