? ? ? ? 由于SSD的主干網(wǎng)絡(luò)是VGG16掘而,出于對(duì)“低層features map的感受野較小,高層的感受野較大”的結(jié)論進(jìn)行挖掘员寇,因此對(duì)VGG16網(wǎng)絡(luò)中的感受野進(jìn)行了計(jì)算昧穿。
1.什么是感受野
? ? ? 感受野的定義:神經(jīng)網(wǎng)絡(luò)中每一層輸出特征圖上的像素點(diǎn)在輸入圖片上的映射的區(qū)域大小,也就是特征圖上的每一個(gè)點(diǎn)對(duì)應(yīng)的輸入圖片的區(qū)域署尤。
2.怎樣計(jì)算感受野
? 感受野的計(jì)算公式:
? 即:第i層的感受野的結(jié)果與i-1層結(jié)果以及i層的步長和卷積核大小有關(guān)
? 從公式即可解釋結(jié)論
3.具體事例計(jì)算感受野
? 先具體的我以VGG16網(wǎng)絡(luò)來計(jì)算一下:
? 在VGG16中:pool5中
pool5:RF=2
conv5_3 :RF=(2-1)*1+3=4
conv5_2 :? RF=(4-1)*1+3=6
conv5_2:? ? RF=(6-1)*1+3=8
conv5_1:? ? RF=(8-1)*2+2=16
pool4? ? :? ? RF=(8-1)*2+2=16
conv4_3:? ? RF=(16-1)*1+3=18
conv4_2:? ? RF=(18-1)*1+3=20
conv4_1 :? RF=(20-1)*1+3=22
pool3:? ? ? ? RF=(22-1)*2+2=44
conv3_3:? ? RF=(44-1)*1+3=46
conv3_2:? ? RF=(46-1)*1+3=48
conv3_1:? ? RF=(48-1)*1+3=50
pool2:? ? ? ? RF=(50-1)*2+2=100
conv2_2:? ? RF=(150-1)*1+3=152
conv2_1:? ? RF=(152-1)*1+3=154
pool1:? ? ? ? RF=(154-1)*2+2=208
conv1_2:? ? RF=(208-1)*1+3=210
conv1_1:? ? RF=(210-1)*1+3=212
計(jì)算結(jié)果為:pool5輸出的特征圖在輸入圖片上的感受野為212*212
具體每一層情況如下圖:
下一步將對(duì)SSD每一特征圖的感受野進(jìn)行計(jì)算耙替,以及SSD網(wǎng)絡(luò)的學(xué)習(xí)。
以上如有錯(cuò)誤曹体,謝謝大家指正