感謝 SIGAI 特約作者:mileistone
感受野是卷積神經(jīng)網(wǎng)絡(luò)里面最重要的概念之一枪芒,為了更好地理解卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)驼修,甚至自己設(shè)計卷積神經(jīng)網(wǎng)絡(luò)裆泳,對于感受野的理解必不可少熄浓。
一猾漫、定義
感受野被定義為卷積神經(jīng)網(wǎng)絡(luò)特征所能看到輸入圖像的區(qū)域寻行,換句話說特征輸出受感受野區(qū)域內(nèi)的像素點的影響霍掺。
比如下圖(該圖為了方便,將二維簡化為一維)拌蜘,這個三層的神經(jīng)卷積神經(jīng)網(wǎng)絡(luò)杆烁,每一層卷積核的????????????_???????? = 3?,???????????? = 1简卧,那么最上層特征所對應(yīng)的感受野就為如圖所示的7x7兔魂。
二、計算方式
第1層感受野[1]
第二層特征举娩,感受野為5
第2層感受野[1]
第三層特征析校,感受野為7
第3層感受野[1]
如果有dilated conv的話,計算公式為
三铜涉、更上一層樓
上文所述的是理論感受野智玻,而特征的有效感受野(實際起作用的感受野)實際上是遠(yuǎn)小于理論感受野的,如下圖所示芙代。具體數(shù)學(xué)分析比較復(fù)雜吊奢,不再贅述,感興趣的話可以參考論文[2]链蕊。
有效感受野示例[2]
兩層3x3 conv計算流程圖
四事甜、應(yīng)用
分類
Xudong Cao寫過一篇叫《A practical theory for designing very deep convolutional neural networks》的technical report,里面講設(shè)計基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類器時滔韵,為了保證得到不錯的效果逻谦,需要滿足兩個條件:
Firstly, for each convolutional layer, its capacity of learning more complex patterns should be guaranteed; Secondly,the receptive field of the top most layer should be no larger than the image region.
其中第二個條件就是對卷積神經(jīng)網(wǎng)絡(luò)最高層網(wǎng)絡(luò)特征感受野大小的限制。
目標(biāo)檢測
現(xiàn)在流行的目標(biāo)檢測網(wǎng)絡(luò)大部分都是基于anchor的陪蜻,比如SSD系列邦马,v2以后的yolo,還有faster rcnn系列宴卖。
基于anchor的目標(biāo)檢測網(wǎng)絡(luò)會預(yù)設(shè)一組大小不同的anchor滋将,比如32x32、64x64症昏、128x128随闽、256x256,這么多anchor肝谭,我們應(yīng)該放置在哪幾層比較合適呢掘宪?這個時候感受野的大小是一個重要的考慮因素蛾扇。
放置anchor層的特征感受野應(yīng)該跟anchor大小相匹配,感受野比anchor大太多不好魏滚,小太多也不好镀首。如果感受野比anchor小很多,就好比只給你一只腳鼠次,讓你說出這是什么鳥一樣更哄。如果感受野比anchor大很多,則好比給你一張世界地圖腥寇,讓你指出故宮在哪兒一樣成翩。
《S3FD: Single Shot Scale-invariant Face Detector》這篇人臉檢測器論文就是依據(jù)感受野來設(shè)計anchor的大小的一個例子,文中的原話是
we design anchor scales based onthe effective receptive field
《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》這篇論文在設(shè)計多尺度anchor的時候花颗,依據(jù)同樣是感受野捕传,文章的一個貢獻(xiàn)為
We introduce the Multiple Scale Convolutional Layers
(MSCL) to handle various scales of face viaenriching
receptive fields and discretizing anchors over layers
引用:
[1]convolutional nerual networks
[2]Understanding the Effective Receptive Field in Deep Convolutional Neural Networks
推薦閱讀:
關(guān)注SIGAICN公眾號,回復(fù)文章獲取碼扩劝,即可獲得全文鏈接
[1] 機(jī)器學(xué)習(xí)-波瀾壯闊40年 【獲取碼】SIGAI0413.
[2] 學(xué)好機(jī)器學(xué)習(xí)需要哪些數(shù)學(xué)知識?【獲取碼】SIGAI0417.
[3] 人臉識別算法演化史 【獲取碼】SIGAI0420.
[4] 基于深度學(xué)習(xí)的目標(biāo)檢測算法綜述 【獲取碼】SIGAI0424.
[5] 卷積神經(jīng)網(wǎng)絡(luò)為什么能夠稱霸計算機(jī)視覺領(lǐng)域职辅?【獲取碼】SIGAI0426.
[6] 用一張圖理解SVM的脈絡(luò) 【獲取碼】SIGAI0428.
[7] 人臉檢測算法綜述 【獲取碼】SIGAI0503.
[8] 理解神經(jīng)網(wǎng)絡(luò)的激活函數(shù) 【獲取碼】SIGAI0505.
[9] 深度卷積神經(jīng)網(wǎng)絡(luò)演化歷史及結(jié)構(gòu)改進(jìn)脈絡(luò)-40頁長文全面解讀 【獲取碼】SIGAI0508.
[10] 理解梯度下降法 【獲取碼】SIGAI0511.
[11] 循環(huán)神經(jīng)網(wǎng)絡(luò)綜述—語音識別與自然語言處理的利器 【獲取碼】SIGAI0515.
[12] 理解凸優(yōu)化 【獲取碼】SIGAI0518.
[13] 【實驗】理解SVM的核函數(shù)和參數(shù) 【獲取碼】SIGAI0522.
[14] 【SIGAI綜述】行人檢測算法 【獲取碼】SIGAI0525.
[15] 機(jī)器學(xué)習(xí)在自動駕駛中的應(yīng)用—以百度阿波羅平臺為例(上)【獲取碼】SIGAI0529.
[16] 理解牛頓法 SIGAI 2018.5.31
[17] 【群話題精華】5月集錦—機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中一些值得思考的問題 【獲取碼】SIGAI0601.
[18] 大話Adaboost算法 【獲取碼】SIGAI0602.
[19] FlowNet到FlowNet2.0:基于卷積神經(jīng)網(wǎng)絡(luò)的光流預(yù)測算法 【獲取碼】SIGAI0604.
[20] 理解主成分分析(PCA)【獲取碼】SIGAI0606.
[21] 人體骨骼關(guān)鍵點檢測綜述 【獲取碼】SIGAI0608.
[22] 理解決策樹 【獲取碼】SIGAI0611.
[23] 用一句話總結(jié)常用的機(jī)器學(xué)習(xí)算法 【獲取碼】SIGAI0613.
[24] 目標(biāo)檢測算法之YOLO 【獲取碼】SIGAI0615.
[25] 理解過擬合 【獲取碼】SIGAI0618.
[26] 理解計算:從√2到AlphaGo ——第1季 從√2談起 【獲取碼】SIGAI0620.
[27] 場景文本檢測——CTPN算法介紹 【獲取碼】SIGAI0622.
[28] 卷積神經(jīng)網(wǎng)絡(luò)的壓縮和加速 【獲取碼】SIGAI0625.
[29] k近鄰算法 【獲取碼】SIGAI0627.
[30] 自然場景文本檢測識別技術(shù)綜述 【獲取碼】SIGAI0629.
[31] 理解計算:從√2到AlphaGo ——第2季 神經(jīng)計算的歷史背景 【獲取碼】SIGAI0702.
[32] 機(jī)器學(xué)習(xí)算法地圖 【獲取碼】SIGAI0704.
[33]反向傳播算法推導(dǎo)-全連接神經(jīng)網(wǎng)絡(luò)【獲取碼】SIGAI0706.
[34]生成式對抗網(wǎng)絡(luò)模型綜述【獲取碼】SIGAI0709.
[35]怎樣成為一名優(yōu)秀的算法工程師【獲取碼】SIGAI0711.
[36] 理解計算:從√2到AlphaGo ——第3季 神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型【獲取碼】SIGAI0702.
[37] 人臉檢測算法之S3FD 【獲取碼】SIGAI6
[38]基于深度負(fù)相關(guān)學(xué)習(xí)的人群計數(shù)方法 【獲取碼】SIGAI0718
[39] 流形學(xué)習(xí)概述 【獲取碼】SIGAI0723
作者:SIGAI
鏈接:http://www.reibang.com/p/7cfa6bb6d621
來源:簡書
簡書著作權(quán)歸作者所有棒呛,任何形式的轉(zhuǎn)載都請聯(lián)系作者獲得授權(quán)并注明出處。