[網(wǎng)絡(luò)層]什么是卷積

參考資料:

CNN中常用的四種卷積詳解

1凭迹、什么是卷積

卷積是在特征圖上進(jìn)行滑動(dòng)的矩陣,它的參數(shù)是可學(xué)習(xí)的鸡捐,然后計(jì)算矩陣跟被滑動(dòng)到的區(qū)域內(nèi)的像素點(diǎn)進(jìn)行內(nèi)積計(jì)算,再求和麻裁。這種操作可以使得卷積學(xué)習(xí)到局部特征箍镜,并且每個(gè)被滑動(dòng)到的區(qū)域之間都共享了權(quán)重。共享權(quán)重操作使得卷積相比全連接網(wǎng)絡(luò)節(jié)省了大量的參數(shù)煎源。


2色迂、為什么要引入卷積

① 卷積可以通過(guò)共享權(quán)重來(lái)減少大量的參數(shù)量。例如使用全連接層會(huì)導(dǎo)致參數(shù)量太多手销,假如輸入的圖片尺寸大小為 1000*1000*3歇僧,即 3 百萬(wàn)個(gè)像素點(diǎn),假如全連接層有 1000 個(gè)節(jié)點(diǎn)锋拖,則總共有 30 億 1000 個(gè)參數(shù)诈悍。但是換成使用卷積核組數(shù)為 100 的 5*5 的卷積除呵,則僅需 5*5*3*100 + 100馆蠕,即 7600 個(gè)參數(shù)

② 圖片中存在重復(fù)的特征矫渔,卷積可以通過(guò)共享權(quán)重的方式更高效率地將這些特征學(xué)習(xí)出來(lái)

③ 圖片固有的空間特征昂儒,如果使用全連接層或 RNN 來(lái)學(xué)習(xí)臀叙,則會(huì)破壞圖片的空間特征凯力,而卷積則可以不破壞圖片的空間特征


3猖辫、卷積的計(jì)算過(guò)程

① 對(duì)于有多組的卷積組切威,每次使用一組卷積組去計(jì)算

② 每組卷積組內(nèi)有輸入通道數(shù)個(gè)卷積核售貌,每個(gè)卷積核是參數(shù)可學(xué)習(xí)的二維矩陣

③使用一組內(nèi)的卷積核同時(shí)在輸入的每個(gè)通道上给猾,分別按指定步長(zhǎng)從左到右,從上到下在通道上進(jìn)行滑動(dòng)颂跨,然后計(jì)算二維矩陣跟被滑動(dòng)到的區(qū)域的值進(jìn)行內(nèi)積計(jì)算耙册,然后再求和。然后將所有通道上求得的值再求和毫捣,再加上偏置項(xiàng)详拙。如此即可得到一個(gè)二維的輸出矩陣,作為輸出的一個(gè)通道蔓同。

④ 逐次使用每組卷積組饶辙,按 ③ 中的過(guò)程去進(jìn)行計(jì)算,即可得到一個(gè)三維的輸出矩陣斑粱,通道數(shù)等于卷積組數(shù)弃揽。


4、卷積的優(yōu)點(diǎn)

① 通過(guò)共享權(quán)重來(lái)減少參數(shù)量

② 可以學(xué)習(xí)局部特征,更符合應(yīng)用于圖片

③ 具有平移不變性矿微,因?yàn)榫矸e通過(guò)共享權(quán)重和滑動(dòng)處理痕慢,所以即使特征不在同一個(gè)位置,也可以被卷積核學(xué)習(xí)到


5涌矢、卷積的缺點(diǎn)

① 學(xué)習(xí)到的特征受到感受野的影響太大掖举,需要人工設(shè)置卷積核的大小

② 對(duì)序列輸入的提取效果不夠好


6、卷積的變種

① 空洞卷積(擴(kuò)張卷積娜庇、膨脹卷積):指的是在正常的卷積核的點(diǎn)之間插入空洞 塔次,以此在不增加計(jì)算量來(lái)增大卷積核的感受野。


優(yōu)點(diǎn):

a名秀、在不丟失分辨率的情況下增大感受野励负,對(duì)于檢測(cè)大物體效果更好

b、調(diào)整擴(kuò)張率(卷積點(diǎn)之間的空洞個(gè)數(shù))獲得多尺度信息

缺點(diǎn):

a匕得、對(duì)于檢測(cè)小物體效果不好


② 轉(zhuǎn)置卷積(反卷積继榆、逆卷積):轉(zhuǎn)置卷積是相對(duì)于卷積的相反操作,例如 3*3 卷積得到的結(jié)果是 1 個(gè)值汁掠,而轉(zhuǎn)置操作則是將 1 個(gè)值變成 3*3 的大小略吨。不過(guò)轉(zhuǎn)置卷積并不能夠恢復(fù)被卷積前的值,因?yàn)榫矸e是不可逆操作调塌,只能夠恢復(fù)尺寸。


優(yōu)點(diǎn):

a惠猿、可以將小尺寸的特征變成大尺寸的特征羔砾,實(shí)現(xiàn)類似上采樣的效果,可以應(yīng)用于 CNN 可視化偶妖、FCN 全卷積網(wǎng)絡(luò)姜凄、GAN 等

缺點(diǎn):

只能恢復(fù)尺寸,不能恢復(fù)數(shù)值


空間可分離卷積:將一個(gè)卷積核分離成兩個(gè)更小的卷積核趾访,節(jié)省參數(shù)量

深度可分離卷積:將在每個(gè)通道上使用卷積态秧,再將所有的通道卷積結(jié)果相加,再使用每組卷積去重復(fù)上述過(guò)程的步驟拆分成兩個(gè)步驟扼鞋。

(1)只改變特征圖的大小申鱼,但是不改變特征圖的通道數(shù)。在每個(gè)通道上使用卷積云头,但是不將所有的通道卷積結(jié)果相加捐友,而是保持原樣。例如輸入的是 256 通道溃槐,則卷積后的通道數(shù)仍然還是跟輸入通道數(shù) 256 相等匣砖。而原本的卷積輸出通道數(shù)跟組數(shù)相等。

(2)只改變特征圖的通道數(shù),但不改變特征圖的大小猴鲫。在 (1)的基礎(chǔ)上再使用 輸出通道數(shù)*1*1*通道數(shù) 進(jìn)行卷積

深度可分離卷積本質(zhì)上是卷積核組之間共享了第一階段卷積核的參數(shù)


7对人、卷積后的特征尺寸計(jì)算公式

假設(shè) n 為輸入的特征尺寸, f 為卷積核的大小拂共,p 為 padding 的大小牺弄,s 為卷積核移動(dòng)的步長(zhǎng)

\lfloor \frac{n - f + 2p}{s}  \rfloor + 1


8、1*1匣缘、3*3猖闪、5*5、7*7 的卷積核大小的作用和優(yōu)缺點(diǎn)肌厨,以及相互之間的比較

作用:

① 1*1 的作用可以用來(lái)進(jìn)行通道數(shù)變換培慌,以及在部分情況下替代全連接的作用

② 3*3 的作用是使用小核來(lái)替代大核,從而實(shí)現(xiàn)減少參數(shù)量的作用

③ 5*5 的作用是通過(guò)使用較大的卷積核柑爸,來(lái)達(dá)到使卷積核有更大的感受野的作用吵护。也可以被用在圖像金字塔中。

④ 7*7 的作用也是通過(guò)使用較大的卷積核表鳍,來(lái)達(dá)到使卷積核有更大的感受野的作用馅而。也可以被用在圖像金字塔中。

優(yōu)點(diǎn):

① 1*1 跟其他的卷積核可以實(shí)現(xiàn)深度可分離卷積來(lái)進(jìn)一步減少參數(shù)量

② 5*5 跟 7*7 有更大的感受野


9譬圣、卷積核的參數(shù)量計(jì)算

假設(shè)卷積核的大小為 k瓮恭,輸入通道數(shù)為 in_n,輸出通道數(shù)為 out_n厘熟,則卷積核的參數(shù)量為:

out_n*in_n*k*k + out_n

實(shí)例:

k?=?3

in_n?=?4

out_n?=?5

conv2d?=?nn.Conv2d(in_n,?out_n,?k)

print(conv2d.weight.shape)

print(conv2d.bias.shape)

輸出:

torch.Size([5, 4, 3, 3])

torch.Size([5])

故參數(shù)總量為:5*4*3*3 + 5


10屯蹦、pytorch 中的 Conv2d 函數(shù)的作用和參數(shù)詳解

參考資料:

PyTorch學(xué)習(xí)筆記(9)——nn.Conv2d和其中的padding策略

class torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)

函數(shù)作用:對(duì)由多個(gè)平面組成的輸入進(jìn)行二維卷積。

輸入:維度 [B, C_in, H, W]

輸出:維度 [B, C_out, H_out, W_out]

參數(shù)詳解

in_channels(int):輸入通道數(shù)

out_channels(int):輸出通道數(shù)

kernel_size([int, tuple(int, int)]):卷積核大小绳姨,當(dāng)輸入為 3 時(shí)登澜,則卷積核的大小為 [3, 3],當(dāng)輸入為 (3, 4) 時(shí)飘庄,則卷積核的大小為 [3, 4] 脑蠕,即第一個(gè)數(shù)值代表卷積核的高,第二個(gè)數(shù)值代表卷積核的寬跪削。

如果考慮 dilation 參數(shù)谴仙,則實(shí)際的卷積核感受野大小為:(dilation - 1) * (kernel_size - 1) + kernel_size,即當(dāng) dilation=2 時(shí)碾盐,3*3 的卷積核的實(shí)際感受野為 5*5

stride([int, tuple], 可選)=1: 卷積核的移動(dòng)步長(zhǎng)

padding([int, tuple(int, int)], 可選)=0: 填充的長(zhǎng)度狞甚,當(dāng)輸入為 0 時(shí),則不進(jìn)行填充廓旬。當(dāng)輸入為 1 時(shí)哼审,則輸入的每一條邊都填充 1 層 0 值谐腰,即上下左右各填充 1 層 0 值。如果輸入為 (1, 2) 時(shí)涩盾,則表示上下各填充 1 層 0 值十气,而左右則各填充 2 層 0 值。但是不能輸入 (1, 2, 3, 4) 四個(gè)元素的 tuple

dilation(int)=1:卷積核元素之間的間距春霍。當(dāng)輸入為 2 時(shí)砸西,卷積核元素之間的空洞個(gè)數(shù)為 1。

groups=1:

bias=True:

例子:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末址儒,一起剝皮案震驚了整個(gè)濱河市芹枷,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌莲趣,老刑警劉巖鸳慈,帶你破解...
    沈念sama閱讀 211,884評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異喧伞,居然都是意外死亡走芋,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,347評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門潘鲫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)翁逞,“玉大人,你說(shuō)我怎么就攤上這事溉仑⊥诤” “怎么了?”我有些...
    開封第一講書人閱讀 157,435評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵浊竟,是天一觀的道長(zhǎng)怨喘。 經(jīng)常有香客問(wèn)我,道長(zhǎng)逐沙,這世上最難降的妖魔是什么哲思? 我笑而不...
    開封第一講書人閱讀 56,509評(píng)論 1 284
  • 正文 為了忘掉前任洼畅,我火速辦了婚禮吩案,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘帝簇。我一直安慰自己徘郭,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,611評(píng)論 6 386
  • 文/花漫 我一把揭開白布丧肴。 她就那樣靜靜地躺著残揉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪芋浮。 梳的紋絲不亂的頭發(fā)上抱环,一...
    開封第一講書人閱讀 49,837評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼镇草。 笑死眶痰,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的梯啤。 我是一名探鬼主播竖伯,決...
    沈念sama閱讀 38,987評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼因宇!你這毒婦竟也來(lái)了七婴?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,730評(píng)論 0 267
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤察滑,失蹤者是張志新(化名)和其女友劉穎打厘,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體杭棵,經(jīng)...
    沈念sama閱讀 44,194評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡婚惫,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,525評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了魂爪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片先舷。...
    茶點(diǎn)故事閱讀 38,664評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖滓侍,靈堂內(nèi)的尸體忽然破棺而出蒋川,到底是詐尸還是另有隱情,我是刑警寧澤撩笆,帶...
    沈念sama閱讀 34,334評(píng)論 4 330
  • 正文 年R本政府宣布捺球,位于F島的核電站,受9級(jí)特大地震影響夕冲,放射性物質(zhì)發(fā)生泄漏氮兵。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,944評(píng)論 3 313
  • 文/蒙蒙 一歹鱼、第九天 我趴在偏房一處隱蔽的房頂上張望泣栈。 院中可真熱鬧,春花似錦弥姻、人聲如沸南片。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,764評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)疼进。三九已至,卻和暖如春秧廉,著一層夾襖步出監(jiān)牢的瞬間伞广,已是汗流浹背拣帽。 一陣腳步聲響...
    開封第一講書人閱讀 31,997評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嚼锄,地道東北人诞外。 一個(gè)月前我還...
    沈念sama閱讀 46,389評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像灾票,于是被迫代替她去往敵國(guó)和親峡谊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,554評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容