卷積也內(nèi)卷钙蒙,簡(jiǎn)單樸素的卷積已經(jīng)不能滿足人們的需求贸宏,因此出現(xiàn)了各種形式的卷積,比如反卷積(Deconvolution\Transposed Convolution)絮供, 空洞卷積 (Dilated Convolution),組卷積 (Group Convolution)咏瑟,深度可分離卷積 (Depthwise Separable Convolution)矛双,可變形卷積 (Deformable Convolution)。
1. 卷積
卷積運(yùn)算本身十分簡(jiǎn)單,
假設(shè)一個(gè)大小為的特征圖,與一個(gè)大小為的卷積核做卷積叹哭,padding大小為忍宋,stride大小為,得到的輸出特征圖的尺寸為风罩。
卷積操作讓神經(jīng)網(wǎng)絡(luò)能夠提取到圖片的抽象特征糠排,在圖像分類(lèi)上應(yīng)用十分廣泛。
但是用于目標(biāo)檢測(cè)超升,語(yǔ)義分割等任務(wù)時(shí)入宦,往往需要原始的圖像位置信息,用于預(yù)測(cè)邊界框或者物體的分割線室琢。一種常見(jiàn)的作法是將網(wǎng)絡(luò)分為下采樣和上采樣兩部分乾闰,下采樣部分就是卷積神經(jīng)網(wǎng)絡(luò),用于提取特征盈滴;上采樣部分將提取到的特征信息重新恢復(fù)到原來(lái)的輸入尺寸涯肩,也就是反卷積發(fā)揮作用的地方。
2. 反卷積
反卷積的作用是讓通過(guò)卷積得到的的特征圖回到原來(lái)的大小巢钓,并保持原來(lái)的位置關(guān)系病苗。
由上面的特征圖計(jì)算式可以得到
改寫(xiě)以滿足卷積計(jì)算的尺寸公式:
可以理解為:
反卷積操作之后的輸出大小為
當(dāng)正向的卷積中不為1時(shí)阵幸,做反卷積的適合會(huì)在每個(gè)元素之間插入個(gè)0.
做時(shí)反卷積的padding, stride 和卷積核大小分別為
當(dāng)不能整除的時(shí)候花履,在padding之后芽世,在右邊和下邊再多加將余數(shù)行0和余數(shù)列0,然后進(jìn)行卷積诡壁。
卷積核的參數(shù)可以與正向的卷積共享济瓢,但是需要進(jìn)行中心對(duì)稱(chēng);也可以通過(guò)學(xué)習(xí)得到妹卿。
反卷積可能會(huì)受到棋盤(pán)偽影的影響旺矾,原因可能是圖像再某些部分的不均勻重疊蔑鹦,可以通過(guò)使用可整除的卷積核來(lái)避免這種狀況。
3. 空洞卷積
空洞卷積是通過(guò)在卷積核的元素之間插入0箕宙,將原來(lái)的卷積核擴(kuò)展成為一個(gè)更大的卷積核嚎朽,這么做的目的是在不增加實(shí)際核函數(shù)參數(shù)數(shù)目的情況下,增大輸出的感受野大小柬帕。
空洞卷積的空洞率可以理解為每個(gè)核元素之間插入個(gè)0锅很,當(dāng)時(shí)就是一般的卷積形式。一個(gè)大小為的卷積凤跑,經(jīng)過(guò)空洞率為的處理之后得到的空洞卷積大小為:爆安。根據(jù)上面計(jì)算卷積輸出大小的公式,可以得到經(jīng)過(guò)空洞卷積后輸出的大凶幸:
在經(jīng)典的CNN流程中扔仓,在卷積層后會(huì)有pooling層,作用是減少特征圖尺寸的同時(shí)保留相對(duì)的空間信息咖耘,增大感受野当辐。但是pooling的下采樣操作會(huì)損失一些信息。而空洞卷積可以在擴(kuò)大感受野的同時(shí)避免下采樣過(guò)程中的信息損失鲤看,用于語(yǔ)義分割可以有效提高準(zhǔn)確性缘揪。
4. 分組卷積
分組卷積指的是對(duì)輸入特征圖分成組,然后分別對(duì)每組的特征進(jìn)行卷積义桂。這個(gè)概念最初是在AlexNet中被提出來(lái)將模型分布在多個(gè)GPU上訓(xùn)練找筝,在后來(lái)被發(fā)現(xiàn)可以提高模型的精度。
假設(shè)輸入特征尺寸為慷吊,每個(gè)分組內(nèi)的特征為袖裕,每個(gè)組內(nèi)對(duì)應(yīng)的卷積核大小為,所有分組合在一起得到的輸出特征尺寸為溉瓶。對(duì)比不分組的情況下急鳄,通過(guò)卷積得到的輸出特征為。也就是說(shuō)堰酿,在參數(shù)量相同的情況下疾宏,獲得了倍多的特征;或者在獲得相同輸出的情況下參數(shù)量更少触创。
5. 深度可分離卷積
當(dāng)分組卷積的分組數(shù)坎藐,就成了深度分離卷積。
Depthwise Convolution: 以通道數(shù)分組,一個(gè)輸入為的特征經(jīng)過(guò)卷積后會(huì)得到個(gè)特征岩馍。但是這個(gè)操作并沒(méi)有利用到不同通道在空間上的信息碉咆,因此接著還有一步。
Pointwise Convolution:上一步得到的特征圖蛀恩,與個(gè)的卷積核做卷積疫铜,得到的輸出為。結(jié)果與和個(gè)卷積核做卷積是一樣的双谆。但是對(duì)比參數(shù)數(shù)量块攒,可分離卷積的計(jì)算量減少了.
在生成特征上,Depthwise Convolution 用于捕獲空間信息佃乘,Pointwise Convolution 用于捕獲通道相關(guān)的相關(guān)性囱井。深度可分離卷積由于在生成相同尺寸特征的情況下參數(shù)更少,被應(yīng)用在輕量級(jí)網(wǎng)絡(luò)比如MobileNet等網(wǎng)絡(luò)上趣避。