文章作者:Tyan
博客:noahsnail.com ?|? CSDN ?|? 簡書
1. 擴(kuò)張卷積
Dilated Convolutions,翻譯為擴(kuò)張卷積或空洞卷積。擴(kuò)張卷積與普通的卷積相比,除了卷積核的大小以外疆虚,還有一個(gè)擴(kuò)張率(dilation rate)參數(shù)寥闪,主要用來表示擴(kuò)張的大小。擴(kuò)張卷積與普通卷積的相同點(diǎn)在于痕鳍,卷積核的大小是一樣的,在神經(jīng)網(wǎng)絡(luò)中即參數(shù)數(shù)量不變,區(qū)別在于擴(kuò)張卷積具有更大的感受野笼呆。感受野是卷積核在圖像上看到的大小熊响,例如$3 \times 3$卷積核的感受野大小為9。
2. 示意圖
下圖是擴(kuò)張卷積的示意圖诗赌。
(a) 普通卷積汗茄,1-dilated convolution,卷積核的感受野為$3 \times 3 = 9$铭若。
(b) 擴(kuò)張卷積洪碳,2-dilated convolution,卷積核的感受野為$7 \times 7 = 49$叼屠。
(c) 擴(kuò)張卷積瞳腌,4-dilated convolution,卷積核的感受野為$15 \times 15 = 225$镜雨。
從上圖中可以看出嫂侍,卷積核的參數(shù)個(gè)數(shù)保持不變,感受野的大小隨著“dilation rate”參數(shù)的增加呈指數(shù)增長冷离。
3. 優(yōu)點(diǎn)
擴(kuò)展卷積在保持參數(shù)個(gè)數(shù)不變的情況下增大了卷積核的感受野吵冒,同時(shí)它可以保證輸出的特征映射(feature map)的大小保持不變。一個(gè)擴(kuò)張率為2的3×3卷積核西剥,感受野與5×5的卷積核相同痹栖,但參數(shù)數(shù)量僅為9個(gè),是5×5卷積參數(shù)數(shù)量的$36%$瞭空。
4. 應(yīng)用
擴(kuò)張卷積在圖像分割揪阿、語音合成、機(jī)器翻譯咆畏、目標(biāo)檢測中都有應(yīng)用南捂。