卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network)
基于全連接層和CNN的神經(jīng)網(wǎng)絡(luò)示意圖
基于全連接的神經(jīng)網(wǎng)絡(luò)
基于CNN的神經(jīng)網(wǎng)絡(luò)
全連接的局限性
由于全連接所有數(shù)據(jù)會被拉平成1維數(shù)據(jù),數(shù)據(jù)的"形狀"會被忽視掉,所以無法利用與形狀相關(guān)的信息.
而卷積層會以原始維度(圖像就是3維)接收輸入數(shù)據(jù),同樣以3維形式輸出到下一層,因此有可能正確理解圖像的形狀數(shù)據(jù).
卷積運(yùn)算
卷積運(yùn)算
帶偏置的卷積運(yùn)算
其中濾波器(Filter)又稱"核"
填充
幅度為1的填充
幅度為1的填充(padding),表示在輸入矩陣周圍填充1像素的'0',填充后矩陣變成(6,6)的形狀.填充的主要目的是為了使輸出數(shù)據(jù)的形狀和輸入數(shù)據(jù)一致
步幅
步幅為2的卷積運(yùn)算
應(yīng)用濾波器窗口的間隔變?yōu)?個元素.
已知填充和步幅,輸入形狀和輸出形狀的關(guān)系
假設(shè)輸出大小為(H,W),濾波器大小為(FH,FW),輸出大小為(OH,OW),填充為P,步幅為S,則存在以下關(guān)系
三維數(shù)據(jù)的卷積運(yùn)算
三維數(shù)據(jù)的卷積運(yùn)算.png
三維數(shù)據(jù)卷積運(yùn)算過程
單個濾波器,最后輸出通道數(shù)為1的特征圖
N個濾波器,最后輸出通道數(shù)為N的特征圖
帶偏置的卷積運(yùn)算處理流
池化層
池化是縮小高、長方向上的空間的運(yùn)算.下圖展示了步幅為2的Max池化,即每次從2*2的目標(biāo)區(qū)域中獲取最大值的操作,一般來說初花的窗口大小會和步幅設(shè)定成相同的值.池化對微小的數(shù)據(jù)偏差具有魯棒性.
窗口為2*2,步幅為2的Max池化