卷積神經(jīng)網(wǎng)絡(luò)(CNN)屬于人工神經(jīng)網(wǎng)絡(luò)的一種咧虎,它的權(quán)重共享的網(wǎng)絡(luò)結(jié)構(gòu)顯著降低了模型的復(fù)雜度卓缰,減少了權(quán)值的數(shù)量。卷積神經(jīng)網(wǎng)絡(luò)可以直接將圖片作為網(wǎng)絡(luò)的輸入,自動(dòng)提取特征征唬,并且對(duì)圖片的變形(如平移捌显、比例縮放、傾斜)等具有高度不變形总寒。
神經(jīng)網(wǎng)絡(luò)(NN) 的基本組成包括輸入層扶歪、隱藏層、輸出層偿乖。卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)在于隱藏層分為卷積層和池化層(又叫采樣層)击罪。卷積層通過一塊塊卷積核在原始圖像上平移來提取特征哲嘲。
1.什么是卷積神經(jīng)網(wǎng)絡(luò)贪薪?
? ? ? ? ? ? ? 我們先把卷積神經(jīng)網(wǎng)絡(luò)這個(gè)詞拆開來看∶吒保“卷積” 和 “神經(jīng)網(wǎng)絡(luò)”画切。卷積也就是說神經(jīng)網(wǎng)絡(luò)不再是對(duì)每個(gè)像素的輸入信息做處理了,而是圖片上每一小塊像素區(qū)域進(jìn)行處理囱怕,這種做法加強(qiáng)了圖片信息的連續(xù)性霍弹。 使得神經(jīng)網(wǎng)絡(luò)能看到圖形, 而非一個(gè)點(diǎn)娃弓。這種做法同時(shí)也加深了神經(jīng)網(wǎng)絡(luò)對(duì)圖片的理解典格。具體來說,卷積神經(jīng)網(wǎng)絡(luò)有一個(gè)批量過濾器台丛,持續(xù)不斷的在圖片上滾動(dòng)收集圖片里的信息耍缴,每一次收集的時(shí)候都只是收集一小塊像素區(qū)域,然后把收集來的信息進(jìn)行整理挽霉,這時(shí)候整理出來的信息有了一些實(shí)際上的呈現(xiàn)防嗡,比如這時(shí)的神經(jīng)網(wǎng)絡(luò)能看到一些邊緣的圖片信息,然后在以同樣的步驟侠坎,用類似的批量過濾器掃過產(chǎn)生的這些邊緣信息蚁趁,神經(jīng)網(wǎng)絡(luò)從這些邊緣信息里面總結(jié)出更高層的信息結(jié)構(gòu),比如說總結(jié)的邊緣能夠畫出眼睛实胸,鼻子等等他嫡。再經(jīng)過一次過濾,臉部的信息也從這些眼睛鼻子的信息中被總結(jié)出來庐完。最后我們?cè)侔堰@些信息套入幾層普通的全連接神經(jīng)層進(jìn)行分類钢属,這樣就能得到輸入的圖片能被分為哪一類的結(jié)果了。
2.用卷積來干什么假褪?
? ? ? ? ? ? ? 我們截取一段 google 介紹卷積神經(jīng)網(wǎng)絡(luò)的視頻署咽,具體說說圖片是如何被卷積的。下面是一張貓的圖片,圖片有長(zhǎng)宁否、寬窒升、高 三個(gè)參數(shù)。對(duì)! 圖片是有高度的! 這里的高指的是計(jì)算機(jī)用于產(chǎn)生顏色使用的信息慕匠。如果是黑白照片的話饱须,高的單位就只有1,如果是彩色照片台谊,就可能有紅綠藍(lán)三種顏色的信息蓉媳,這時(shí)的高度為3。我們以彩色照片為例子锅铅。過濾器就是影像中不斷移動(dòng)的東西酪呻,他不斷在圖片收集小批小批的像素塊,收集完所有信息后盐须,輸出的值玩荠,我們可以理解成是一個(gè)高度更高,長(zhǎng)和寬更小的”圖片”贼邓。這個(gè)圖片里就能包含一些邊緣信息阶冈。然后以同樣的步驟再進(jìn)行多次卷積,將圖片的長(zhǎng)寬再壓縮塑径,高度再增加女坑,就有了對(duì)輸入圖片更深的理解。將壓縮统舀,增高的信息嵌套在普通的分類神經(jīng)層上匆骗,我們就能對(duì)這種圖片進(jìn)行分類了。
3.池化(pooling)是做什么的绑咱?
? ? ? ? ? ? 研究發(fā)現(xiàn)绰筛,在每一次卷積的時(shí)候,神經(jīng)層可能會(huì)無意地丟失一些信息描融。這時(shí)铝噩,池化 (pooling) 就可以很好地解決這一問題。而且池化是一個(gè)篩選過濾的過程窿克,能將layer中有用的信息篩選出來骏庸,給下一個(gè)層分析。同時(shí)也減輕了神經(jīng)網(wǎng)絡(luò)的計(jì)算負(fù)擔(dān) (具體細(xì)節(jié)參考)年叮。也就是說在卷集的時(shí)候具被,我們不壓縮長(zhǎng)寬,盡量地保留更多信息只损,壓縮的工作就交給池化了一姿,這樣的一項(xiàng)附加工作能夠很有效的提高準(zhǔn)確性七咧。有了這些技術(shù),我們就可以搭建一個(gè)屬于我們自己的卷積神經(jīng)網(wǎng)絡(luò)啦叮叹。
4.所以卷積神經(jīng)網(wǎng)絡(luò)(CNN)是什么結(jié)構(gòu)艾栋?
? ? ? ? ? ? ? 比較流行的一種搭建結(jié)構(gòu)是這樣,從下到上的順序蛉顽,首先是輸入的圖片(image)蝗砾,經(jīng)過一層卷積層 (convolution),然后在用池化(pooling)方式處理卷積的信息携冤,這里使用的是 max pooling 的方式悼粮。然后在經(jīng)過一次同樣的處理,把得到的第二次處理的信息傳入兩層全連接的神經(jīng)層 (fully connected)曾棕,這也是一般的兩層神經(jīng)網(wǎng)絡(luò)層扣猫,最后在接上一個(gè)分類器(classifier)進(jìn)行分類預(yù)測(cè)。這僅僅是對(duì)卷積神經(jīng)網(wǎng)絡(luò)在圖片處理上一次簡(jiǎn)單的介紹睁蕾。
CSDN文章地址:https://blog.csdn.net/kdongyi