關(guān)于Filter的意義
本章節(jié)參照了zhihu.com的內(nèi)容今魔。所以我完整引用,不進(jìn)行任何修改错森。版權(quán)歸原作者所有
你眼睛真實看到的圖像其實是上圖的下半部分问词。而后經(jīng)過大腦的層層映射后才出現(xiàn)了你腦中所“看見”的圖像督函。CNN的卷積層部分可以理解成是學(xué)習(xí)你的“眼球結(jié)構(gòu)”激挪。
同一個filter內(nèi)部的權(quán)重是相同的,因為它用一個“抓取方式”去偵測特征垄分。比如說“邊緣偵測”。 你也注意到了薄湿,我們的眼睛不只觀看一次偷卧,等到掃描完該特征后吆倦,另一個filter可以改變“抓取方式”去偵測另一個特征。所權(quán)重在同一個filter內(nèi)是共享的理解是該filter對整個圖片進(jìn)行了某個特征的掃描蚕泽。
提取若干個特征后,就可以靠這些特征來判斷圖片是什么了须妻。
大家應(yīng)該知道大名鼎鼎的傅里葉變換,即一個波形敛惊,可以有不同的正弦函數(shù)和余弦函數(shù)進(jìn)行疊加完成,卷積神經(jīng)網(wǎng)絡(luò)也是一樣豆混,可以認(rèn)為一張圖片是由各種不同特征的圖片疊加而成的,所以它的作用是用來提取特定的特征皿伺,舉個例子盒粮,比如給定一張圖片鸵鸥,然后我只想提取它的輪廓丹皱,于是就需要卷積神經(jīng)網(wǎng)絡(luò)。
語義信息和高層神經(jīng)元
版權(quán)信息:本節(jié)出于以下文章
瞎談CNN:通過優(yōu)化求解輸入圖像
對于CNN摊崭,有個很基礎(chǔ)的認(rèn)識:低層的部分學(xué)習(xí)紋理等簡單信息,高層部分學(xué)習(xí)語義信息呢簸。在《Intriguing properties of neural networks》中的另一個發(fā)現(xiàn)是,CNN中表示高層學(xué)習(xí)到的語義信息的瘦赫,并不是某一個神經(jīng)元,而是高層神經(jīng)元構(gòu)成的空間确虱。這個看上去有些顯然的結(jié)論的一種佐證方式又是對輸入圖像進(jìn)行優(yōu)化:
其中是神經(jīng)元激活值對應(yīng)的向量替裆,v是一個隨機(jī)向量校辩。另外這和前邊的優(yōu)化有些許不同,x的取值范圍限定在已有的圖片集里宜咒。其實就是在某個高層響應(yīng)的空間里,沿著某個方向挑選了一些該方向上值最大的圖片。最后的結(jié)論是纸镊,無論是沿著某個隨機(jī)方向找到的圖片,還是以某一個神經(jīng)元響應(yīng)最大找到的圖片逗威,都能看出一些語義上的共性,比如下圖:
黑線以上是最大化某個神經(jīng)元響應(yīng)的樣本凯旭,共性挺明顯,黑線以下是最大化某層特征空間中某個方向響應(yīng)的樣本罐呼,共性也挺明顯。