【李宏毅機(jī)器學(xué)習(xí)】CNN卷積神經(jīng)網(wǎng)絡(luò)

引子:圖像分類

對(duì)計(jì)算機(jī)來說圖片是什么骡男?

一張圖片是一個(gè)三層的tensor

把tensor拉直成為一個(gè)向量就可以作為一個(gè)network的輸入。


這里用全鏈接層埃跷,可以發(fā)現(xiàn)如果我們是對(duì)100*100大小的圖片做分類悉盆,需要訓(xùn)練的參數(shù)weight個(gè)數(shù)高達(dá)3X10^7氓英,這么多的參數(shù)很容易導(dǎo)致過擬合問題。

那么考慮到圖片分類的問題上捶闸,可以發(fā)現(xiàn)其實(shí)不一定每個(gè)Neuron都需要考慮整張圖片的每個(gè)位置也就是向量的每個(gè)x夜畴。

如何理解這個(gè)說法呢?
其實(shí)對(duì)于分類一張圖片來說删壮,其實(shí)可以理解成對(duì)圖片每個(gè)部分的一個(gè)匹配贪绘,比如觀察一張圖片是不是鳥,可能會(huì)分別觀察它的嘴央碟、眼睛税灌、爪子。亿虽。菱涤。并不是直觀的從整張圖片上來看(全鏈接層),也就是說每個(gè)Neuron其實(shí)可以負(fù)責(zé)圖片的一部分特征的觀察,也就是觀察到了某些patter,綜合這些信息就能對(duì)圖片進(jìn)行分類了淳附。


  • 第一次簡(jiǎn)化
    那么從以上說法我們就可以對(duì)全鏈接做第一次簡(jiǎn)化,每一個(gè)Neuron我們?cè)O(shè)置一個(gè)Recptive field堕战,也就是這個(gè)Neuron關(guān)心的區(qū)域祠饺,其他區(qū)域就不管了。



    那Recptive field如何決定呢履澳?這就需要自己來決定了吻谋,取決于你要觀察什么位置,要觀察什么范圍低千。
    需要注意的是Recptive field是可以重疊甚至可以是一樣的(兩個(gè)Neuron觀察不同的pattern)



    靈位Recptive field也可以覆蓋不同的區(qū)Chanel难审,形狀都是自己決定了,不一定是正方形失球,這些都取決于你想要識(shí)別什么樣的Pattern烈疚。

那其實(shí)最經(jīng)典的Recptive field如下

  • 覆蓋所有channels33大小
  • 一個(gè)Recptive field一門會(huì)分配一組Neuron, 比如一個(gè)Rf分配64個(gè)Neuron
  • Rf一般是設(shè)置一定的步長(zhǎng)覆蓋整個(gè)圖片金赦,而且相互會(huì)有重疊,這個(gè)目的是為了識(shí)別可能在兩個(gè)Rf之間的Pattern通殃。
  • 按上面的方法Rf超過了圖片的范圍一般用padding,進(jìn)行補(bǔ)值(一般是0)


    8E52838F-F328-4852-B630-203CC636965F.png

第二個(gè)問題骗炉,同樣的Patterns可能在圖片的不同位置照宝,比如鳥嘴可能會(huì)出現(xiàn)在圖片的不同位置,那么是不是每個(gè)位置都需要有一個(gè)Neuron來識(shí)別鳥嘴呢句葵?這樣嘴其實(shí)是很低效的()厕鹃。


這就引出了第二個(gè)簡(jiǎn)化:共享參數(shù)




讓不同rf的Neuron共享參數(shù)兢仰。
讓不同rf的Neuron能夠識(shí)別同一個(gè)Pattern

常見的共享參數(shù)的方法:



共享參數(shù)的Neuron我們叫它filter1,filter2...
實(shí)際上剂碴,回到圖片分類的問題把将,就是每個(gè)Rf我們要對(duì)圖片的每個(gè)Pattern進(jìn)行識(shí)別(每一個(gè)區(qū)域我們都需要判斷是鳥嘴、爪子忆矛、眼睛...)

加上參數(shù)共享之后察蹲,這個(gè)過程可以說是卷積層了。

那么卷積層和全鏈接層有什么聯(lián)系呢催训?



其實(shí)按我自己的理解Neuron反而變多了洽议,但是Neuron的擬合能力變差了,也就是w變少了漫拭。全鏈接層就是可以自定義rf大小沒用參數(shù)共享的卷積層亚兄,而卷積就是全鏈接層做了針對(duì)圖像問題的一些限制。

如果之前有學(xué)過CNN采驻,其實(shí)是另一種描述方法

其實(shí)不管是哪種方式审胚,只是換一個(gè)角度描述而已。
Filter 理解成抓取特征的一個(gè)模塊



通過filter抓取特征之后生成featrue map



我們可以再加一層卷積層礼旅,也就是對(duì)featrue map再做一次特征抓取菲盾,使用同樣大小的filter抓取的范圍就變大了。



對(duì)比兩個(gè)版本對(duì)于卷積層的描述


其實(shí)所謂filter里面的數(shù)字各淀,就是前版本描述的neuron的權(quán)重懒鉴,只是在描述的時(shí)候忽略掉了bias的描述,其實(shí)兩者是完全一樣的碎浇。

第二個(gè)版本的Filter的滑動(dòng)抓取临谱,其實(shí)就是第一個(gè)版本的共享參數(shù)。



這個(gè)滑動(dòng)的過程其實(shí)就是所謂卷積



池化


比如把偶數(shù)的像素拿掉奴璃,只會(huì)影響圖片的大小悉默,不會(huì)影響圖片是什么東西。

Max Pooling


Max Pooling 之后


Pooling的目的其實(shí)就是把圖片變小

Pooling實(shí)際上沒有w需要學(xué)習(xí)苟穆,所以不稱為一個(gè)層抄课,Pooling的方式,和大小都是可以自己根據(jù)實(shí)際問題選擇的

實(shí)際上雳旅,如果需要偵測(cè)的pattern比較小跟磨,Pooling可能會(huì)導(dǎo)致某些特征消失,尤其是現(xiàn)在計(jì)算能力不斷變強(qiáng)攒盈,很多架構(gòu)在做卷積的時(shí)候都去掉了Pooling的過程抵拘。

完整的CNN架構(gòu)

Playing Go 用來下棋的CNN

把棋盤作為一個(gè)19X19分類的問題,選擇下一步落子的位置型豁。
這個(gè)問題完全可以用全鏈接層僵蛛,但其實(shí)CNN的效果更好尚蝌,也就是把一個(gè)棋盤看作一張圖片。

直觀看怎么理解充尉?


其實(shí)在下棋的問題上飘言,從局部也可以發(fā)現(xiàn)一些Pattern

但是Pooling呢?



實(shí)際上在alpha go的CNN架構(gòu)中驼侠,并沒有用到Pooling姿鸿。
所以實(shí)際上,CNN不一定要有Pooling

今年來其實(shí)也用在一些其他的領(lǐng)域



這些Respective field會(huì)有不一樣的設(shè)計(jì)泪电。

More

實(shí)際上般妙,CNN是沒法解決圖片放大纪铺、縮小相速、旋轉(zhuǎn)的問題。
所以我們?cè)谟?xùn)練的時(shí)候需要做augmentation鲜锚,也就是在數(shù)據(jù)集加上旋轉(zhuǎn)突诬、放大縮小的問題。
那有什么架構(gòu)可以解決這些問題嗎 》 Spatial Transformer Layer


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末芜繁,一起剝皮案震驚了整個(gè)濱河市旺隙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌骏令,老刑警劉巖蔬捷,帶你破解...
    沈念sama閱讀 212,383評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異榔袋,居然都是意外死亡周拐,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門凰兑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妥粟,“玉大人,你說我怎么就攤上這事吏够」锤” “怎么了?”我有些...
    開封第一講書人閱讀 157,852評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵锅知,是天一觀的道長(zhǎng)播急。 經(jīng)常有香客問我,道長(zhǎng)售睹,這世上最難降的妖魔是什么旅择? 我笑而不...
    開封第一講書人閱讀 56,621評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮侣姆,結(jié)果婚禮上生真,老公的妹妹穿的比我還像新娘沉噩。我一直安慰自己,他們只是感情好柱蟀,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,741評(píng)論 6 386
  • 文/花漫 我一把揭開白布川蒙。 她就那樣靜靜地躺著,像睡著了一般长已。 火紅的嫁衣襯著肌膚如雪畜眨。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,929評(píng)論 1 290
  • 那天术瓮,我揣著相機(jī)與錄音康聂,去河邊找鬼。 笑死胞四,一個(gè)胖子當(dāng)著我的面吹牛恬汁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辜伟,決...
    沈念sama閱讀 39,076評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼氓侧,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了导狡?” 一聲冷哼從身側(cè)響起约巷,我...
    開封第一講書人閱讀 37,803評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎旱捧,沒想到半個(gè)月后独郎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,265評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡枚赡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,582評(píng)論 2 327
  • 正文 我和宋清朗相戀三年氓癌,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片标锄。...
    茶點(diǎn)故事閱讀 38,716評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡顽铸,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出料皇,到底是詐尸還是另有隱情谓松,我是刑警寧澤,帶...
    沈念sama閱讀 34,395評(píng)論 4 333
  • 正文 年R本政府宣布践剂,位于F島的核電站鬼譬,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏逊脯。R本人自食惡果不足惜优质,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,039評(píng)論 3 316
  • 文/蒙蒙 一渠啤、第九天 我趴在偏房一處隱蔽的房頂上張望纠脾。 院中可真熱鬧关面,春花似錦大诸、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拍皮,卻和暖如春歹叮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背铆帽。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工咆耿, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人爹橱。 一個(gè)月前我還...
    沈念sama閱讀 46,488評(píng)論 2 361
  • 正文 我出身青樓萨螺,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親宅荤。 傳聞我的和親對(duì)象是個(gè)殘疾皇子屑迂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,612評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容