【李宏毅機(jī)器學(xué)習(xí)】CNN卷積神經(jīng)網(wǎng)絡(luò)

引子：圖像分類

對(duì)計(jì)算機(jī)來說圖片是什么骡男？

一張圖片是一個(gè)三層的tensor

把tensor拉直成為一個(gè)向量就可以作為一個(gè)network的輸入。

這里用全鏈接層埃跷，可以發(fā)現(xiàn)如果我們是對(duì)100*100大小的圖片做分類悉盆，需要訓(xùn)練的參數(shù)weight個(gè)數(shù)高達(dá)3X10^7氓英，這么多的參數(shù)很容易導(dǎo)致過擬合問題。

那么考慮到圖片分類的問題上捶闸，可以發(fā)現(xiàn)其實(shí)不一定每個(gè)Neuron都需要考慮整張圖片的每個(gè)位置也就是向量的每個(gè)x夜畴。

如何理解這個(gè)說法呢？
其實(shí)對(duì)于分類一張圖片來說删壮，其實(shí)可以理解成對(duì)圖片每個(gè)部分的一個(gè)匹配贪绘，比如觀察一張圖片是不是鳥，可能會(huì)分別觀察它的嘴央碟、眼睛税灌、爪子。亿虽。菱涤。并不是直觀的從整張圖片上來看（全鏈接層），也就是說每個(gè)Neuron其實(shí)可以負(fù)責(zé)圖片的一部分特征的觀察，也就是觀察到了某些patter，綜合這些信息就能對(duì)圖片進(jìn)行分類了淳附。

第一次簡(jiǎn)化
那么從以上說法我們就可以對(duì)全鏈接做第一次簡(jiǎn)化，每一個(gè)Neuron我們?cè)O(shè)置一個(gè)Recptive field堕战，也就是這個(gè)Neuron關(guān)心的區(qū)域祠饺，其他區(qū)域就不管了。

那Recptive field如何決定呢履澳？這就需要自己來決定了吻谋，取決于你要觀察什么位置，要觀察什么范圍低千。
需要注意的是Recptive field是可以重疊甚至可以是一樣的(兩個(gè)Neuron觀察不同的pattern)

靈位Recptive field也可以覆蓋不同的區(qū)Chanel难审，形狀都是自己決定了，不一定是正方形失球，這些都取決于你想要識(shí)別什么樣的Pattern烈疚。

那其實(shí)最經(jīng)典的Recptive field如下

覆蓋所有channels33大小
一個(gè)Recptive field一門會(huì)分配一組Neuron, 比如一個(gè)Rf分配64個(gè)Neuron
Rf一般是設(shè)置一定的步長(zhǎng)覆蓋整個(gè)圖片金赦，而且相互會(huì)有重疊，這個(gè)目的是為了識(shí)別可能在兩個(gè)Rf之間的Pattern通殃。
按上面的方法Rf超過了圖片的范圍一般用padding，進(jìn)行補(bǔ)值（一般是0）

8E52838F-F328-4852-B630-203CC636965F.png

第二個(gè)問題骗炉，同樣的Patterns可能在圖片的不同位置照宝，比如鳥嘴可能會(huì)出現(xiàn)在圖片的不同位置，那么是不是每個(gè)位置都需要有一個(gè)Neuron來識(shí)別鳥嘴呢句葵？這樣嘴其實(shí)是很低效的（）厕鹃。

這就引出了第二個(gè)簡(jiǎn)化：共享參數(shù)

讓不同rf的Neuron共享參數(shù)兢仰。
讓不同rf的Neuron能夠識(shí)別同一個(gè)Pattern

常見的共享參數(shù)的方法：

共享參數(shù)的Neuron我們叫它filter1，filter2...
實(shí)際上剂碴，回到圖片分類的問題把将，就是每個(gè)Rf我們要對(duì)圖片的每個(gè)Pattern進(jìn)行識(shí)別（每一個(gè)區(qū)域我們都需要判斷是鳥嘴、爪子忆矛、眼睛...）

加上參數(shù)共享之后察蹲，這個(gè)過程可以說是卷積層了。

那么卷積層和全鏈接層有什么聯(lián)系呢催训？

其實(shí)按我自己的理解Neuron反而變多了洽议，但是Neuron的擬合能力變差了，也就是w變少了漫拭。全鏈接層就是可以自定義rf大小沒用參數(shù)共享的卷積層亚兄，而卷積就是全鏈接層做了針對(duì)圖像問題的一些限制。

如果之前有學(xué)過CNN采驻，其實(shí)是另一種描述方法

其實(shí)不管是哪種方式审胚，只是換一個(gè)角度描述而已。
Filter 理解成抓取特征的一個(gè)模塊

通過filter抓取特征之后生成featrue map

我們可以再加一層卷積層礼旅，也就是對(duì)featrue map再做一次特征抓取菲盾，使用同樣大小的filter抓取的范圍就變大了。

對(duì)比兩個(gè)版本對(duì)于卷積層的描述

其實(shí)所謂filter里面的數(shù)字各淀，就是前版本描述的neuron的權(quán)重懒鉴，只是在描述的時(shí)候忽略掉了bias的描述，其實(shí)兩者是完全一樣的碎浇。

第二個(gè)版本的Filter的滑動(dòng)抓取临谱，其實(shí)就是第一個(gè)版本的共享參數(shù)。

這個(gè)滑動(dòng)的過程其實(shí)就是所謂卷積

池化

比如把偶數(shù)的像素拿掉奴璃，只會(huì)影響圖片的大小悉默，不會(huì)影響圖片是什么東西。

Max Pooling

Max Pooling 之后

Pooling的目的其實(shí)就是把圖片變小

Pooling實(shí)際上沒有w需要學(xué)習(xí)苟穆，所以不稱為一個(gè)層抄课，Pooling的方式，和大小都是可以自己根據(jù)實(shí)際問題選擇的

實(shí)際上雳旅，如果需要偵測(cè)的pattern比較小跟磨，Pooling可能會(huì)導(dǎo)致某些特征消失，尤其是現(xiàn)在計(jì)算能力不斷變強(qiáng)攒盈，很多架構(gòu)在做卷積的時(shí)候都去掉了Pooling的過程抵拘。

完整的CNN架構(gòu)

Playing Go 用來下棋的CNN

把棋盤作為一個(gè)19X19分類的問題，選擇下一步落子的位置型豁。
這個(gè)問題完全可以用全鏈接層僵蛛，但其實(shí)CNN的效果更好尚蝌，也就是把一個(gè)棋盤看作一張圖片。

直觀看怎么理解充尉？

其實(shí)在下棋的問題上飘言，從局部也可以發(fā)現(xiàn)一些Pattern

但是Pooling呢？

實(shí)際上在alpha go的CNN架構(gòu)中驼侠，并沒有用到Pooling姿鸿。
所以實(shí)際上，CNN不一定要有Pooling

今年來其實(shí)也用在一些其他的領(lǐng)域

這些Respective field會(huì)有不一樣的設(shè)計(jì)泪电。

實(shí)際上般妙，CNN是沒法解決圖片放大纪铺、縮小相速、旋轉(zhuǎn)的問題。
所以我們?cè)谟?xùn)練的時(shí)候需要做augmentation鲜锚，也就是在數(shù)據(jù)集加上旋轉(zhuǎn)突诬、放大縮小的問題。
那有什么架構(gòu)可以解決這些問題嗎》 Spatial Transformer Layer

最后編輯于：2021.06.23 20:50:33

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末芜繁，一起剝皮案震驚了整個(gè)濱河市旺隙，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌骏令，老刑警劉巖蔬捷，帶你破解...
沈念sama閱讀 212,383評(píng)論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異榔袋，居然都是意外死亡周拐，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,522評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門凰兑，熙熙樓的掌柜王于貴愁眉苦臉地迎上來妥粟，“玉大人，你說我怎么就攤上這事吏够」锤” “怎么了？”我有些...
開封第一講書人閱讀 157,852評(píng)論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵锅知，是天一觀的道長(zhǎng)播急。經(jīng)常有香客問我，道長(zhǎng)售睹，這世上最難降的妖魔是什么旅择？我笑而不...
開封第一講書人閱讀 56,621評(píng)論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮侣姆，結(jié)果婚禮上生真，老公的妹妹穿的比我還像新娘沉噩。我一直安慰自己，他們只是感情好柱蟀，可當(dāng)我...
茶點(diǎn)故事閱讀 65,741評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布川蒙。她就那樣靜靜地躺著，像睡著了一般长已。火紅的嫁衣襯著肌膚如雪畜眨。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,929評(píng)論 1贊 290
城市分裂傳說
那天术瓮，我揣著相機(jī)與錄音康聂，去河邊找鬼。笑死胞四，一個(gè)胖子當(dāng)著我的面吹牛恬汁，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播辜伟，決...
沈念sama閱讀 39,076評(píng)論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼氓侧，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了导狡？” 一聲冷哼從身側(cè)響起约巷，我...
開封第一講書人閱讀 37,803評(píng)論 0贊 268
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎旱捧，沒想到半個(gè)月后独郎，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,265評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡枚赡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,582評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年氓癌，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片标锄。...
茶點(diǎn)故事閱讀 38,716評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡顽铸，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出料皇，到底是詐尸還是另有隱情谓松，我是刑警寧澤，帶...
沈念sama閱讀 34,395評(píng)論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布践剂，位于F島的核電站鬼譬，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏逊脯。R本人自食惡果不足惜优质，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,039評(píng)論 3贊 316
男人毒藥：我在死后第九天來索命
文/蒙蒙一渠啤、第九天我趴在偏房一處隱蔽的房頂上張望纠脾。院中可真熱鬧关面，春花似錦大诸、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,798評(píng)論 0贊 21
一樁弒父案爷耀，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至拍皮，卻和暖如春歹叮，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背铆帽。一陣腳步聲響...
開封第一講書人閱讀 32,027評(píng)論 1贊 266
情欲美人皮
我被黑心中介騙來泰國(guó)打工咆耿，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人爹橱。一個(gè)月前我還...
沈念sama閱讀 46,488評(píng)論 2贊 361
代替公主和親
正文我出身青樓萨螺，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親宅荤。傳聞我的和親對(duì)象是個(gè)殘疾皇子屑迂，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,612評(píng)論 2贊 350

【李宏毅機(jī)器學(xué)習(xí)】CNN卷積神經(jīng)網(wǎng)絡(luò)

【李宏毅機(jī)器學(xué)習(xí)】CNN卷積神經(jīng)網(wǎng)絡(luò)

引子：圖像分類

對(duì)計(jì)算機(jī)來說圖片是什么骡男？

那其實(shí)最經(jīng)典的Recptive field如下

如果之前有學(xué)過CNN采驻，其實(shí)是另一種描述方法

對(duì)比兩個(gè)版本對(duì)于卷積層的描述

池化

Max Pooling

完整的CNN架構(gòu)

Playing Go 用來下棋的CNN

直觀看怎么理解充尉？

More

推薦閱讀更多精彩內(nèi)容