卷積神經(jīng)網(wǎng)絡工作原理研究 - 概要

卷積神經(jīng)網(wǎng)絡在圖像識別領域無限風光予借，通過一張圖片，算法可以知道圖片上的物體是什么匪燕，著實令人震驚蕾羊，但是很多人和我一樣，對于其背后的原理帽驯，都非常好奇龟再，卷積神經(jīng)網(wǎng)絡是如何進行圖像識別的呢？

圖像識別

如果你的英文主夠好的話尼变，可以閱讀這篇論文：
Visualizing and Understanding Convolutional Networks

貓應該長成什么樣子

看過女神李飛飛的ImageNet演講的人利凑，都對于下面兩張圖片印象深刻。
原文請閱讀：
ImageNet締造者：讓冰冷的機器讀懂照片背后的故事

（從薛定諤開始嫌术，貓就一直被各種科學家拿出來說事情哀澈，當然汪星人也時不時出鏡）

人類是如何識別貓咪的？借用知乎的一個回答：

現(xiàn)在假設要做一個圖像的分類問題度气，比如辨別一個圖像里是否有一只貓割按，我們可以先判斷是否有貓的頭，貓的尾巴磷籍，貓的身子等等适荣，如果這些特征都具備现柠，那么我就判定這應該是一只貓。當然弛矛，如果圖像是下面這樣一只老實本分的貓咪够吩，則一切都好辦了。

正常的貓

但是喵星人不但品種不同丈氓，顏色繁多周循，各種銷魂的動作也層出不窮，所以万俗，機器識別貓還是很困難的湾笛。

扭曲的貓

這樣，我們必須要讓機器知道该编，貓迄本，到底應該長成什么樣子。

想象中的圖形識別原理

第一次考慮怎么處理這個問題课竣，一個很自然的想法浮想在腦海里面：
將所有貓咪的圖片放在一起嘉赎，提取出貓咪的共同特征，做成一個識別貓的模型于樟。然后對于每張圖片公条，使用模型，看一下是貓的概率為多少迂曲。但是如果真的這樣做的話靶橱，可能每種物體都必須要有一個專門的模型了，這樣可能是不行的路捧，計算量可能也是一個問題关霸。特別對于扭曲的貓，這樣子的例子非常難處理杰扫，我們不太可能窮舉出所有貓的正常和非正常形態(tài)队寇。（毛色，眼神章姓，是否有物體和貓進行交互）

當然佳遣，可以考慮，將貓進行分解凡伊，就如知乎網(wǎng)友所說零渐，貓頭，貓尾巴系忙，貓爪子诵盼，獨立進行識別。這樣不管貓怎么扭曲，都無所謂了拦耐。當然耕腾，如果你是資深貓奴，你可以很高興的說出貓的組成特征杀糯，但是，這樣本質上還是加入了太多的領域專家的干涉苍苞。如果要識別大型粒子加速器固翰，這個是不是要請物理學家參與呢？所以羹呵，機器應該完全屏蔽領域知識才可以做到泛用骂际。

CNN學到了什么？

特征（Representation）冈欢。把原始圖像看做一個維度是像素×通道的向量歉铝，經(jīng)過各種復雜的CNN結構，其實只不過成了另一個向量凑耻。這個向量所在的空間也許有更好的線性可分性太示，也許是相似樣本的“距離”更近，原始的數(shù)據(jù)經(jīng)過變換到了這里之后香浩，就是特征类缤。

瞎談CNN：通過優(yōu)化求解輸入圖像

圖像處理矩陣

雖然不是科班出身，但是以前或多或少看過一些圖像處理的書籍邻吭。
一般的圖像處理都是通過矩陣操作完成的餐弱。

位置和形狀：例如圖像的拉伸，縮放囱晴，旋轉（當然可以是各種效果的組合）膏蚓。
顏色：灰度調整，透明度畸写，濾鏡

具體的顏色矩陣文章：
C++圖像處理 -- 顏色矩陣變換

圖像處理

其實我認為卷積核這個概念驮瞧，應該是從圖像處理矩陣這個概念來的。通過不同的圖像處理矩陣艺糜，可以突出圖像的某些特征剧董，屏蔽掉某些細節(jié)。

圖像濾鏡處理算法：灰度破停、黑白翅楼、底片、浮雕

原圖

處理后的圖片真慢，屏蔽了顏色毅臊，突出了輪廓特征。（貓的輪廓特征保留下來了黑界，顏色特征暫時消失了）

不同卷積核得到的不同的feature map

黑白圖

當然管嬉，實際處理的時候皂林，可能使用的卷積核可能更加復雜。不過蚯撩，如果真的看一下卷積核的工作方式础倍，一般來說，卷積用來進行特征的提取胎挎，而不是進行圖像的預處理的（或者說沟启，是將圖像針對特征進行壓縮的一個過程）。

卷積核

主流圖像識別

上面所說的都大半是猜測犹菇，無論如何也應該看一下真實的算法到底是怎么樣的德迹。圖像識別上最有名氣的算法大概就是Inception模型。整個算法的架構大概是這樣的揭芍，深度也是嘆為觀止胳搞。（當前ResNet神經(jīng)網(wǎng)絡已經(jīng)152層了，計算量相當相當相當可怕）

inception_v3_architecture.png

原始圖像經(jīng)過了深深的流水線之后称杨，最后在Softmax層進行分類肌毅。這個過程中到底發(fā)生了什么事情，圖像在Softmax層變成了什么列另，這個可能是所有人都關心的問題芽腾。本文也想通過長期的研究，能或多或少搞清楚里面的奧秘页衙。這個過程應該是極其艱苦的摊滔，非常困難的。但是對于機器學習的思考卻非常有幫助店乐。

卷積神經(jīng)網(wǎng)絡進化史

最后編輯于：2017.12.06 10:24:16

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末艰躺，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子眨八，更是在濱河造成了極大的恐慌腺兴，老刑警劉巖，帶你破解...
沈念sama閱讀 219,539評論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件廉侧，死亡現(xiàn)場離奇詭異页响，居然都是意外死亡，警方通過查閱死者的電腦和手機段誊，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,594評論 3贊 396
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門闰蚕，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人连舍，你說我怎么就攤上這事没陡。” “怎么了？”我有些...
開封第一講書人閱讀 165,871評論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵盼玄，是天一觀的道長贴彼。經(jīng)常有香客問我，道長埃儿，這世上最難降的妖魔是什么器仗？我笑而不...
開封第一講書人閱讀 58,963評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮蝌箍，結果婚禮上青灼，老公的妹妹穿的比我還像新娘。我一直安慰自己妓盲，他們只是感情好，可當我...
茶點故事閱讀 67,984評論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布专普。她就那樣靜靜地躺著悯衬，像睡著了一般。火紅的嫁衣襯著肌膚如雪檀夹。梳的紋絲不亂的頭發(fā)上筋粗，一...
開封第一講書人閱讀 51,763評論 1贊 307
城市分裂傳說
那天，我揣著相機與錄音炸渡，去河邊找鬼娜亿。笑死，一個胖子當著我的面吹牛蚌堵，可吹牛的內容都是我干的买决。我是一名探鬼主播，決...
沈念sama閱讀 40,468評論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼吼畏，長吁一口氣：“原來是場噩夢啊……” “哼督赤！你這毒婦竟也來了？” 一聲冷哼從身側響起泻蚊，我...
開封第一講書人閱讀 39,357評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤躲舌，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后性雄，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體没卸，經(jīng)...
沈念sama閱讀 45,850評論 1贊 317
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,002評論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年秒旋，在試婚紗的時候發(fā)現(xiàn)自己被綠了约计。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,144評論 1贊 351
活死人
序言：一個原本活蹦亂跳的男人離奇死亡滩褥，死狀恐怖病蛉，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤铺然，帶...
沈念sama閱讀 35,823評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布俗孝，位于F島的核電站，受9級特大地震影響魄健，放射性物質發(fā)生泄漏赋铝。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,483評論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一沽瘦、第九天我趴在偏房一處隱蔽的房頂上張望革骨。院中可真熱鬧，春花似錦析恋、人聲如沸良哲。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,026評論 0贊 22
一樁弒父案助隧，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽筑凫。三九已至，卻和暖如春并村，著一層夾襖步出監(jiān)牢的瞬間巍实，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,150評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工哩牍，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留棚潦，地道東北人。一個月前我還...
沈念sama閱讀 48,415評論 3贊 373
代替公主和親
正文我出身青樓膝昆，卻偏偏與公主長得像丸边，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子外潜，可洞房花燭夜當晚...
茶點故事閱讀 45,092評論 2贊 355