2018-01-24

第一課：為什么計(jì)算機(jī)視覺(jué)能夠發(fā)展迅速

大數(shù)據(jù)以及算法開(kāi)發(fā)將會(huì)使智能系統(tǒng)的測(cè)試誤差逐漸趨近于貝葉斯最優(yōu)誤差。這個(gè)結(jié)果將會(huì)導(dǎo)致人工智能的表現(xiàn)全方位超越人類(lèi)切蟋，其中包括自然識(shí)別方面的工作融柬。像TensorFlow這樣的開(kāi)源軟件鸽素，就可以幫助你用遷移學(xué)習(xí)的方法迅速實(shí)現(xiàn)其任何物體的探測(cè)器隆判。用遷移學(xué)習(xí)的方法你只需要大約100-500個(gè)訓(xùn)練實(shí)例就可以得到很好的結(jié)果。手動(dòng)標(biāo)記100個(gè)實(shí)例的工作量并不太俯渤，所以你可以很快得到一個(gè)最小化可用模型呆细。

第二課：卷積是如何工作的？

吳恩達(dá)解釋了如何實(shí)現(xiàn)卷積算符并展示了如何用它檢測(cè)物體邊緣八匠。他同時(shí)還解釋了其他的過(guò)濾器絮爷，比如說(shuō)索貝爾過(guò)濾器(Sobel filter)，這種過(guò)濾器在圖像邊緣中部采用更大的比重梨树。然后坑夯，吳恩達(dá)解釋了這些過(guò)濾器的比重并不是靠人為設(shè)計(jì)的，而是依靠類(lèi)似于梯度下降的這樣的爬山算法由計(jì)算機(jī)自行訓(xùn)練出來(lái)的抡四。

第三課：為什么要用卷積柜蜈？

吳恩達(dá)透徹的解釋了卷積適用于圖像識(shí)別的原因。其中有兩個(gè)具體的原因指巡。第一個(gè)是參數(shù)共享淑履。大體的想法是如果一個(gè)特征探測(cè)器對(duì)于圖像的某一部分很有效，這個(gè)探測(cè)器很可能對(duì)圖像的其他部分也有效藻雪。比如說(shuō)秘噪，一個(gè)邊緣探測(cè)器可能對(duì)圖像的很多部分都有用。特征分享的方法能夠降低系統(tǒng)參數(shù)的數(shù)量阔涉，同時(shí)能夠帶來(lái)穩(wěn)健的平移不變性(translation invariance)缆娃。平移不變性是一個(gè)概念，意思是比如說(shuō)有一張貓的圖片瑰排，即使是經(jīng)過(guò)了移動(dòng)和旋轉(zhuǎn)贯要，依舊是一只貓的圖片。

第二個(gè)原因被稱(chēng)作稀疏連結(jié)性椭住，即每個(gè)輸出層僅僅由很小一部分輸入結(jié)點(diǎn)計(jì)算得到（更具體一些崇渗，輸入的數(shù)量是過(guò)濾器數(shù)量的平方）。用這個(gè)方法可以極大的減少網(wǎng)絡(luò)中參數(shù)的數(shù)量京郑，提高訓(xùn)練速度宅广。

第四課：為什么使用填充（Padding）？

填充通常用來(lái)保持輸入的數(shù)量（也就是說(shuō)些举，使得輸入輸出的維度相同）跟狱。用這個(gè)方法也可以保證在進(jìn)行訓(xùn)練時(shí)，來(lái)自圖片邊緣的貢獻(xiàn)和來(lái)自中心的貢獻(xiàn)相當(dāng)户魏。

第五課：為什么使用最大池化層（Max Pooling）驶臊？

實(shí)證研究證明，最大池化層對(duì)于CNN非常有效叼丑。通過(guò)對(duì)圖像向下取樣关翎，我們減少了參數(shù)數(shù)量，同時(shí)也確保圖像特征在圖像尺度變化或者方向變化時(shí)保持不變鸠信。

第六課：經(jīng)典網(wǎng)絡(luò)架構(gòu)

吳恩達(dá)展示了3種經(jīng)典的神經(jīng)網(wǎng)絡(luò)架構(gòu)纵寝，包括LeNet-5, AlexNet 和VGG-16。他所展示的主要觀點(diǎn)是一個(gè)有效的神經(jīng)網(wǎng)絡(luò)通常是通道的數(shù)目不斷上升星立，寬度和高度不斷下降爽茴。

第七課：為什么ResNets 有效？

對(duì)于一般的神經(jīng)網(wǎng)絡(luò)贞铣，由于梯度的消失和爆炸闹啦，訓(xùn)練誤差并不會(huì)隨著網(wǎng)絡(luò)層數(shù)的增加而單調(diào)遞減。然而對(duì)于ResNets而言辕坝，可以通過(guò)向前跳躍性連接窍奋，讓你在訓(xùn)練一個(gè)很大的神經(jīng)網(wǎng)絡(luò)時(shí)，誤差單調(diào)下降酱畅，性能單調(diào)遞增琳袄。

image

第八課：使用遷移學(xué)習(xí)！

如果從頭開(kāi)始訓(xùn)練一個(gè)像inception這種結(jié)構(gòu)巨大的神經(jīng)網(wǎng)絡(luò)纺酸，即使在GPU上訓(xùn)練也可能需要好幾周的時(shí)間窖逗。你可以下載經(jīng)過(guò)預(yù)訓(xùn)練得到的權(quán)重，然后只重新訓(xùn)練最后的softmax層（或者最后幾個(gè)層）餐蔬。這個(gè)會(huì)極大縮短訓(xùn)練時(shí)間碎紊。這種方法有效的原因是前幾層所訓(xùn)練的特征很可能是諸如邊界或者彎曲線(xiàn)條之類(lèi)的所有圖像的共同特征佑附。

第九課：如何在計(jì)算機(jī)視覺(jué)競(jìng)賽中獲勝

吳恩達(dá)解釋說(shuō)，你需要獨(dú)立的訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)然后取結(jié)果的平均值仗考，來(lái)獲得更好的結(jié)果音同。一些數(shù)據(jù)增強(qiáng)的技術(shù)，比如說(shuō)隨機(jī)裁剪圖片秃嗜，沿水平垂直軸翻轉(zhuǎn)圖像可以幫助提升模型表現(xiàn)权均。總之锅锨，你一開(kāi)始應(yīng)該使用開(kāi)源軟件庫(kù)和預(yù)訓(xùn)練模型叽赊，然后根據(jù)自己要解決的問(wèn)題不斷細(xì)化模型，調(diào)整參數(shù)必搞。

第十課：如何實(shí)現(xiàn)對(duì)象檢測(cè)

首先必指，吳恩達(dá)解釋了從圖片中檢測(cè)標(biāo)志性物體的思路。基本上來(lái)說(shuō)恕洲，這些標(biāo)志性物體將成為最終輸出結(jié)果的一部分取劫。通過(guò)一些有效的卷積操作，你會(huì)得到一個(gè)輸出值研侣，表示一個(gè)物體出現(xiàn)在某個(gè)區(qū)域的概率和區(qū)域的位置谱邪。同時(shí)，他解釋了如何通過(guò)交集并集商評(píng)估對(duì)象檢測(cè)器的有效性庶诡。最后惦银，吳恩達(dá)結(jié)合所有構(gòu)成要素，解釋了著名的YOLO算法末誓。

第十一課：如何實(shí)現(xiàn)面部識(shí)別

面部識(shí)別是一個(gè)單樣本學(xué)習(xí)(one-shot learning)問(wèn)題扯俱，因?yàn)槟阌锌赡苤荒芨鶕?jù)一張示例圖片來(lái)辨別一個(gè)人。解決問(wèn)題的方法是使用相似性函數(shù)喇澡，這個(gè)函數(shù)可以給出兩個(gè)圖像之間的相似程度迅栅。所以，如果兩張圖像是同一個(gè)人晴玖，你希望這個(gè)函數(shù)輸出一個(gè)較小的數(shù)值读存；不同人的兩張圖像則輸出較大的數(shù)值。

吳恩達(dá)給出的第一個(gè)解決方案被稱(chēng)作siamese網(wǎng)絡(luò)呕屎。它的基本思路是將兩張不同的圖片輸入到同一個(gè)神經(jīng)網(wǎng)絡(luò)然后比較結(jié)果让簿。如果輸出相似性很高，那么很有可能是同一個(gè)人秀睛。神經(jīng)網(wǎng)絡(luò)訓(xùn)練的目標(biāo)就是如果兩個(gè)輸入的圖片是同一個(gè)人尔当，那么輸出的結(jié)果距離相對(duì)很小。

對(duì)于第二種解決方案蹂安，他給出了一個(gè)三元損失方法(triplet loss method)椭迎。這個(gè)方法是锐帜，從三張圖片（Anchor (A), Positive (P) and Negative (N)）訓(xùn)練得到一個(gè)神經(jīng)網(wǎng)絡(luò)，使得 A與P 的結(jié)果相似程度遠(yuǎn)遠(yuǎn)高于A與N的結(jié)果相似程度畜号。

image

第十二課：如何用神經(jīng)風(fēng)格遷移(Neural Style Transfer)的方法創(chuàng)造藝術(shù)作品

吳恩達(dá)解釋了如何結(jié)合風(fēng)格和內(nèi)容創(chuàng)造新的圖畫(huà)抹估。示例如下。神經(jīng)風(fēng)格遷移方法的核心在于充分理解神經(jīng)網(wǎng)絡(luò)中每一個(gè)卷積層對(duì)應(yīng)的具體的視覺(jué)表征弄兜。實(shí)際表明，網(wǎng)絡(luò)當(dāng)中前幾層通常學(xué)習(xí)簡(jiǎn)單的特征瓷式，比如圖像邊緣替饿。后幾層通常學(xué)習(xí)一些復(fù)雜的對(duì)象，比如臉贸典，腳视卢，汽車(chē)等。

image

為了創(chuàng)建一個(gè)神經(jīng)風(fēng)格轉(zhuǎn)移圖畫(huà)廊驼，你只需要定義一個(gè)結(jié)合風(fēng)格和內(nèi)容相似性的凸函數(shù)作為損失函數(shù)据过。具體而言，這個(gè)函數(shù)可以寫(xiě)成：

image

在這個(gè)方程中妒挎，G是被創(chuàng)造出的圖像绳锅，C是圖像內(nèi)容，S是圖像風(fēng)格酝掩。簡(jiǎn)單的采用梯度下降法來(lái)對(duì)損失函數(shù)就生成圖像求最小值鳞芙。

基本步驟如下：

隨機(jī)生成G。
使用梯度下降方法最小化J(G)期虾，通過(guò)這個(gè)等式: G:=G-dG(J(G))
重復(fù)第二步原朝。

結(jié)論：

完成這門(mén)課程之后，你會(huì)對(duì)大量計(jì)算機(jī)視覺(jué)方面的文獻(xiàn)有一個(gè)直觀的認(rèn)識(shí)镶苞。同時(shí)課后作業(yè)讓你有機(jī)會(huì)自己實(shí)現(xiàn)部分算法喳坠。完成這門(mén)課程后，你不會(huì)很快成為一個(gè)計(jì)算機(jī)視覺(jué)方面的專(zhuān)家茂蚓，但是它可能會(huì)開(kāi)啟你計(jì)算機(jī)視覺(jué)相關(guān)的想法和事業(yè)壕鹉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市聋涨，隨后出現(xiàn)的幾起案子御板，更是在濱河造成了極大的恐慌，老刑警劉巖牛郑，帶你破解...
沈念sama閱讀 219,539評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件怠肋，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡淹朋，警方通過(guò)查閱死者的電腦和手機(jī)笙各，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,594評(píng)論 3贊 396
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)钉答，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人杈抢，你說(shuō)我怎么就攤上這事数尿。” “怎么了惶楼？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵右蹦，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我歼捐，道長(zhǎng)何陆，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任豹储，我火速辦了婚禮贷盲，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘剥扣。我一直安慰自己巩剖，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,984評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布钠怯。她就那樣靜靜地躺著佳魔，像睡著了一般。火紅的嫁衣襯著肌膚如雪晦炊。梳的紋絲不亂的頭發(fā)上吃引，一...
開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1贊 307
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音刽锤，去河邊找鬼镊尺。笑死，一個(gè)胖子當(dāng)著我的面吹牛并思，可吹牛的內(nèi)容都是我干的庐氮。我是一名探鬼主播，決...
沈念sama閱讀 40,468評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼宋彼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼弄砍！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起输涕，我...
開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤音婶，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后莱坎，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體衣式，經(jīng)...
沈念sama閱讀 45,850評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,002評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了碴卧。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弱卡。...
茶點(diǎn)故事閱讀 40,144評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖住册，靈堂內(nèi)的尸體忽然破棺而出婶博，到底是詐尸還是另有隱情，我是刑警寧澤荧飞，帶...
沈念sama閱讀 35,823評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布凡人，位于F島的核電站，受9級(jí)特大地震影響叹阔，放射性物質(zhì)發(fā)生泄漏挠轴。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,483評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一条获、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧蒋歌，春花似錦帅掘、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0贊 22
一樁弒父案修档，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至府框，卻和暖如春吱窝，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背迫靖。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工院峡，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人系宜。一個(gè)月前我還...
沈念sama閱讀 48,415評(píng)論 3贊 373
代替公主和親
正文我出身青樓照激，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親盹牧。傳聞我的和親對(duì)象是個(gè)殘疾皇子俩垃，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,092評(píng)論 2贊 355

2018-01-24

推薦閱讀更多精彩內(nèi)容