2018-01-24

第一課:為什么計(jì)算機(jī)視覺(jué)能夠發(fā)展迅速

大數(shù)據(jù)以及算法開(kāi)發(fā)將會(huì)使智能系統(tǒng)的測(cè)試誤差逐漸趨近于貝葉斯最優(yōu)誤差。這個(gè)結(jié)果將會(huì)導(dǎo)致人工智能的表現(xiàn)全方位超越人類(lèi)切蟋,其中包括自然識(shí)別方面的工作融柬。像TensorFlow這樣的開(kāi)源軟件鸽素,就可以幫助你用遷移學(xué)習(xí)的方法迅速實(shí)現(xiàn)其任何物體的探測(cè)器隆判。用遷移學(xué)習(xí)的方法你只需要大約100-500個(gè)訓(xùn)練實(shí)例就可以得到很好的結(jié)果。手動(dòng)標(biāo)記100個(gè)實(shí)例的工作量并不太俯渤,所以你可以很快得到一個(gè)最小化可用模型呆细。

第二課:卷積是如何工作的?

吳恩達(dá)解釋了如何實(shí)現(xiàn)卷積算符并展示了如何用它檢測(cè)物體邊緣八匠。他同時(shí)還解釋了其他的過(guò)濾器絮爷,比如說(shuō)索貝爾過(guò)濾器(Sobel filter),這種過(guò)濾器在圖像邊緣中部采用更大的比重梨树。然后坑夯,吳恩達(dá)解釋了這些過(guò)濾器的比重并不是靠人為設(shè)計(jì)的,而是依靠類(lèi)似于梯度下降的這樣的爬山算法由計(jì)算機(jī)自行訓(xùn)練出來(lái)的抡四。

第三課:為什么要用卷積柜蜈?

吳恩達(dá)透徹的解釋了卷積適用于圖像識(shí)別的原因。其中有兩個(gè)具體的原因指巡。第一個(gè)是參數(shù)共享淑履。大體的想法是如果一個(gè)特征探測(cè)器對(duì)于圖像的某一部分很有效,這個(gè)探測(cè)器很可能對(duì)圖像的其他部分也有效藻雪。比如說(shuō)秘噪,一個(gè)邊緣探測(cè)器可能對(duì)圖像的很多部分都有用。特征分享的方法能夠降低系統(tǒng)參數(shù)的數(shù)量阔涉,同時(shí)能夠帶來(lái)穩(wěn)健的平移不變性(translation invariance)缆娃。平移不變性是一個(gè)概念,意思是比如說(shuō)有一張貓的圖片瑰排,即使是經(jīng)過(guò)了移動(dòng)和旋轉(zhuǎn)贯要,依舊是一只貓的圖片。

第二個(gè)原因被稱(chēng)作稀疏連結(jié)性椭住,即每個(gè)輸出層僅僅由很小一部分輸入結(jié)點(diǎn)計(jì)算得到(更具體一些崇渗,輸入的數(shù)量是過(guò)濾器數(shù)量的平方)。用這個(gè)方法可以極大的減少網(wǎng)絡(luò)中參數(shù)的數(shù)量京郑,提高訓(xùn)練速度宅广。

第四課:為什么使用填充(Padding)?

填充通常用來(lái)保持輸入的數(shù)量(也就是說(shuō)些举,使得輸入輸出的維度相同)跟狱。用這個(gè)方法也可以保證在進(jìn)行訓(xùn)練時(shí),來(lái)自圖片邊緣的貢獻(xiàn)和來(lái)自中心的貢獻(xiàn)相當(dāng)户魏。

第五課:為什么使用最大池化層(Max Pooling)驶臊?

實(shí)證研究證明,最大池化層對(duì)于CNN非常有效叼丑。通過(guò)對(duì)圖像向下取樣关翎,我們減少了參數(shù)數(shù)量,同時(shí)也確保圖像特征在圖像尺度變化或者方向變化時(shí)保持不變鸠信。

第六課:經(jīng)典網(wǎng)絡(luò)架構(gòu)

吳恩達(dá)展示了3種經(jīng)典的神經(jīng)網(wǎng)絡(luò)架構(gòu)纵寝,包括LeNet-5, AlexNet 和VGG-16。他所展示的主要觀點(diǎn)是一個(gè)有效的神經(jīng)網(wǎng)絡(luò)通常是通道的數(shù)目不斷上升星立,寬度和高度不斷下降爽茴。

第七課:為什么ResNets 有效?

對(duì)于一般的神經(jīng)網(wǎng)絡(luò)贞铣,由于梯度的消失和爆炸闹啦,訓(xùn)練誤差并不會(huì)隨著網(wǎng)絡(luò)層數(shù)的增加而單調(diào)遞減。然而對(duì)于ResNets而言辕坝,可以通過(guò)向前跳躍性連接窍奋,讓你在訓(xùn)練一個(gè)很大的神經(jīng)網(wǎng)絡(luò)時(shí),誤差單調(diào)下降酱畅,性能單調(diào)遞增琳袄。

image

第八課:使用遷移學(xué)習(xí)!

如果從頭開(kāi)始訓(xùn)練一個(gè)像inception這種結(jié)構(gòu)巨大的神經(jīng)網(wǎng)絡(luò)纺酸,即使在GPU上訓(xùn)練也可能需要好幾周的時(shí)間窖逗。你可以下載經(jīng)過(guò)預(yù)訓(xùn)練得到的權(quán)重,然后只重新訓(xùn)練最后的softmax層(或者最后幾個(gè)層)餐蔬。這個(gè)會(huì)極大縮短訓(xùn)練時(shí)間碎紊。這種方法有效的原因是前幾層所訓(xùn)練的特征很可能是諸如邊界或者彎曲線(xiàn)條之類(lèi)的所有圖像的共同特征佑附。

第九課:如何在計(jì)算機(jī)視覺(jué)競(jìng)賽中獲勝

吳恩達(dá)解釋說(shuō),你需要獨(dú)立的訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)然后取結(jié)果的平均值仗考,來(lái)獲得更好的結(jié)果音同。一些數(shù)據(jù)增強(qiáng)的技術(shù),比如說(shuō)隨機(jī)裁剪圖片秃嗜,沿水平垂直軸翻轉(zhuǎn)圖像可以幫助提升模型表現(xiàn)权均。總之锅锨,你一開(kāi)始應(yīng)該使用開(kāi)源軟件庫(kù)和預(yù)訓(xùn)練模型叽赊,然后根據(jù)自己要解決的問(wèn)題不斷細(xì)化模型,調(diào)整參數(shù)必搞。

第十課:如何實(shí)現(xiàn)對(duì)象檢測(cè)

首先必指,吳恩達(dá)解釋了從圖片中檢測(cè)標(biāo)志性物體的思路。基本上來(lái)說(shuō)恕洲,這些標(biāo)志性物體將成為最終輸出結(jié)果的一部分取劫。通過(guò)一些有效的卷積操作,你會(huì)得到一個(gè)輸出值研侣,表示一個(gè)物體出現(xiàn)在某個(gè)區(qū)域的概率和區(qū)域的位置谱邪。同時(shí),他解釋了如何通過(guò)交集并集商評(píng)估對(duì)象檢測(cè)器的有效性庶诡。最后惦银,吳恩達(dá)結(jié)合所有構(gòu)成要素,解釋了著名的YOLO算法末誓。

第十一課:如何實(shí)現(xiàn)面部識(shí)別

面部識(shí)別是一個(gè)單樣本學(xué)習(xí)(one-shot learning)問(wèn)題扯俱,因?yàn)槟阌锌赡苤荒芨鶕?jù)一張示例圖片來(lái)辨別一個(gè)人。解決問(wèn)題的方法是使用相似性函數(shù)喇澡,這個(gè)函數(shù)可以給出兩個(gè)圖像之間的相似程度迅栅。所以,如果兩張圖像是同一個(gè)人晴玖,你希望這個(gè)函數(shù)輸出一個(gè)較小的數(shù)值读存;不同人的兩張圖像則輸出較大的數(shù)值。

吳恩達(dá)給出的第一個(gè)解決方案被稱(chēng)作siamese網(wǎng)絡(luò)呕屎。它的基本思路是將兩張不同的圖片輸入到同一個(gè)神經(jīng)網(wǎng)絡(luò)然后比較結(jié)果让簿。如果輸出相似性很高,那么很有可能是同一個(gè)人秀睛。神經(jīng)網(wǎng)絡(luò)訓(xùn)練的目標(biāo)就是如果兩個(gè)輸入的圖片是同一個(gè)人尔当,那么輸出的結(jié)果距離相對(duì)很小。

對(duì)于第二種解決方案蹂安,他給出了一個(gè)三元損失方法(triplet loss method)椭迎。這個(gè)方法是锐帜,從三張圖片(Anchor (A), Positive (P) and Negative (N))訓(xùn)練得到一個(gè)神經(jīng)網(wǎng)絡(luò),使得 A與P 的結(jié)果相似程度遠(yuǎn)遠(yuǎn)高于A與N的結(jié)果相似程度畜号。

image
image

第十二課:如何用神經(jīng)風(fēng)格遷移(Neural Style Transfer)的方法創(chuàng)造藝術(shù)作品

吳恩達(dá)解釋了如何結(jié)合風(fēng)格和內(nèi)容創(chuàng)造新的圖畫(huà)抹估。示例如下。神經(jīng)風(fēng)格遷移方法的核心在于充分理解神經(jīng)網(wǎng)絡(luò)中每一個(gè)卷積層對(duì)應(yīng)的具體的視覺(jué)表征弄兜。實(shí)際表明,網(wǎng)絡(luò)當(dāng)中前幾層通常學(xué)習(xí)簡(jiǎn)單的特征瓷式,比如圖像邊緣替饿。后幾層通常學(xué)習(xí)一些復(fù)雜的對(duì)象,比如臉贸典,腳视卢,汽車(chē)等。

image

為了創(chuàng)建一個(gè)神經(jīng)風(fēng)格轉(zhuǎn)移圖畫(huà)廊驼,你只需要定義一個(gè)結(jié)合風(fēng)格和內(nèi)容相似性的凸函數(shù)作為損失函數(shù)据过。具體而言,這個(gè)函數(shù)可以寫(xiě)成:

image

在這個(gè)方程中妒挎,G是被創(chuàng)造出的圖像绳锅,C是圖像內(nèi)容,S是圖像風(fēng)格酝掩。簡(jiǎn)單的采用梯度下降法來(lái)對(duì)損失函數(shù)就生成圖像求最小值鳞芙。

基本步驟如下:

  1. 隨機(jī)生成G。

  2. 使用梯度下降方法最小化J(G)期虾,通過(guò)這個(gè)等式: G:=G-dG(J(G))

  3. 重復(fù)第二步原朝。

結(jié)論:

完成這門(mén)課程之后,你會(huì)對(duì)大量計(jì)算機(jī)視覺(jué)方面的文獻(xiàn)有一個(gè)直觀的認(rèn)識(shí)镶苞。同時(shí)課后作業(yè)讓你有機(jī)會(huì)自己實(shí)現(xiàn)部分算法喳坠。完成這門(mén)課程后,你不會(huì)很快成為一個(gè)計(jì)算機(jī)視覺(jué)方面的專(zhuān)家茂蚓,但是它可能會(huì)開(kāi)啟你計(jì)算機(jī)視覺(jué)相關(guān)的想法和事業(yè)壕鹉。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市聋涨,隨后出現(xiàn)的幾起案子御板,更是在濱河造成了極大的恐慌,老刑警劉巖牛郑,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件怠肋,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡淹朋,警方通過(guò)查閱死者的電腦和手機(jī)笙各,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門(mén)钉答,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人杈抢,你說(shuō)我怎么就攤上這事数尿。” “怎么了惶楼?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵右蹦,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我歼捐,道長(zhǎng)何陆,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任豹储,我火速辦了婚禮贷盲,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘剥扣。我一直安慰自己巩剖,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布钠怯。 她就那樣靜靜地躺著佳魔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪晦炊。 梳的紋絲不亂的頭發(fā)上吃引,一...
    開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音刽锤,去河邊找鬼镊尺。 笑死,一個(gè)胖子當(dāng)著我的面吹牛并思,可吹牛的內(nèi)容都是我干的庐氮。 我是一名探鬼主播,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼宋彼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼弄砍!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起输涕,我...
    開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤音婶,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后莱坎,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體衣式,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了碴卧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弱卡。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖住册,靈堂內(nèi)的尸體忽然破棺而出婶博,到底是詐尸還是另有隱情,我是刑警寧澤荧飞,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布凡人,位于F島的核電站,受9級(jí)特大地震影響叹阔,放射性物質(zhì)發(fā)生泄漏挠轴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一条获、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧蒋歌,春花似錦帅掘、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至府框,卻和暖如春吱窝,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背迫靖。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工院峡, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人系宜。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓照激,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親盹牧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子俩垃,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容