吳恩達(dá)深度學(xué)習(xí)筆記(76)-你應(yīng)該了解的三維卷積

三維卷積(Convolutions over volumes)

在上面筆記中你已經(jīng)知道如何對(duì)二維圖像做卷積了累澡,現(xiàn)在看看如何執(zhí)行卷積不僅僅在二維圖像上苛败,而是三維立體上。

我們從一個(gè)例子開始,假如說你不僅想檢測(cè)灰度圖像的特征级遭,也想檢測(cè)RGB彩色圖像的特征。彩色圖像如果是6×6×3渺尘,這里的3指的是三個(gè)顏色通道挫鸽,你可以把它想象成三個(gè)6×6圖像的堆疊。為了檢測(cè)圖像的邊緣或者其他的特征鸥跟,不是把它跟原來的3×3的過濾器做卷積丢郊,而是跟一個(gè)三維的過濾器,它的維度是3×3×3医咨,這樣這個(gè)過濾器也有三層枫匾,對(duì)應(yīng)紅綠、藍(lán)三個(gè)通道拟淮。

給這些起個(gè)名字(原圖像)干茉,這里的第一個(gè)6代表圖像高度,第二個(gè)6代表寬度很泊,這個(gè)3代表通道的數(shù)目角虫。同樣你的過濾器也有高,寬和通道數(shù)撑蚌,并且圖像的通道數(shù)必須和過濾器的通道數(shù)匹配上遥,所以這兩個(gè)數(shù)(紫色方框標(biāo)記的兩個(gè)數(shù))必須相等。下個(gè)幻燈片里争涌,我們就會(huì)知道這個(gè)卷積操作是如何進(jìn)行的了粉楚,這個(gè)的輸出會(huì)是一個(gè)4×4的圖像,注意是4×4×1,最后一個(gè)數(shù)不是3了模软。

我們研究下這背后的細(xì)節(jié)伟骨,首先先換一張好看的圖片。這個(gè)是6×6×3的圖像燃异,這個(gè)是3×3×3的過濾器携狭,最后一個(gè)數(shù)字通道數(shù)必須和過濾器中的通道數(shù)相匹配。為了簡(jiǎn)化這個(gè)3×3×3過濾器的圖像回俐,我們不把它畫成3個(gè)矩陣的堆疊逛腿,而畫成這樣,一個(gè)三維的立方體仅颇。

為了計(jì)算這個(gè)卷積操作的輸出单默,你要做的就是把這個(gè)3×3×3的過濾器先放到最左上角的位置,這個(gè)3×3×3的過濾器有27個(gè)數(shù)忘瓦,27個(gè)參數(shù)就是3的立方搁廓。依次取這27個(gè)數(shù),然后乘以相應(yīng)的紅綠藍(lán)通道中的數(shù)字耕皮。先取紅色通道的前9個(gè)數(shù)字境蜕,然后是綠色通道,然后再是藍(lán)色通道凌停,乘以左邊黃色立方體覆蓋的對(duì)應(yīng)的27個(gè)數(shù)粱年,然后把這些數(shù)都加起來,就得到了輸出的第一個(gè)數(shù)字罚拟。

如果要計(jì)算下一個(gè)輸出逼泣,你把這個(gè)立方體滑動(dòng)一個(gè)單位,再與這27個(gè)數(shù)相乘舟舒,把它們都加起來,就得到了下一個(gè)輸出嗜憔,以此類推秃励。

那么,這個(gè)能干什么呢吉捶?舉個(gè)例子夺鲜,這個(gè)過濾器是3×3×3的,如果你想檢測(cè)圖像紅色通道的邊緣呐舔,那么你可以將第一個(gè)過濾器設(shè)為

和之前一樣币励,而綠色通道全為0,

珊拼,藍(lán)色也全為0食呻。如果你把這三個(gè)堆疊在一起形成一個(gè)3×3×3的過濾器,那么這就是一個(gè)檢測(cè)垂直邊界的過濾器,但只對(duì)紅色通道有用仅胞。

或者如果你不關(guān)心垂直邊界在哪個(gè)顏色通道里每辟,那么你可以用一個(gè)這樣的過濾器,

干旧,所有三個(gè)通道都是這樣渠欺。所以通過設(shè)置第二個(gè)過濾器參數(shù),你就有了一個(gè)邊界檢測(cè)器椎眯,3×3×3的邊界檢測(cè)器挠将,用來檢測(cè)任意顏色通道里的邊界。參數(shù)的選擇不同编整,你就可以得到不同的特征檢測(cè)器舔稀,所有的都是3×3×3的過濾器。

按照計(jì)算機(jī)視覺的慣例闹击,當(dāng)你的輸入有特定的高寬和通道數(shù)時(shí)镶蹋,你的過濾器可以有不同的高,不同的寬赏半,但是必須一樣的通道數(shù)贺归。理論上,我們的過濾器只關(guān)注紅色通道断箫,或者只關(guān)注綠色或者藍(lán)色通道也是可行的拂酣。

再注意一下這個(gè)卷積立方體,一個(gè)6×6×6的輸入圖像卷積上一個(gè)3×3×3的過濾器仲义,得到一個(gè)4×4的二維輸出婶熬。

現(xiàn)在你已經(jīng)了解了如何對(duì)立方體卷積,還有最后一個(gè)概念埃撵,對(duì)建立卷積神經(jīng)網(wǎng)絡(luò)至關(guān)重要赵颅。就是,如果我們不僅僅想要檢測(cè)垂直邊緣怎么辦暂刘?如果我們同時(shí)檢測(cè)垂直邊緣和水平邊緣饺谬,還有45°傾斜的邊緣,還有70°傾斜的邊緣怎么做谣拣?換句話說募寨,如果你想同時(shí)用多個(gè)過濾器怎么辦?

這是我們上一張幻燈片的圖片森缠,我們讓這個(gè)6×6×3的圖像和這個(gè)3×3×3的過濾器卷積拔鹰,得到4×4的輸出。(第一個(gè))這可能是一個(gè)垂直邊界檢測(cè)器或者是學(xué)習(xí)檢測(cè)其他的特征贵涵。第二個(gè)過濾器可以用橘色來表示列肢,它可以是一個(gè)水平邊緣檢測(cè)器恰画。

所以和第一個(gè)過濾器卷積,可以得到第一個(gè)4×4的輸出例书,然后卷積第二個(gè)過濾器锣尉,得到一個(gè)不同的4×4的輸出。我們做完卷積决采,然后把這兩個(gè)4×4的輸出自沧,取第一個(gè)把它放到前面,然后取第二個(gè)過濾器輸出树瞭,我把它畫在這拇厢,放到后面。所以把這兩個(gè)輸出堆疊在一起晒喷,這樣你就都得到了一個(gè)4×4×2的輸出立方體孝偎,你可以把這個(gè)立方體當(dāng)成,重新畫在這凉敲,就是一個(gè)這樣的盒子衣盾,所以這就是一個(gè)4×4×2的輸出立方體。它用6×6×3的圖像爷抓,然后卷積上這兩個(gè)不同的3×3的過濾器势决,得到兩個(gè)4×4的輸出,它們堆疊在一起蓝撇,形成一個(gè)4×4×2的立方體果复,這里的2的來源于我們用了兩個(gè)不同的過濾器。

我們總結(jié)一下維度渤昌,如果你有一個(gè)n×n×n_c(通道數(shù))的輸入圖像虽抄,在這個(gè)例子中就是6×6×3,這里的n_c就是通道數(shù)目独柑,然后卷積上一個(gè)f×f×n_c迈窟,這個(gè)例子中是3×3×3,按照慣例忌栅,這個(gè)(前一個(gè)n_c)和這個(gè)(后一個(gè)n_c)必須數(shù)值相同菠隆。然后你就得到了(n-f+1)×(n-f+1)×n_(c^' ),這里n_(c^' )其實(shí)就是下一層的通道數(shù)狂秘,它就是你用的過濾器的個(gè)數(shù),在我們的例子中躯肌,那就是4×4×2者春。我寫下這個(gè)假設(shè)時(shí),用的步幅為1清女,并且沒有padding钱烟。如果你用了不同的步幅或者padding,那么這個(gè)n-f+1數(shù)值會(huì)變化,正如前面的視頻演示的那樣拴袭。

這個(gè)對(duì)立方體卷積的概念真的很有用读第,你現(xiàn)在可以用它的一小部分直接在三個(gè)通道的RGB圖像上進(jìn)行操作。更重要的是拥刻,你可以檢測(cè)兩個(gè)特征怜瞒,比如垂直和水平邊緣或者10個(gè)或者128個(gè)或者幾百個(gè)不同的特征,并且輸出的通道數(shù)會(huì)等于你要檢測(cè)的特征數(shù)般哼。

對(duì)于這里的符號(hào)吴汪,我一直用通道數(shù)(n_c)來表示最后一個(gè)維度,在文獻(xiàn)里大家也把它叫做3維立方體的深度蒸眠。這兩個(gè)術(shù)語漾橙,即通道或者深度,經(jīng)常被用在文獻(xiàn)中楞卡。但我覺得深度容易讓人混淆霜运,因?yàn)槟阃ǔR矔?huì)說神經(jīng)網(wǎng)絡(luò)的深度。所以蒋腮,在這些筆記里我會(huì)用通道這個(gè)術(shù)語來表示過濾器的第三個(gè)維度的大小淘捡。

所以你已經(jīng)知道怎么對(duì)立方體做卷積了,你已經(jīng)準(zhǔn)備好了實(shí)現(xiàn)卷積神經(jīng)其中一層了徽惋,在下個(gè)筆記里讓我們看看是怎么做的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末案淋,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子险绘,更是在濱河造成了極大的恐慌踢京,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件宦棺,死亡現(xiàn)場(chǎng)離奇詭異瓣距,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)代咸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門蹈丸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人呐芥,你說我怎么就攤上這事逻杖。” “怎么了思瘟?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵荸百,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我滨攻,道長(zhǎng)够话,這世上最難降的妖魔是什么蓝翰? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮女嘲,結(jié)果婚禮上畜份,老公的妹妹穿的比我還像新娘。我一直安慰自己欣尼,他們只是感情好爆雹,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著媒至,像睡著了一般顶别。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拒啰,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天驯绎,我揣著相機(jī)與錄音,去河邊找鬼谋旦。 笑死剩失,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的册着。 我是一名探鬼主播拴孤,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼甲捏!你這毒婦竟也來了演熟?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤司顿,失蹤者是張志新(化名)和其女友劉穎芒粹,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體大溜,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡化漆,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了钦奋。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片座云。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖付材,靈堂內(nèi)的尸體忽然破棺而出朦拖,到底是詐尸還是另有隱情,我是刑警寧澤厌衔,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布贞谓,位于F島的核電站,受9級(jí)特大地震影響葵诈,放射性物質(zhì)發(fā)生泄漏裸弦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一作喘、第九天 我趴在偏房一處隱蔽的房頂上張望理疙。 院中可真熱鬧,春花似錦泞坦、人聲如沸窖贤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赃梧。三九已至,卻和暖如春豌熄,著一層夾襖步出監(jiān)牢的瞬間授嘀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工锣险, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蹄皱,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓芯肤,卻偏偏與公主長(zhǎng)得像巷折,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子崖咨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容