用深層神經(jīng)網(wǎng)絡(luò)解釋大腦的運作

姓名:韓宜真

學(xué)號:17020120095

轉(zhuǎn)載自:https://mp.weixin.qq.com/s/iO3g1sTJxr_pSu7HJup9zw

【嵌牛導(dǎo)讀】人工智能領(lǐng)域常提到的神經(jīng)網(wǎng)絡(luò)與大腦的感官機制有極大的相似之處

【嵌牛鼻子】神經(jīng)網(wǎng)絡(luò) 分層處理

【嵌牛提問】科學(xué)家們是如何將人腦的視覺髓帽、聽覺、嗅覺的機制與計算機算法聯(lián)系起來,并優(yōu)化人工智能的呢散吵?

【嵌牛正文】Daniel Yamins惜索,麻省理工學(xué)院博士后的一位計算神經(jīng)科學(xué)婆翔,有時會為了他的機器視覺項目辛苦工作到午夜以后葫男。他煞費苦心地設(shè)計了一個系統(tǒng)膳沽,可以識別圖片中的物體矫渔,而不管其大小彤蔽、位置和其他特性的變化ーー這是人類可以輕松做到的。這個系統(tǒng)是一個深層神經(jīng)網(wǎng)絡(luò)庙洼,一種受到人類大腦啟發(fā)的算法顿痪。Yamins指出一個神經(jīng)網(wǎng)絡(luò)可以像大腦一樣分層次地處理場景的特征,這可以匹配人類識別物體的能力油够。

斯坦福計算神經(jīng)學(xué)家Daniel Yamins

僅在人工智能領(lǐng)域蚁袭,神經(jīng)網(wǎng)絡(luò)就算是一個值得注意的成就,在未來幾年內(nèi)石咬,神經(jīng)網(wǎng)絡(luò)將成為人工智能技術(shù)的寵兒揩悄。但這并不是Yamns和他的同事們的主要目標(biāo)。對他們和其他神經(jīng)科學(xué)家來說鬼悠,他們想利用深層神經(jīng)網(wǎng)絡(luò)來理解大腦結(jié)構(gòu)删性,特別是,科學(xué)家們一直在努力理解大腦內(nèi)部專門處理各種任務(wù)背后的原因焕窝。他們不僅想知道為什么大腦的不同部分做不同的事情蹬挺,而且想知道為什么這些不同會如此具體: 例如,為什么大腦有一個區(qū)域用來識別一般的物體袜啃,而特別是面孔汗侵?用深層神經(jīng)網(wǎng)絡(luò)表明,這種專業(yè)分工可能是解決問題的最有效方法。

類似地晰韵,研究人員已經(jīng)證明发乔,最擅長分類言語、音樂和模擬氣味的深層網(wǎng)絡(luò)雪猪,其結(jié)構(gòu)似乎與大腦的聽覺和嗅覺系統(tǒng)平行栏尚。這些相似之處也出現(xiàn)在深層網(wǎng)絡(luò)中,這些網(wǎng)絡(luò)可以觀察2d 場景并推斷其中3d 物體的基本屬性只恨,這有助于解釋生物感知是如何快速而豐富的译仗。所有這些結(jié)果都暗示,大腦神經(jīng)系統(tǒng)的結(jié)構(gòu)體現(xiàn)了它們所承擔(dān)的任務(wù)的某些最優(yōu)解決方案官觅。

鑒于神經(jīng)科學(xué)家一直對大腦和深層神經(jīng)網(wǎng)絡(luò)之間的比較持懷疑態(tài)度纵菌,這些成功更是出人意料,因為深層神經(jīng)網(wǎng)絡(luò)的工作機制可能是難以解釋的休涤。麻省理工學(xué)院的神經(jīng)學(xué)家 Nancy Kanwisher 說: “老實說咱圆,直到最近,我的實驗室里還沒有人用深度神經(jīng)網(wǎng)絡(luò)功氨⌒蛩眨”〗萜啵“現(xiàn)在忱详,他們中的大多數(shù)人都在定期對他們進行培訓(xùn)《宓樱”

深度神經(jīng)網(wǎng)絡(luò)與遠見

人工神經(jīng)網(wǎng)絡(luò)是由稱為感知機的相互連接部件構(gòu)成的匈睁,感知器是生物神經(jīng)元的簡化數(shù)字模型。網(wǎng)絡(luò)至少有兩層感知器桶错,一層用于輸入層软舌,另一層用于輸出層。將一個或多個“隱藏”層夾在輸入和輸出之間牛曹,你就得到了一個“深層”神經(jīng)網(wǎng)絡(luò); 隱藏層的數(shù)量越多,網(wǎng)絡(luò)就越深醇滥。

可以訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來挑選數(shù)據(jù)中的模式黎比,例如表示貓或狗圖像的模式。訓(xùn)練包括使用一種算法迭代調(diào)整感知器之間連接的強度鸳玩,以便網(wǎng)絡(luò)學(xué)會將給定的輸入(圖像的像素)與正確的標(biāo)簽(貓或狗)聯(lián)系起來阅虫。一旦經(jīng)過訓(xùn)練,深度網(wǎng)絡(luò)就能夠準(zhǔn)確地分類它以前從未見過的輸入圖片不跟。

在深度神經(jīng)網(wǎng)絡(luò)的一般結(jié)構(gòu)和功能中颓帝,并不那么追求模仿大腦,其中調(diào)整后的神經(jīng)元之間的連接強度反映了學(xué)習(xí)后的聯(lián)系。神經(jīng)科學(xué)家會指出大腦和神經(jīng)網(wǎng)絡(luò)類比中包含的局限性: 例如购城,單個神經(jīng)元可能比“啞”感知器更廣泛地處理信息吕座,而深層網(wǎng)絡(luò)通常依賴于感知器之間的一種被稱為反向傳播的交流,這種交流似乎在神經(jīng)系統(tǒng)中并不存在瘪板。然而吴趴,對于計算神經(jīng)科學(xué)家來說,深層網(wǎng)絡(luò)有時似乎是建立大腦部分模型的最佳選擇侮攀。

一個解釋什么是深度學(xué)習(xí)網(wǎng)絡(luò)的數(shù)字

研究人員開發(fā)視覺系統(tǒng)的計算模型受到了我們所知的靈長類視覺系統(tǒng)的影響锣枝,特別是負責(zé)識別人、地點和事物的通路的腦區(qū)兰英,這稱為腹側(cè)視覺流( ventral visual stream)撇叁。在人類中,這種腹側(cè)通路從眼睛開始畦贸,然后進入丘腦的外側(cè)膝狀核(lateral geniculate nucleus)陨闹,一個傳遞感覺信息的中繼站。外側(cè)膝狀核連接初級視覺皮層中一個叫v1的區(qū)域家制,下游是v2和v4區(qū)域正林,最終通向顳下皮層。(非人類靈長類動物的大腦具有同源結(jié)構(gòu)颤殴。)

這背后關(guān)鍵的神經(jīng)科學(xué)見解是觅廓,視覺信息處理是分層次的,分階段進行的: 早期階段處理視野中的低級特征(如邊緣涵但、輪廓杈绸、顏色和形狀) ,而復(fù)雜的表征矮瘟,如整個物體和面孔瞳脓,只出現(xiàn)在后期的下顳葉皮層(inferior temporal cortex)。

視覺信息流通過大腦腹側(cè)視覺流的圖表

這些見解指導(dǎo)了 Yamins 和他的同事們設(shè)計的深度網(wǎng)絡(luò)澈侠。他們的深層網(wǎng)絡(luò)有隱藏層劫侧,其中一些層執(zhí)行“卷積” ,將相同的濾波器應(yīng)用到圖像的每一部分哨啃。每個卷積都捕獲了圖像的不同基本特征烧栋,比如邊緣。更基本的特征在網(wǎng)絡(luò)的早期階段被捕捉到拳球,而更復(fù)雜的特征在更深的階段被捕捉到审姓,就像靈長類動物的視覺系統(tǒng)一樣。當(dāng)一個像 CNN 這樣的卷積神經(jīng)網(wǎng)絡(luò)接受分類圖像的訓(xùn)練時祝峻,它會從隨機初始化的過濾器值開始魔吐,然后學(xué)習(xí)手頭任務(wù)所需的正確值扎筒。

該團隊的四層 CNN 可以識別出5,760張逼真的3D 圖像中描繪的八類物體(動物、船只酬姆、汽車嗜桌、椅子、面孔轴踱、水果症脂、飛機和桌子)。圖片中的物體在姿勢淫僻、位置和比例上差別很大诱篷。即便如此,深層網(wǎng)絡(luò)的性能與人類相當(dāng)雳灵,人類在識別物體方面非常擅長棕所,盡管存在差異。

Yamins 不知道的是悯辙,計算機視覺領(lǐng)域正在醞釀的一場革命也將獨立驗證他和他的同事們正在采取的方法琳省。在他們完成 CNN 的建設(shè)后不久,另一個名為 AlexNet 的 CNN 在年度圖像識別競賽中聲名鵲起躲撰。這也是基于一個層次化的處理架構(gòu)针贬,在早期階段捕捉基本的視覺特征,在高級階段捕捉更復(fù)雜的特征; 它已經(jīng)接受了120萬個標(biāo)記圖像的訓(xùn)練拢蛋,這些圖像呈現(xiàn)了1000個類別的物體桦他。在2012年的競賽中,AlexNet 擊敗了所有其他測試過的算法: 根據(jù)競爭的指標(biāo)谆棱,AlexNet 的錯誤率只有15.3% 快压,而最接近的競爭對手的錯誤率為26.2% 。隨著 AlexNet 的勝利垃瞧,深度神經(jīng)網(wǎng)絡(luò)成為人工智能和機器學(xué)習(xí)領(lǐng)域的有力競爭者蔫劣。

如果他們的 CNN 模仿了一個視覺系統(tǒng),它能預(yù)測神經(jīng)對一個新奇的圖像的反應(yīng)嗎个从?為了找到答案脉幢,研究者首先確定了 CNN 中人工神經(jīng)元的活動如何與兩只恒河猴腹側(cè)視覺流中近300個位點的活動相對應(yīng)。

然后嗦锐,他們利用 CNN 預(yù)測鸵隧,當(dāng)猴子看到不屬于訓(xùn)練數(shù)據(jù)集的圖像時,這些大腦區(qū)域會做出何種反應(yīng)意推。“我們不僅得到了很好的預(yù)測結(jié)果珊蟀,而且還發(fā)現(xiàn)了解剖學(xué)上的一致性菊值,”亞明斯說: CNN 的早期外驱、中期和晚期層分別預(yù)測了早期、中期和高級腦區(qū)的行為腻窒。形式緊隨功能昵宇。

坎維舍記得2014年出版時,這個結(jié)果給他留下了深刻的印象儿子⊥甙ィ“這并不意味著深層神經(jīng)網(wǎng)絡(luò)中的單元在生物物理學(xué)上就像神經(jīng)元一樣,”她說柔逼〗“盡管如此,在功能匹配中還是存在令人震驚的特異性愉适》钢”

專注于聲音

在 Yamins 和 DiCarlo 的研究結(jié)果出來之后,人們開始尋找其他更好的大腦深層網(wǎng)絡(luò)模型维咸,尤其是那些研究不如靈長類動物視覺系統(tǒng)那么透徹的區(qū)域剂买。例如,麻省理工學(xué)院的神經(jīng)科學(xué)家 Josh McDermott 說: “我們對聽覺皮層癌蓖,尤其是人類的聽覺皮層瞬哼,仍然沒有很好的了解”。深度學(xué)習(xí)是否有助于產(chǎn)生關(guān)于大腦如何處理聲音的假說租副?

麻省理工學(xué)院的 Josh McDermott 的照片

這就是McDermott的目標(biāo)坐慰。他的團隊,包括 Alexander Kell 和 Yamins附井,開始設(shè)計深度網(wǎng)來分類兩種聲音: 語音和音樂讨越。首先,他們硬編碼了一個工作原理已被詳細了解的耳蝸模型ーー內(nèi)耳中的聲音傳導(dǎo)器官永毅,其來處理聲音把跨,并將聲音分類成不同頻率的通道,作為輸入到卷積神經(jīng)網(wǎng)絡(luò)沼死。

CNN 接受過訓(xùn)練着逐,既能識別語音音頻片段中的單詞,也能識別混有背景噪音的音樂片段的類型意蛀。團隊尋找了一種深層網(wǎng)絡(luò)體系結(jié)構(gòu)耸别,它可以在不需要大量資源的情況下精確地執(zhí)行這些任務(wù)。

三種架構(gòu)似乎是可能的县钥。深度神經(jīng)網(wǎng)絡(luò)的兩個任務(wù)能共享輸入層秀姐,然后分成兩個不同的網(wǎng)絡(luò)。在另一個極端若贮,任務(wù)可以為其所有處理共享相同的網(wǎng)絡(luò)省有,只有在輸出階段才進行分割痒留。或者它可能是介于兩者之間的幾十個變體之一蠢沿,在這些變體中,網(wǎng)絡(luò)的某些階段是共享的舷蟀,而其他階段是截然不同的恤磷。

不出所料扫步,在輸入層之后有專門路徑的網(wǎng)絡(luò)超過了完全共享路徑的網(wǎng)絡(luò)仿粹。然而晌区,一個混合網(wǎng)絡(luò)---- 在輸入階段之后有七個公共層朗若,然后是兩個分開的五層網(wǎng)絡(luò)---- 和完全分開的網(wǎng)絡(luò)做得差不多遣总。McDermott和他的同事們選擇了混合網(wǎng)絡(luò)作為計算資源最少的網(wǎng)絡(luò)旭斥。

可以執(zhí)行兩個任務(wù)的網(wǎng)絡(luò)的三種體系結(jié)構(gòu)的可視化比較

當(dāng)他們在這些任務(wù)中將混合網(wǎng)絡(luò)與人類進行對比時,結(jié)果非常吻合卒暂。這也與一些研究人員的早期結(jié)果相吻合近速,這些結(jié)果表明,非初級聽覺皮層有處理音樂和語言的不同區(qū)域。在2018年發(fā)表的一項關(guān)鍵測試中弦疮,該模型預(yù)測了人類受試者的大腦活動: 模型的中間層預(yù)測了初級聽覺皮層的反應(yīng),深層預(yù)測了聽覺皮層的較高區(qū)域扰才。這些預(yù)測大大優(yōu)于那些不是基于深度學(xué)習(xí)的模型。

“科學(xué)的目標(biāo)是能夠預(yù)測系統(tǒng)將要做什么躁锡,”McDermott說蜡坊〗┕危“這些人工神經(jīng)網(wǎng)絡(luò)讓我們離神經(jīng)科學(xué)的目標(biāo)更近了一步窍仰。”

Kanwisher最初懷疑深度學(xué)習(xí)對她自己的研究是否有用,受到麥克德莫特模型的啟發(fā)窟绷。Kanwisher 最著名的工作是在20世紀(jì)90年代中后期泰涂,她的工作表明,下顳葉皮層的一個區(qū)域稱為梭狀回面孔區(qū)(FFA)是專門用于面孔識別。當(dāng)受試者盯著人臉圖像時驯妄,F(xiàn)FA 明顯比盯著房屋等物體圖像時更活躍凛剥。為什么大腦將面孔的處理與其他物體的處理分離開來犁享?

傳統(tǒng)上,回答這些“為什么”的問題對神經(jīng)科學(xué)來說一直很困難胳挎。所以 Kanwisher 和她的博士后 Katharina Dobs 以及其他同事饼疙,轉(zhuǎn)向深度卷積1尋求幫助。他們用計算機視覺技術(shù)替代了 AlexNet---- 一種叫做 VGG 的更深層次的卷積神經(jīng)網(wǎng)絡(luò)技術(shù)---- 并在特定的任務(wù)中訓(xùn)練了兩個獨立的深度網(wǎng)絡(luò): 識別面孔和識別物體。

Kanwisher現(xiàn)在是哥倫比亞大學(xué)的博士后窑眯,和 MIT 的 McDermott 一起評估了不同結(jié)構(gòu)策略在神經(jīng)網(wǎng)絡(luò)設(shè)計中的有效性屏积,這些神經(jīng)網(wǎng)絡(luò)可以執(zhí)行多種聽覺任務(wù)。

研究小組發(fā)現(xiàn)磅甩,被訓(xùn)練識別面孔的深層網(wǎng)絡(luò)不善于識別物體炊林,反之亦然,這表明這些網(wǎng)絡(luò)以不同的方式表示面孔和物體卷要。接下來渣聚,團隊在兩個任務(wù)上都訓(xùn)練了一個網(wǎng)絡(luò)。他們發(fā)現(xiàn)僧叉,這個網(wǎng)絡(luò)已經(jīng)在內(nèi)部組織起來奕枝,在網(wǎng)絡(luò)的后期階段將面孔和物體的處理分離開來∑慷椋“ VGG 在后期會自發(fā)地分離隘道,” Kanwisher 說±砂剩“在早期階段不必分離谭梗。”

這與人類視覺系統(tǒng)的組織方式是一致的: 分支只發(fā)生在腹側(cè)視覺通路共享的早期階段的下游(外側(cè)膝狀核和區(qū)域 v 1和 v 2)宛蚓〖つ螅“我們發(fā)現(xiàn),面孔和物體處理的功能性特化自發(fā)地出現(xiàn)在經(jīng)過訓(xùn)練的深層網(wǎng)中,就像人類大腦中的這種情況一樣,”現(xiàn)在就職于吉森的賈斯特斯 · 利比希大學(xué)的多布斯說体箕。

坎維舍說: “最令我興奮的是,我認為我們現(xiàn)在有了一種方法來回答為什么大腦是這個樣子的問題表谊。”盖喷。

氣味的層次

越來越多的這樣的證據(jù)來自于對氣味感知的研究爆办。去年,哥倫比亞大學(xué)的計算神經(jīng)科學(xué)家 Robert Yang 和他的同事設(shè)計了一個深層網(wǎng)絡(luò)來模擬果蠅的嗅覺系統(tǒng)课梳,這個網(wǎng)絡(luò)已經(jīng)被神經(jīng)科學(xué)家詳細地繪制出來了距辆。

第一層氣味處理涉及到嗅覺感覺神經(jīng)元,每個神經(jīng)元只表達大約50種氣味受體中的一種暮刃。所有相同類型的感覺神經(jīng)元跨算,平均大約10個,延伸到處理層次結(jié)構(gòu)的下一層的單個神經(jīng)簇椭懊。

因為在大腦這一層的每一側(cè)都有大約50個這樣的神經(jīng)簇诸蚕,這就在感覺神經(jīng)元和相應(yīng)的神經(jīng)簇之間建立了一對一的映射。神經(jīng)簇與下一層的神經(jīng)元有多個隨機連接,稱為凱尼恩層背犯,該層有大約2500個神經(jīng)元坏瘩,每個神經(jīng)元接收大約7個輸入信號。凱尼恩層被認為與氣味的高級表征有關(guān)漠魏。最后一層大約20個神經(jīng)元提供了蒼蠅用來引導(dǎo)其與氣味相關(guān)的行為的輸出(楊說倔矾,沒有人知道這種輸出是否符合氣味的分類)。

為了看看他們是否能設(shè)計一個計算模型來模擬這個過程柱锹,Yang 和他的同事們首先創(chuàng)建了一個數(shù)據(jù)集來模擬氣味哪自,這個數(shù)據(jù)集不會像圖像那樣激活神經(jīng)元。如果你把兩張貓的圖像疊加起來禁熏,一個像素一個像素地疊加壤巷,得到的圖像可能看起來一點也不像貓。然而瞧毙,如果你混合兩個蘋果的氣味隙笆,它仍然可能聞起來像一個蘋果∩ぃ“這是我們用來設(shè)計嗅覺任務(wù)的關(guān)鍵洞察力,”楊說瘸爽。

他們用四層構(gòu)建了他們的深層網(wǎng)絡(luò): 三層模擬果蠅的加工層您访,一層輸出層。當(dāng)楊和他的同事們訓(xùn)練這個網(wǎng)絡(luò)來分類模擬氣味時剪决,他們發(fā)現(xiàn)這個網(wǎng)絡(luò)的連接性與果蠅大腦中看到的非常相似: 從第一層到第二層的一對一映射灵汪,然后是從第二層到第三層的稀疏和隨機(7對1)映射。

這種相似性表明進化論和深層網(wǎng)絡(luò)都達到了最優(yōu)解柑潦。但楊對他們的結(jié)果仍持謹慎態(tài)度享言。“也許我們只是運氣好渗鬼,也許它不能一概而論览露,”他說。

測試的下一步將是進化出深層的網(wǎng)絡(luò)譬胎,這些網(wǎng)絡(luò)可以預(yù)測一些尚未被研究的動物嗅覺系統(tǒng)的連接性差牛,然后可以被神經(jīng)科學(xué)家證實⊙咔牵“這將為我們的理論提供一個更加嚴(yán)格的檢驗偏化,”

不僅僅是黑匣子

人們常常嘲笑深度網(wǎng)絡(luò)無法將模型應(yīng)用到偏離訓(xùn)練數(shù)據(jù)集太遠的數(shù)據(jù)集上。由于模型是黑匣子而變得臭名昭著镐侯。通過研究數(shù)百萬甚至數(shù)十億的參數(shù)來解釋一個深層網(wǎng)絡(luò)的決定是不可能的侦讨。難道大腦某個部分的深度網(wǎng)絡(luò)模型不僅僅是用一個黑盒子替換另一個黑盒子嗎?

在楊的看法中,并不完全是這樣韵卤。他說: “這仍然比大腦更容易研究骗污。”怜俐。

去年身堡,DiCarlo 的團隊公布的研究,說明了深層網(wǎng)絡(luò)的不透明性及模型缺少泛化能力拍鲤。研究人員使用了一個版本的 AlexNet 來模擬獼猴的腹側(cè)視覺流贴谎,并找出了人工神經(jīng)元單位和猴子的v4區(qū)域的神經(jīng)網(wǎng)絡(luò)之間的對應(yīng)關(guān)系。然后季稳,使用計算模型擅这,他們合成圖像,他們預(yù)測將引出異常高水平的活動在猴子的神經(jīng)元景鼠。

在一個實驗中仲翎,當(dāng)向猴子展示這些“非自然”的圖像時,他們將68%的神經(jīng)部位的活動提高到超過正常水平; 在另一個實驗中铛漓,這些圖像激活了一個神經(jīng)元的活動溯香,同時抑制了附近神經(jīng)元的活動。兩種結(jié)果均用神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測浓恶。

對于研究人員來說玫坛,這些結(jié)果表明深度神經(jīng)網(wǎng)絡(luò)確實可以概括到大腦,而且并不完全是深不可測的包晰∈疲“然而,我們承認... ... 許多其他‘理解’的概念仍有待探索伐憾,以確定這些模型是否以及如何增加對大腦的理解勉痴,”他們在論文中寫道。

深度神經(jīng)網(wǎng)絡(luò)和大腦在結(jié)構(gòu)和性能上的趨同并不一定意味著它們以同樣的方式工作; 在某些方面它們顯然不是這樣的树肃。但是蒸矛,兩種類型的系統(tǒng)可能有足夠的相似之處,遵循相同的廣義管理原則胸嘴。

模型的局限性

McDermott 在這些深度網(wǎng)絡(luò)研究中看到了潛在的治療價值莉钙。今天,當(dāng)人們失去聽力時筛谚,通常是由于耳朵的變化磁玉。大腦的聽覺系統(tǒng)必須應(yīng)付受損的輸入。McDermott 說: “因此驾讲,如果我們有聽覺系統(tǒng)其他部分正在做什么的好模型蚊伞,我們就能更好地知道如何才能真正幫助人們聽得更清楚”席赂。

盡管如此,麥克德莫特仍然對深層卷積網(wǎng)絡(luò)的作用持謹慎態(tài)度时迫÷#“我們一直在努力嘗試?yán)斫馍窠?jīng)網(wǎng)絡(luò)作為模型的局限性,”他說掠拳。

McDermott 實驗室的研究生 Jenelle Feather 和其他人關(guān)注的是元數(shù)據(jù)癞揉,這是一種物理上截然不同的輸入信號,但在系統(tǒng)中會產(chǎn)生相同的表示溺欧。例如喊熟,兩個音頻轉(zhuǎn)換器有不同的波形,但是對于人類來說聲音是一樣的姐刁。通過使用聽覺系統(tǒng)的深層網(wǎng)絡(luò)模型芥牌,研究小組設(shè)計了自然音頻信號的轉(zhuǎn)換器; 這些轉(zhuǎn)換器像音頻剪輯一樣激活了神經(jīng)網(wǎng)絡(luò)的不同階段。如果神經(jīng)網(wǎng)絡(luò)精確地模擬了人類的聽覺系統(tǒng)聂使,那么轉(zhuǎn)換器的聲音也應(yīng)該是一樣的壁拉。

但事實并非如此。在神經(jīng)網(wǎng)絡(luò)的早期階段柏靶,人類識別出產(chǎn)生與相應(yīng)音頻剪輯相同的激活的元音弃理。然而,這并不適用于在網(wǎng)絡(luò)更深層次的階段中能夠匹配激活的元數(shù)據(jù): 這些元數(shù)據(jù)對人類來說聽起來就像噪音屎蜓。McDermott 說: “因此痘昌,盡管在某些情況下,這些模型能夠很好地復(fù)制人類的行為梆靖,但它們也有非常錯誤的地方”仕校”返吻。

在斯坦福大學(xué),Yamins 正在探索這些模型尚不能代表大腦的方法乎婿。例如测僵,許多這樣的模型需要大量的標(biāo)記數(shù)據(jù)來進行訓(xùn)練,而我們的大腦可以毫不費力地從一個例子中學(xué)習(xí)谢翎。人們正在努力開發(fā)無監(jiān)督的深層網(wǎng)絡(luò)捍靠,這種網(wǎng)絡(luò)可以同樣有效地學(xué)習(xí)。深層網(wǎng)絡(luò)還在使用反向傳播算法學(xué)習(xí)森逮,大多數(shù)神經(jīng)科學(xué)家認為這種算法不能在真正的神經(jīng)組織中工作榨婆,因為大腦缺乏適當(dāng)?shù)倪B接“啵“在某種程度上良风,生物學(xué)上似是而非的學(xué)習(xí)規(guī)則確實有效谊迄,這方面已經(jīng)取得了一些重大進展,”Yamins說烟央。

麻省理工學(xué)院的認知神經(jīng)科學(xué)家 Josh Tenenbaum 說统诺,雖然所有這些深層網(wǎng)絡(luò)模型都是真正的進步 ,但它們主要是做分類任務(wù)疑俭。然而粮呢,我們的大腦所做的遠遠不止對外界事物進行分類。我們的視覺系統(tǒng)可以理解表面的幾何形狀和場景的3D結(jié)構(gòu)钞艇,并且可以推斷潛在的因果因素ーー例如啄寡,它可以實時推斷出一棵樹消失只是因為一輛汽車從它前面經(jīng)過。

為了理解大腦的這種能力香璃,Ilker Yildirim與 Tenenbaum 和他的同事一起建立了一個高效的反向圖形模型这难。它從描述要在背景上渲染的臉的參數(shù)開始,比如它的形狀葡秒、紋理姻乓、光線方向、頭部姿勢等眯牧。通過計算機圖形學(xué)中的生成模型蹋岩,根據(jù)這些參數(shù)創(chuàng)建了一個3d場景; 然后,經(jīng)過不同的處理階段学少,它會生成一個從特定位置觀察到的場景的2d圖像剪个。

研究人員利用來自生成模型的3d 和2d 數(shù)據(jù),訓(xùn)練了一個改進版的 AlexNet 來預(yù)測來自不熟悉的2d圖像的3d場景的可能參數(shù)版确。Tenenbaum說: “系統(tǒng)學(xué)會了從影響到原因扣囊,從2D 圖像到產(chǎn)生它的3D 場景的倒推”。

研究小組通過使用模型對恒河猴顳下皮層活動進行預(yù)測來檢驗他們的模型绒疗。他們向獼猴展示了175張圖片侵歇,展示了25個個體的7個姿勢,并記錄了“面部區(qū)域”的神經(jīng)特征吓蘑√杪牵“面部區(qū)域”是專門用于面部識別的視覺處理區(qū)域。他們還向他們的深度學(xué)習(xí)網(wǎng)絡(luò)展示了這些圖片磨镶。在網(wǎng)絡(luò)中溃蔫,第一層人工神經(jīng)元的激活代表二維圖像,最后一層的激活代表三維參數(shù)琳猫。Tenenbaum說: “一路走來伟叛,它經(jīng)歷了一系列的轉(zhuǎn)變,這些轉(zhuǎn)變似乎基本上把你從2D 變成了3D”脐嫂。他們發(fā)現(xiàn)痪伦,這個網(wǎng)絡(luò)的最后三層與獼猴面部處理網(wǎng)絡(luò)的最后三層非常吻合侄榴。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市网沾,隨后出現(xiàn)的幾起案子癞蚕,更是在濱河造成了極大的恐慌,老刑警劉巖辉哥,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件桦山,死亡現(xiàn)場離奇詭異,居然都是意外死亡醋旦,警方通過查閱死者的電腦和手機恒水,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來饲齐,“玉大人钉凌,你說我怎么就攤上這事∥嫒耍” “怎么了御雕?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長滥搭。 經(jīng)常有香客問我酸纲,道長,這世上最難降的妖魔是什么瑟匆? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任闽坡,我火速辦了婚禮,結(jié)果婚禮上愁溜,老公的妹妹穿的比我還像新娘疾嗅。我一直安慰自己,他們只是感情好冕象,可當(dāng)我...
    茶點故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布代承。 她就那樣靜靜地躺著,像睡著了一般交惯。 火紅的嫁衣襯著肌膚如雪次泽。 梳的紋絲不亂的頭發(fā)上穿仪,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天席爽,我揣著相機與錄音,去河邊找鬼啊片。 笑死只锻,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的紫谷。 我是一名探鬼主播齐饮,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼捐寥,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了祖驱?” 一聲冷哼從身側(cè)響起握恳,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎捺僻,沒想到半個月后乡洼,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡匕坯,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年束昵,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片葛峻。...
    茶點故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡锹雏,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出术奖,到底是詐尸還是另有隱情礁遵,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布腰耙,位于F島的核電站榛丢,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏挺庞。R本人自食惡果不足惜晰赞,卻給世界環(huán)境...
    茶點故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望选侨。 院中可真熱鬧掖鱼,春花似錦、人聲如沸援制。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽晨仑。三九已至褐墅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間洪己,已是汗流浹背妥凳。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留答捕,地道東北人逝钥。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像拱镐,于是被迫代替她去往敵國和親艘款。 傳聞我的和親對象是個殘疾皇子持际,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容