解讀《Compositional Attention Networks for Machine Reasoning》附代碼。

標題：機器推理的合成注意網(wǎng)絡

來源：ICLR 2018https://arxiv.org/abs/1803.03067；

代碼：https://github.com/stanfordnlp/mac-network

一、問題提出

雖然當前的深度神經(jīng)網(wǎng)絡模型在學習”輸入和輸出之間的直接映射“方面非常有效，其深度虏劲、規(guī)模和統(tǒng)計特性使得它們能夠處理嘈雜和多樣化的數(shù)據(jù)，但也限制了它們的可解釋性褒颈，無法展示出一個連貫且透明的“思維過程”來得到他們的預測柒巫。

深度學習系統(tǒng)缺少推理能力，例如下例中谷丸，問題需要分步解決——從一個對象遍歷到相關對象堡掏，迭代地朝著最終解決方案前進。

建立連貫的多步推理模型對于完成理解任務至關重要淤井，作者文中提到了前人提出的一些將符號結構和神經(jīng)模塊起來的方法布疼，例如：神經(jīng)模塊網(wǎng)絡摊趾，其存在一定的問題币狠，必須依賴于外部提供的結構化表示和功能程序，并且需要相對復雜的多階段強化學習訓練方案砾层。這些模型結構的剛性和對特定操作模塊的使用削弱了它們的魯棒性和泛化能力漩绵。

為了在端到端的神經(jīng)網(wǎng)絡方法的通用性和魯棒性與支持更加明確和結構化推理的需求之間取得平衡，作者提出了MAC 網(wǎng)絡肛炮，這是一種端到端的可微推理架構止吐，用來順序執(zhí)行具體推理任務宝踪。

二、主要思想

給定一個知識庫K(對于VQA碍扔，是一個圖像)和一個任務描述q(對于VQA瘩燥，是一個問題)，MAC網(wǎng)絡將問題分解為一系列推理步驟不同，每一個推理步驟使用一個MAC單元厉膀。

其組成主要包括三部分：

1、輸入單元

2二拐、堆疊的MAC單元（執(zhí)行推理任務）

3服鹅、輸出單元

設計理念：

MAC網(wǎng)絡內部的設計作者借鑒了計算機體系結構的知識，將控制和內存分離百新，通過串行執(zhí)行一系列指令來操作：

Step1：控制器獲取指令并進行解碼企软；

Step2：按照指令的指示，從內存中讀取信息饭望；

Step3：執(zhí)行指令仗哨，選擇地寫入相應的內存，并考慮處理的信息進行下一步循環(huán)杰妓。

組成：

基于此藻治，MAC單元顯式地將內存與控制分離，內部保持雙重隱藏狀態(tài)：維度為d的控制狀態(tài)ci和內存狀態(tài)mi巷挥，并由三個串聯(lián)工作的操作單元組成桩卵，以執(zhí)行一個推理步驟：

1.控制單元Control：在每一步選擇性地處理問題詞序列中的一些部分來計算推理操作（這一步計算注意力來得到單詞序列上的概率分布，表示該步驟對每個詞的關注程度）倍宾，并更新控制狀態(tài)來表示單元要執(zhí)行的推理操作雏节。

2.讀取單元Read：在控制狀態(tài)的指導下，從知識庫中提取相關信息（在圖片中選擇性關注部分區(qū)域高职，同樣使用注意力分布來表示提取到的信息）

3.寫單元Write：將提取到的新信息和前一步內存狀態(tài)整合在一起钩乍，存儲中間結果并更新內存狀態(tài)——該狀態(tài)為當前推理獲得的結果。

初始化：

控制單元：

讀取單元：

可視化注意力：

例子：問題“what color is the matte thing to the right of the sphere in front of the tiny blue block”怔锌，首先找到藍色小塊并更新m1寥粹，之后控制單元關注到”the sphere in front of“，找到前面的球體并更新m2 埃元，最后關注到"the matte thing to the right of"涝涤，找到問題的結果：紫色圓柱。

寫單元：

Part3：輸出單元

三岛杀、實驗

實驗：CLEVR數(shù)據(jù)集

結果：

可解釋性：

計數(shù)：

四阔拳、總結

1、保持問題和圖像的表征空間之間的嚴格分離(它們只能通過可解釋的離散分布進行交互)类嗤，極大地增強了網(wǎng)絡的可泛化性糊肠，并提高了其透明度辨宠。

2、不同于模塊網(wǎng)絡货裹，MAC是端到端的完全可微網(wǎng)絡嗤形，無需額外的監(jiān)督數(shù)據(jù)，通過MAC單元的堆疊順序執(zhí)行推理才做弧圆，不需要依靠語法樹或者其他設計和部署模塊集合派殷。此外，與深度神經(jīng)網(wǎng)絡方法相比墓阀，MAC具有更好的泛化性能毡惜、更高的計算效率和更透明的關系推理能力。

參考資源：文獻全文 - 學術范 (xueshufan.com)

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末斯撮，一起剝皮案震驚了整個濱河市经伙，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌勿锅，老刑警劉巖帕膜，帶你破解...
沈念sama閱讀 222,183評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異溢十，居然都是意外死亡垮刹，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,850評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門张弛，熙熙樓的掌柜王于貴愁眉苦臉地迎上來荒典，“玉大人，你說我怎么就攤上這事吞鸭∷露” “怎么了？”我有些...
開封第一講書人閱讀 168,766評論 0贊 361
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵刻剥，是天一觀的道長遮咖。經(jīng)常有香客問我，道長造虏，這世上最難降的妖魔是什么御吞？我笑而不...
開封第一講書人閱讀 59,854評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮漓藕，結果婚禮上陶珠，老公的妹妹穿的比我還像新娘。我一直安慰自己撵术，他們只是感情好背率，可當我...
茶點故事閱讀 68,871評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布话瞧。她就那樣靜靜地躺著嫩与，像睡著了一般寝姿。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上划滋，一...
開封第一講書人閱讀 52,457評論 1贊 311
城市分裂傳說
那天饵筑，我揣著相機與錄音，去河邊找鬼处坪。笑死根资，一個胖子當著我的面吹牛，可吹牛的內容都是我干的同窘。我是一名探鬼主播玄帕，決...
沈念sama閱讀 40,999評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼想邦！你這毒婦竟也來了裤纹？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,914評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤丧没，失蹤者是張志新（化名）和其女友劉穎鹰椒，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體呕童，經(jīng)...
沈念sama閱讀 46,465評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡漆际，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,543評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了夺饲。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片奸汇。...
茶點故事閱讀 40,675評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖往声，靈堂內的尸體忽然破棺而出茫蛹，到底是詐尸還是另有隱情，我是刑警寧澤烁挟，帶...
沈念sama閱讀 36,354評論 5贊 351
?日本核電站爆炸內幕
正文年R本政府宣布婴洼，位于F島的核電站，受9級特大地震影響撼嗓，放射性物質發(fā)生泄漏柬采。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 42,029評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一且警、第九天我趴在偏房一處隱蔽的房頂上張望粉捻。院中可真熱鬧，春花似錦斑芜、人聲如沸肩刃。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,514評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽盈包。三九已至沸呐，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間呢燥，已是汗流浹背崭添。一陣腳步聲響...
開封第一講書人閱讀 33,616評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留叛氨，地道東北人呼渣。一個月前我還...
沈念sama閱讀 49,091評論 3贊 378
代替公主和親
正文我出身青樓，卻偏偏與公主長得像寞埠，于是被迫代替她去往敵國和親屁置。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,685評論 2贊 360

解讀《Compositional Attention Networks for Machine Reasoning》附代碼沟于。

解讀《Compositional Attention Networks for Machine Reasoning》附代碼。

推薦閱讀更多精彩內容