論文《Learning by abstraction: The neural state machine》【有代碼】

標(biāo)題:抽象學(xué)習(xí):神經(jīng)狀態(tài)機(jī)

論文資源:NeurIPS2019文獻(xiàn)全文 - 學(xué)術(shù)范 (xueshufan.com)

代碼:該項(xiàng)目為網(wǎng)友復(fù)現(xiàn)睛廊,可參考-->?https://github.com/ceyzaguirre4/NSM?

一脑题、問題提出

針對(duì)神經(jīng)網(wǎng)絡(luò)和符號(hào)網(wǎng)絡(luò)各自的優(yōu)缺點(diǎn),引入有限自動(dòng)機(jī)的思想,提出一種神經(jīng)狀態(tài)機(jī)赶掖,將各自的互補(bǔ)優(yōu)勢(shì)整合到視覺推理任務(wù)中博助。

首先基于給定的圖像麻削,使用一個(gè)場景圖抽取模型娇跟,得到對(duì)應(yīng)的概率場景圖。其中头遭,對(duì)象被轉(zhuǎn)化為節(jié)點(diǎn)寓免,并使用屬性表示表示特征癣诱;關(guān)系被轉(zhuǎn)化為邊,來捕獲對(duì)象之間的空間關(guān)系和語義關(guān)系袜香。此外撕予,對(duì)輸入的問題進(jìn)行語義理解,并轉(zhuǎn)化為一系列軟指令蜈首。在推理過程中实抡,概率場景圖被視為一個(gè)有限狀態(tài)機(jī),利用指令集合在其上執(zhí)行順序推理欢策,迭代遍歷它的節(jié)點(diǎn)吆寨,以回答一個(gè)給定的問題或得出一個(gè)新的推理。

不同于一些旨在將多模態(tài)數(shù)據(jù)進(jìn)行緊密交互的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)踩寇,神經(jīng)狀態(tài)機(jī)定義了一組語義概念embedding的概念啄清,其描述領(lǐng)域的不同實(shí)體和屬性,如各種對(duì)象姑荷、屬性和關(guān)系盒延。通過將視覺和語言形式轉(zhuǎn)換為基于語義概念的表示,有效地使兩種模態(tài)可以”說同一種語言“鼠冕,從而可以在抽象的語義空間中進(jìn)行綜合推理,這使得結(jié)構(gòu)從內(nèi)容中分離出來胯盯,實(shí)現(xiàn)模型的模塊化懈费,增強(qiáng)模型的透明度和可解釋性。

二博脑、主要思想

兩個(gè)階段:

建模:構(gòu)造狀態(tài)機(jī)憎乙。將視覺和語言形式都轉(zhuǎn)換成抽象的表示形式:圖像被分解成一個(gè)表示其語義的概率圖——描述的視覺場景中的對(duì)象、屬性和關(guān)系叉趣,問題被轉(zhuǎn)換成一系列推理指令泞边,通過執(zhí)行指令回答問題。

推理:模擬狀態(tài)機(jī)的操作疗杉。在問題的指導(dǎo)下對(duì)語義視覺場景執(zhí)行順序推理:通過迭代地向機(jī)器輸入指令并遍歷其狀態(tài)來模擬串行計(jì)算阵谚,以獲得答案。

定義:元組(C,S,E,riNi=0,p0,δ)(C,S,E,rii=0N,p0,δ)

(1)C:模型的概念詞匯表烟具,由一組屬性概念組成梢什。

(2)S:狀態(tài)集。

(3)E:有向邊的集合朝聋,指定狀態(tài)之間的有效轉(zhuǎn)換嗡午。

(4){ri}Ni=0{ri}i=0N:維數(shù)為d的指令序列,作為過渡函數(shù)δδ的輸入依次傳遞冀痕。

(5)p0p0:S→[0,1] 初始狀態(tài)的概率分布荔睹。

(6)δS,EδS,E:pi×?ri→?pi+1pi×?ri→?pi+1是狀態(tài)轉(zhuǎn)移函數(shù)狸演。實(shí)例化為神經(jīng)模塊,在每一步中僻他,考慮狀態(tài)分布pipi和輸入指令riri严沥,并使用它沿邊更新分布概率,產(chǎn)生一個(gè)更新的狀態(tài)分布pi+1pi+1中姜。

Part1:概念詞匯表Concept vocabulary C

用于捕獲和表示輸入圖像的語義內(nèi)容消玄。

L + 2個(gè)屬性:

一個(gè)對(duì)象主體CO=C0CO=C0?eg:cat

L個(gè)屬性CA=ULi=1CiCA=Ui=1LCi?eg:顏色、形狀丢胚、材質(zhì)

一種關(guān)系CR=CL+1CR=CL+1?eg:持有翩瓜、看

每個(gè)屬性類型定義了一組D維embedding。

Part2:狀態(tài)集 S 和 邊集 E

構(gòu)建一個(gè)概率場景圖携龟,提取給定圖像中的對(duì)象和關(guān)系兔跌,構(gòu)建機(jī)器的狀態(tài)圖。

此處使用了前人提出的場景圖生成模型和Mask R-CNN物體檢測(cè)器峡蟋。


場景圖的組成:

補(bǔ)充:

Part4:模型推理

Step2:得到指令的內(nèi)容坟桅,將其與所有的狀態(tài)和邊進(jìn)行比較,計(jì)算節(jié)點(diǎn)和邊的相關(guān)性分?jǐn)?shù):

Step3:將模型的注意力從現(xiàn)有狀態(tài)轉(zhuǎn)移到最相關(guān)的鄰居狀態(tài)(即下一個(gè)狀態(tài)):


(3)計(jì)算基于每個(gè)狀態(tài)自身屬性潛在轉(zhuǎn)移的概率蕊蝗,(4)則考慮到相對(duì)于當(dāng)前狀態(tài)仅乓、轉(zhuǎn)移到下一狀態(tài)的上下文相關(guān)性。最終通過加權(quán)平均概率得到下一狀態(tài)的概率分布蓬戚。

通過將該過程重復(fù)執(zhí)行N步夸楣,模擬神經(jīng)狀態(tài)機(jī)的推理步驟。

Part5:分類

為了預(yù)測(cè)問題子漩,使用兩次全連接層的softmax分類器豫喧,接收LSTM輸出的問題特征和最終指令rNrN引導(dǎo)下提取到的最終狀態(tài)聚合得到的信息m:

(6)先按照指令類型求平均值,之后加上了對(duì)最終狀態(tài)的注意力pNpN幢泼。

三紧显、實(shí)驗(yàn)

數(shù)據(jù)集:GQA VQA-CP

結(jié)果:

GQA:

VQA-CPv2:

模型泛化性能:

對(duì)GQA數(shù)據(jù)集進(jìn)行修改,泛化了內(nèi)容以及語法結(jié)構(gòu):內(nèi)容泛化:測(cè)試機(jī)包括訓(xùn)練集不存在的種類缕棵;結(jié)構(gòu)泛化:同中問題語法表達(dá)修改孵班。

可視化推理過程:

四、總結(jié)

本文提出了神經(jīng)狀態(tài)機(jī)NSM挥吵,其從圖像中抽取出一個(gè)圖結(jié)構(gòu)重父,并模擬有限自動(dòng)機(jī)的推理步驟,來執(zhí)行視覺推理任務(wù)忽匈。通過實(shí)驗(yàn)房午,證明了其有效性、魯棒性和很好的泛化性能丹允,此外也提高了可解釋性郭厌。

通過將有限狀態(tài)機(jī)的概念融入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)袋倔,使得符號(hào)和連接主義方法更加緊密的整合在一起,從而將神經(jīng)模型從感官和知覺任務(wù)提升到更高層次的抽象折柠、知識(shí)表征宾娜、組合性和推理領(lǐng)域。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末扇售,一起剝皮案震驚了整個(gè)濱河市前塔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌承冰,老刑警劉巖华弓,帶你破解...
    沈念sama閱讀 221,548評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異困乒,居然都是意外死亡寂屏,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門娜搂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來迁霎,“玉大人,你說我怎么就攤上這事百宇】剂” “怎么了?”我有些...
    開封第一講書人閱讀 167,990評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵恳谎,是天一觀的道長芝此。 經(jīng)常有香客問我,道長因痛,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評(píng)論 1 296
  • 正文 為了忘掉前任岸更,我火速辦了婚禮鸵膏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘怎炊。我一直安慰自己谭企,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評(píng)論 6 397
  • 文/花漫 我一把揭開白布评肆。 她就那樣靜靜地躺著债查,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瓜挽。 梳的紋絲不亂的頭發(fā)上盹廷,一...
    開封第一講書人閱讀 52,246評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音久橙,去河邊找鬼俄占。 笑死管怠,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的缸榄。 我是一名探鬼主播渤弛,決...
    沈念sama閱讀 40,819評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼甚带!你這毒婦竟也來了她肯?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤鹰贵,失蹤者是張志新(化名)和其女友劉穎晴氨,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體砾莱,經(jīng)...
    沈念sama閱讀 46,268評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瑞筐,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了腊瑟。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片聚假。...
    茶點(diǎn)故事閱讀 40,488評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖闰非,靈堂內(nèi)的尸體忽然破棺而出膘格,到底是詐尸還是另有隱情,我是刑警寧澤财松,帶...
    沈念sama閱讀 36,181評(píng)論 5 350
  • 正文 年R本政府宣布瘪贱,位于F島的核電站,受9級(jí)特大地震影響辆毡,放射性物質(zhì)發(fā)生泄漏菜秦。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評(píng)論 3 333
  • 文/蒙蒙 一舶掖、第九天 我趴在偏房一處隱蔽的房頂上張望球昨。 院中可真熱鬧,春花似錦眨攘、人聲如沸主慰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽共螺。三九已至,卻和暖如春情竹,著一層夾襖步出監(jiān)牢的瞬間藐不,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留佳吞,地道東北人拱雏。 一個(gè)月前我還...
    沈念sama閱讀 48,897評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像底扳,于是被迫代替她去往敵國和親铸抑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容