神經(jīng)圖靈機(jī)
【總述】本文通過將神經(jīng)網(wǎng)絡(luò)與外部存儲(chǔ)資源結(jié)合起來構(gòu)建神經(jīng)圖靈機(jī)卿捎,來擴(kuò)展神經(jīng)網(wǎng)絡(luò)的功能。通過對復(fù)制致扯、排序邢享、聯(lián)想等算法的實(shí)驗(yàn)表明神經(jīng)圖靈機(jī)可以從輸入輸出示例中推出簡單算法姑子。
1纬傲、【遞歸神經(jīng)網(wǎng)絡(luò)】
遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks换帜,RNNs)能夠在較長的時(shí)間內(nèi)學(xué)習(xí)和執(zhí)行復(fù)雜的數(shù)據(jù)轉(zhuǎn)換藏雏,且具有模擬任意程序的能力数初。RNNs的狀態(tài)既取決于系統(tǒng)的輸入又取決于當(dāng)前狀態(tài)找爱,具有更豐富的存儲(chǔ)和計(jì)算能力。理想的遞歸是x(t + 1)= x(t)+ i(t)泡孩,其中i(t)是系統(tǒng)的輸入车摄。
2、【神經(jīng)圖靈機(jī)】
為了簡化RNNs算法仑鸥,本文擴(kuò)充了遞歸網(wǎng)絡(luò)形成“神經(jīng)圖靈機(jī)”(Neural Turing Machines吮播,NTM),其通過大型的眼俊、可尋址的存儲(chǔ)進(jìn)行意狠,使用注意過程選擇性地讀取和寫入內(nèi)存,為學(xué)習(xí)程序提供一種實(shí)用機(jī)制疮胖。NTM架構(gòu)包含兩個(gè)組件:神經(jīng)網(wǎng)絡(luò)控制器(neural network controller)和存儲(chǔ)庫(memory bank)环戈。
研究者們將網(wǎng)絡(luò)輸出稱為“頭heads”,還定義了“模糊blurry”讀寫操作鹏漆。模糊操作與內(nèi)存中的所有元素或多或少地相互作用巩梢。模糊程度由注意力“聚焦”機(jī)制確定,該機(jī)制限制讀取和寫入操作與存儲(chǔ)器的一小部分交互艺玲。每個(gè)讀寫磁頭都有一個(gè)權(quán)重括蝠,定義了磁頭在每個(gè)位置的讀寫程度。
【尋址機(jī)制】
讀寫權(quán)重是通過將兩種尋址機(jī)制結(jié)合在一起產(chǎn)生的饭聚。一種是“基于內(nèi)容的尋址content-based addressing”忌警,基于位置值和控制器發(fā)出值之間的相似性,將注意力集中在位置上秒梳。另一種為“基于位置的尋址location-based addressing”法绵,通過位置來尋址。
【控制器網(wǎng)絡(luò)】
NTM最重要的參數(shù)是用作控制器的神經(jīng)網(wǎng)絡(luò)類型是遞歸網(wǎng)絡(luò)還是前饋網(wǎng)絡(luò)(feedforward network)酪碘。前饋控制器可以通過在每個(gè)步驟中在相同位置進(jìn)行讀寫來模仿遞歸網(wǎng)絡(luò)朋譬,其局限在于并發(fā)讀和寫磁頭的數(shù)量對NTM執(zhí)行的計(jì)算類型造成了瓶頸,而遞歸控制器有自己的內(nèi)部存儲(chǔ)器兴垦,不受此限制徙赢。
3字柠、【實(shí)驗(yàn)】
對簡單算法任務(wù)的初步實(shí)驗(yàn)。均有三種條件:具有前饋控制器的NTM狡赐、具有LSTM控制器的NTM和標(biāo)準(zhǔn)LSTM網(wǎng)絡(luò)窑业。
LSTM:遞歸網(wǎng)絡(luò)的一項(xiàng)關(guān)鍵創(chuàng)新是長的短期記憶(Long Short-Term Memory)。LSTM在網(wǎng)絡(luò)中嵌入了用于內(nèi)存存儲(chǔ)的完美集成器阴汇。
【復(fù)制】
復(fù)制任務(wù)測試NTM是否可以存儲(chǔ)和調(diào)用長序列的任意信息数冬、是否有更長的時(shí)間延遲。訓(xùn)練網(wǎng)絡(luò)復(fù)制8位隨機(jī)向量的序列搀庶,序列長度在1到20之間隨機(jī)拐纱。
分析表明匆赃,NTM已經(jīng)學(xué)會(huì)結(jié)合了基于內(nèi)容和位置的尋址的復(fù)制算法。
【重復(fù)復(fù)制】
重復(fù)復(fù)制任務(wù)要求網(wǎng)絡(luò)將復(fù)制的序列輸出指定的次數(shù)秋度,然后發(fā)出序列結(jié)束標(biāo)記炸庞。看NTM是否可以學(xué)習(xí)簡單的嵌套函數(shù)。網(wǎng)絡(luò)接收隨機(jī)二進(jìn)制矢量的隨機(jī)長度序列荚斯。后跟一個(gè)標(biāo)量值埠居,該值指示所需的次數(shù)查牌,出現(xiàn)在單獨(dú)的輸入通道上。網(wǎng)絡(luò)可以重現(xiàn)8個(gè)隨機(jī)二元向量的序列滥壕,序列長度和重復(fù)次數(shù)都是從1到10隨機(jī)纸颜。
【聯(lián)想】
先前的任務(wù)表明NTM可以將算法應(yīng)用于相對簡單的線性數(shù)據(jù)結(jié)構(gòu)。本階段測試NTM學(xué)習(xí)類的實(shí)例的能力熙暴,以便對其中一個(gè)項(xiàng)目進(jìn)行查詢要求網(wǎng)絡(luò)返回下一個(gè)項(xiàng)目闺属。每個(gè)項(xiàng)目都由三個(gè)六位二進(jìn)制矢量組成(每個(gè)項(xiàng)目總共18位)。訓(xùn)練期間周霉,在單集中至少使用了2個(gè)項(xiàng)目掂器,最多使用了6個(gè)項(xiàng)目。
【優(yōu)先排序】
此任務(wù)測試NTM是否可以對數(shù)據(jù)進(jìn)行排序蜕乡。一系列隨機(jī)二進(jìn)制向量與每個(gè)向量的標(biāo)量優(yōu)先級等級一起輸入到網(wǎng)絡(luò)奸绷。優(yōu)先級從[-1,1]范圍中得出层玲。目標(biāo)序列包含根據(jù)其優(yōu)先級排序的二進(jìn)制向量号醉,如圖14。
對觀察到的寫入位置擬合了優(yōu)先級的線性函數(shù)畔派。
4、【結(jié)論】
本文引入了神經(jīng)圖靈機(jī)莱衩,實(shí)驗(yàn)表明它能從示例數(shù)據(jù)中學(xué)習(xí)簡單的算法爵嗅。