【NLP論文筆記】Effective Approaches to Attention-based Neural Machine Translation

本文主要用于記錄發(fā)表于2015年的一篇神作(引用量上千)旺嬉。該論文將注意力機制在機器翻譯的領(lǐng)域進行了升級管行,而本筆記意在方便初學(xué)者快速入門,以及自我回顧邪媳。

論文鏈接:http://aclweb.org/anthology/D15-1166

基本目錄如下:

  1. 摘要
  2. 核心思想
  3. 總結(jié)

------------------第一菇 - 摘要------------------

1.1 論文摘要

近年來注意力機制被運用于神經(jīng)機器翻譯模型已是常態(tài)捐顷,但卻很少有論文專注于對注意力架構(gòu)的改進。本論文就提出了兩種簡單但卻有效的注意力機制雨效,全局注意力(global)和局部注意力(local)迅涮。其中,局部注意力機制的運用使得神經(jīng)機器翻譯模型遠勝于非注意力機制模型(5個BLEU點)徽龟。在融合了各個注意力機制模型之后叮姑,更是刷新了一波英文翻德文的記錄。

------------------第二菇 - 核心思想------------------

2.1 注意力機制介紹

本文提出的兩種注意力機制(global & local)其本質(zhì)區(qū)別在于顿肺,全局注意力會參考所有輸入詞戏溺,而局部注意力只會考慮部分輸入詞。而全局注意力屠尊,其實可以簡單理解為soft_attention的簡化版(可參考本菇另一篇論文筆記] ,而局部注意力耕拷,可以簡單理解介于hard_attention和sorf_attention之間讼昆,但是耗費更短的時間來訓(xùn)練。流程上來理解骚烧,全局和局部注意力機制唯一的不同就是生成c_t(語境向量)的方法浸赫,而一旦有了c_t之后,接下來的步驟都是一樣的赃绊,我們新的隱狀態(tài)即為既峡,

\widetilde{h_t}= tanh(Wc[c_t;h_t])

然后這個注意力向量就會被傳入一個softmax層,來預(yù)測當(dāng)前詞碧查,

p(y_t|y_{<t}, x) = softmax(W_s\widetilde{h_t})

接下來运敢,我們就來仔細聊一下這兩種注意力機制。

2.2 全局注意力機制介紹

該注意力機制重點在于考慮所有輸入的隱狀態(tài)來生成語境向量忠售。與soft_attention類似传惠,該注意力機制也是有對齊向量(a_t)的概念,不同的是稻扬,該對齊向量的計算更簡單卦方,直接由當(dāng)前隱狀態(tài)(h_t)和每一個輸入隱狀態(tài)(\widetilde{h_t})計算得出權(quán)重,其計算公式如下泰佳,

score function.png

其中作者設(shè)計了三種打分函數(shù)(劇透一下盼砍,最后general的效果最好)尘吗。有了對齊向量以后,語境向量就很好生成了浇坐,這里再貼一張原論文的圖睬捶,方便大家理解,

global.png

看了圖應(yīng)該就一目了然了吗跋,所以說侧戴,這種全局注意力的計算及實現(xiàn)方法是真的很簡單,而且也沒用高深的計算公式跌宛,也沒用復(fù)雜的神經(jīng)網(wǎng)絡(luò)酗宋。這里論文作者多談了幾句和soft_attention的區(qū)別,重點就是本論文的計算路徑簡單了很多(雖然本菇還是有一點疑惑疆拘,這一點區(qū)別的理解蜕猫,因為從本質(zhì)上來看,本菇覺得計算開銷都很大哎迄,可能還需仔細閱讀源碼回右,先mark,后期來補漱挚,歡迎大神解惑)翔烁。

2.3 局部注意力機制介紹

局部注意力機制其實就是為了解決全局注意力機制計算開銷過大的問題,比如篇章級或者長句的翻譯旨涝,遍歷所有的隱狀態(tài)來求對齊向量顯然比較困難蹬屹,因此,局部注意力白华,如其名慨默,只會關(guān)注部分隱狀態(tài)。因此弧腥,該機制的重點就在于如何找尋與預(yù)測詞對應(yīng)的隱狀態(tài)厦取。而論文中也給出了2種找尋的辦法,

1)單一映射管搪。即同一時刻的預(yù)測詞與輸入詞應(yīng)該具有強關(guān)聯(lián)關(guān)系虾攻。確定了目標隱狀態(tài)之后,再劃定一個窗口D抛蚤,則可以擴大視野台谢,然后再用上面global的計算語境向量的方法即可。

2)顯然單一映射岁经,太過暴力了朋沮,更多的還是采用一種預(yù)測的辦法。一種求解對應(yīng)隱狀態(tài)區(qū)間的計算公式為,

function.png

其中S為句子長度樊拓,W,v_p都是模型的參數(shù)纠亚。另外為了更好的計算對齊向量,還引入了高斯分布筋夏,如公式(11)蒂胞。這里,再貼一張原論文的圖条篷,加深大家對局部注意力機制的理解骗随,

local .png
2.3 論文實驗結(jié)果分析

論文作者把自己提出的框架都挨個試了一遍,這里就不具體展現(xiàn)了赴叹。有興趣的讀者可以自行研讀鸿染。總體看下來的感覺就是全局和局部的注意力機制也都各有優(yōu)劣乞巧,大家還是要結(jié)合具體的業(yè)務(wù)涨椒,嘗試過后,再做具體的選擇绽媒。

------------------第三菇 - 總結(jié)------------------

3.1 總結(jié)

到這里蚕冬,整篇論文的核心思想及其創(chuàng)新點已經(jīng)說清楚了。本論文主要集中在于對注意力機制的改進是辕,提出的全局和局部注意力機制囤热,都足夠新奇,但也都在情理之中获三。主要還是拓寬了我們設(shè)計注意力機制的思路赢乓。

簡單總結(jié)一下本文就是先羅列了一下該論文的摘要,再具體介紹了一下注意力機制石窑,尤其是全局和局部注意力機制那一塊的理論。希望大家讀完本文后能進一步加深對該論文的理解蚓炬。有說的不對的地方也請大家指出松逊,多多交流,大家一起進步~??

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末肯夏,一起剝皮案震驚了整個濱河市经宏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌驯击,老刑警劉巖烁兰,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異徊都,居然都是意外死亡沪斟,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進店門暇矫,熙熙樓的掌柜王于貴愁眉苦臉地迎上來主之,“玉大人择吊,你說我怎么就攤上這事〔坜龋” “怎么了几睛?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長粤攒。 經(jīng)常有香客問我所森,道長,這世上最難降的妖魔是什么夯接? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任焕济,我火速辦了婚禮,結(jié)果婚禮上钻蹬,老公的妹妹穿的比我還像新娘吼蚁。我一直安慰自己,他們只是感情好问欠,可當(dāng)我...
    茶點故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布肝匆。 她就那樣靜靜地躺著,像睡著了一般顺献。 火紅的嫁衣襯著肌膚如雪旗国。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天注整,我揣著相機與錄音能曾,去河邊找鬼。 笑死肿轨,一個胖子當(dāng)著我的面吹牛寿冕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播椒袍,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼驼唱,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了驹暑?” 一聲冷哼從身側(cè)響起玫恳,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎优俘,沒想到半個月后京办,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡帆焕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年惭婿,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出祖搓,到底是詐尸還是另有隱情,我是刑警寧澤式散,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站打颤,受9級特大地震影響暴拄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜编饺,卻給世界環(huán)境...
    茶點故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一乖篷、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧透且,春花似錦撕蔼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至锅论,卻和暖如春讼溺,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背最易。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工怒坯, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人藻懒。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓剔猿,卻偏偏與公主長得像,于是被迫代替她去往敵國和親嬉荆。 傳聞我的和親對象是個殘疾皇子艳馒,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,871評論 2 354

推薦閱讀更多精彩內(nèi)容