吳恩達·注意力模型(Attention Model)簡記

機器翻譯模型的編碼器是先讀取整個句子后傳遞到解碼器中翻譯踢匣,對于過長句子序列(例如超過30個詞的句子)的記憶能力弱菠剩,翻譯效果不理想。此時就出現了注意力模型桶至,它是模仿人類翻譯,一部分一部分地翻譯匾旭,從而提高長句子的翻譯能力镣屹。

實踐:注意力神經機器翻譯模型實踐

傳送門:Attention Is All You Need簡記(多頭注意力、自注意力价涝、位置嵌入)

本文示例翻譯法語句子:Jane visite I’Afrique en Septembre女蜈。用t^`來索引法語序列的詞。

使用雙向RNN用于待翻譯序列x的特征提取色瘩。下圖中藍色的a^{<t^`>}表示激活值伪窖,左右箭頭表方向,分別是前向傳播后向傳播 的激活值居兆。

表示一組前向后向激活值
特征提取模型


注意力權重

注意力模型在生成每個翻譯結果時只考慮部分提取到的特征覆山。注意力權重參數(a set of attention weights)表示當你在時間步t處生成輸出詞,你應該花多少注意力在第t^`個輸入詞上面泥栖。例如a^{<1,1>}簇宽、a^{}、a^{}分別表示前三個單詞對第一個詞語的翻譯結果具有的影響力吧享。類似的a^{<2,1>}魏割、a^{}、a^{}分別表示表示在翻譯得到第二個單詞時钢颂,要分別放多少注意力在前三個單詞上钞它。并且前一步翻譯的輸出也會作為下一步的輸入。



翻譯過程

翻譯使用的是一個單向RNN殊鞭,用狀態(tài)S^{<i>}表示decoder RNN的隱藏狀態(tài)(the hidden state in this RNN)遭垛,C^{<i>}表示上下文(context),作為狀態(tài)S^{<i>}的輸入钱豁。參數滿足以下公式:

1耻卡、每次考慮的所有注意力權重之和等于1? ? ?

? ? ? \sum_{t^`}a^{}<1,t^`>=1

2、特征步激活值和注意力權重的乘積之和作翻譯模型的輸入牲尺,即上下文C^{<i>}? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? C^{<i>}=\sum_{t^`}a^{}a^{}

計算第一個翻譯結果詞


計算注意力權重

為了滿足\sum_{t^`}a^{}<1,t^`>=1卵酪,計算注意力權重的方法(即使用softmax)是:

計算上式的關鍵是計算得分e^{<t,t^`>}幌蚊,現直到計算e^{<t,t^`>}需要上一個deocder翻譯狀態(tài)的值s^{<t-1>}和特征提取模型encoder中本狀態(tài)的激活值a^{<t^`>}但不知道具體函數關系,需要通過一個小的神經網絡學習對應的具體的函數關系式。

學習表達式的網絡



除了學習溃卡,e^{<t,t^`>}還有現成的表達式可以利用溢豆。

評分函數的思路是度量兩個向量間的相似度



得到第二個翻譯結果詞示意圖,以此類推

通過為每個單詞分配分值瘸羡,注意力為不同單詞分配不同的注意力漩仙。然后利用 softmax 對編碼器隱藏狀態(tài)進行加權求和,得到上下文向量(context vector)犹赖。


編碼器-解碼器架構:(a) 為傳統(tǒng)結構队他,(b) 為帶注意力機制的結構??

架構中的注意力模塊負責自動學習注意力權重α_ij,該權重會捕獲 h_i(編碼器隱狀態(tài)峻村,被稱之為候選狀態(tài))和 s_j(解碼器隱狀態(tài)麸折,被稱之為查詢狀態(tài))之間的相關性。這些注意力權重之后會被用于構建上下文向量 c粘昨,而該向量經過處理后作為輸入傳遞給解碼器垢啼。


注意力模型的缺點

缺點是時間花費是O(n^3),因為注意力參數部分的計算。如果有T_x個輸入詞张肾,T_y個輸出詞芭析,則注意力權重參數的總數就是T_x xT_y

注意力模型




酷文章:

圖解NMT的注意力機制

想繼續(xù)深入了解注意力吞瞪?一篇就夠了:深度學習中的注意力模型--張俊林

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末馁启,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子芍秆,更是在濱河造成了極大的恐慌进统,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,122評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件浪听,死亡現場離奇詭異,居然都是意外死亡眉菱,警方通過查閱死者的電腦和手機迹栓,發(fā)現死者居然都...
    沈念sama閱讀 93,070評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來俭缓,“玉大人克伊,你說我怎么就攤上這事』梗” “怎么了愿吹?”我有些...
    開封第一講書人閱讀 164,491評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長惜姐。 經常有香客問我犁跪,道長椿息,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,636評論 1 293
  • 正文 為了忘掉前任坷衍,我火速辦了婚禮寝优,結果婚禮上,老公的妹妹穿的比我還像新娘枫耳。我一直安慰自己乏矾,他們只是感情好,可當我...
    茶點故事閱讀 67,676評論 6 392
  • 文/花漫 我一把揭開白布迁杨。 她就那樣靜靜地躺著钻心,像睡著了一般。 火紅的嫁衣襯著肌膚如雪铅协。 梳的紋絲不亂的頭發(fā)上捷沸,一...
    開封第一講書人閱讀 51,541評論 1 305
  • 那天,我揣著相機與錄音警医,去河邊找鬼亿胸。 笑死,一個胖子當著我的面吹牛预皇,可吹牛的內容都是我干的侈玄。 我是一名探鬼主播,決...
    沈念sama閱讀 40,292評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼吟温,長吁一口氣:“原來是場噩夢啊……” “哼序仙!你這毒婦竟也來了?” 一聲冷哼從身側響起鲁豪,我...
    開封第一講書人閱讀 39,211評論 0 276
  • 序言:老撾萬榮一對情侶失蹤潘悼,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后爬橡,有當地人在樹林里發(fā)現了一具尸體治唤,經...
    沈念sama閱讀 45,655評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,846評論 3 336
  • 正文 我和宋清朗相戀三年糙申,在試婚紗的時候發(fā)現自己被綠了宾添。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,965評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡柜裸,死狀恐怖缕陕,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情疙挺,我是刑警寧澤扛邑,帶...
    沈念sama閱讀 35,684評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站铐然,受9級特大地震影響蔬崩,放射性物質發(fā)生泄漏恶座。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,295評論 3 329
  • 文/蒙蒙 一舱殿、第九天 我趴在偏房一處隱蔽的房頂上張望奥裸。 院中可真熱鬧,春花似錦沪袭、人聲如沸湾宙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,894評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽侠鳄。三九已至,卻和暖如春死宣,著一層夾襖步出監(jiān)牢的瞬間伟恶,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,012評論 1 269
  • 我被黑心中介騙來泰國打工毅该, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留博秫,地道東北人。 一個月前我還...
    沈念sama閱讀 48,126評論 3 370
  • 正文 我出身青樓眶掌,卻偏偏與公主長得像挡育,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子朴爬,可洞房花燭夜當晚...
    茶點故事閱讀 44,914評論 2 355

推薦閱讀更多精彩內容