深入理解 NLP中的attention機制

參考文檔:

這三篇足夠了占贫。

個人理解:
為何需要attention機制枫弟?因為我們需要知道推理下一個詞的時候,原來的input句子里哪些詞最相關(guān),幫助推理荧飞。因此需要輸入一個向量,該向量維度固定般此,且蘊含了輸入句子的信息跷车,且是和該輸出詞最相關(guān)的輸入詞的信息,是有側(cè)重的一個向量拧粪,不是整個輸入句子的向量修陡。整個句子的向量就是encoder output。

image.png

上圖所示可霎,context vector即一般公式里的c就是我們想要的這個向量魄鸦,額外蘊含了encoder詞的信息,關(guān)鍵的地方在于如何計算該c癣朗。這個c應(yīng)該是由上一個decoder的隱藏向量(圖中紅色)拾因,以及encoder的hidden向量(淡綠色)算出來的。

簡單來說就是: 紅色和淡綠色向量哪個最相關(guān)性旷余,就用哪個作為最終的c(深綠色)绢记。更進一步,是淡綠色向量的線性加權(quán)正卧,越相關(guān)則權(quán)重越大蠢熄,權(quán)重就是這里的score。

怎么算score穗酥,即相關(guān)性护赊?可以用MLP,或者簡單的 dot product砾跃。即下圖中黃線部分骏啰。算出來的權(quán)重需要歸一化,否則過大抽高。之后就是權(quán)重和輸入向量相乘(即上圖中的普通綠色向量)判耕,累加的過程,獲得最終的輸出向量c翘骂。

decoder_hidden = [10, 5, 10]
encoder_hidden  score
---------------------
     [0, 1, 1]     15 (= 10×0 + 5×1 + 10×1, the dot product)
     [5, 0, 1]     60
     [1, 1, 0]     15
     [0, 5, 1]     35

此處說明第二 第四個 hidden state更加重要壁熄,需要重點關(guān)注,因此最終context里的權(quán)重占比更大碳竟。

image.png

我們希望RNN中草丧,hidden state輸出是有意義和相關(guān)性的,有表征能力莹桅,且這種attention機制被模型學習到了昌执,假設(shè)一個翻譯的case,I love you,模型翻譯輸出了 “我”+“愛”懂拾,通過attention的機制煤禽,知道后面的詞 , 和you最相關(guān)岖赋,有更大概率輸出 “你”檬果,而非“情”。

因為在原來的seq2seq里唐断,信息都蘊含在一個encoder的輸出向量里选脊,若decoder只在初始處輸入一個encoder向量,則 you這個特征可能被丟失掉栗涂,從而推理錯誤知牌。若將encoder輸出向量輸入到每個decoder時間步里,那么該時間步的decoder也不知道輸入句子哪個詞更重要斤程。加入了attention機制后角寸,就解決了這些問題。decoder知道了下一個時間步中忿墅,最相關(guān)的輸入詞的特征是什么扁藕,是“you”。

https://towardsdatascience.com/attn-illustrated-attention-5ec4ad276ee3

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末疚脐,一起剝皮案震驚了整個濱河市亿柑,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌棍弄,老刑警劉巖望薄,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異呼畸,居然都是意外死亡痕支,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門蛮原,熙熙樓的掌柜王于貴愁眉苦臉地迎上來卧须,“玉大人,你說我怎么就攤上這事儒陨』ㄋ唬” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵蹦漠,是天一觀的道長椭员。 經(jīng)常有香客問我,道長笛园,這世上最難降的妖魔是什么拆撼? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任容劳,我火速辦了婚禮,結(jié)果婚禮上闸度,老公的妹妹穿的比我還像新娘。我一直安慰自己蚜印,他們只是感情好莺禁,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著窄赋,像睡著了一般哟冬。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上忆绰,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天浩峡,我揣著相機與錄音,去河邊找鬼错敢。 笑死翰灾,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的稚茅。 我是一名探鬼主播纸淮,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼亚享!你這毒婦竟也來了咽块?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤欺税,失蹤者是張志新(化名)和其女友劉穎侈沪,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體晚凿,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡亭罪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了晃虫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片皆撩。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖哲银,靈堂內(nèi)的尸體忽然破棺而出扛吞,到底是詐尸還是另有隱情,我是刑警寧澤荆责,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布滥比,位于F島的核電站,受9級特大地震影響做院,放射性物質(zhì)發(fā)生泄漏盲泛。R本人自食惡果不足惜濒持,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望寺滚。 院中可真熱鬧柑营,春花似錦、人聲如沸村视。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蚁孔。三九已至奶赔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間杠氢,已是汗流浹背站刑。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鼻百,地道東北人绞旅。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像愕宋,于是被迫代替她去往敵國和親玻靡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容