論文閱讀：Enhanced LSTM for Natural Language Inference

一、摘要

Chen, Q., Zhu, X., Ling, Z., Wei, S., Jiang, H., & Inkpen, D. (2016). Enhanced LSTM for Natural Language Inference, (2008). https://doi.org/10.18653/v1/P17-1152

發(fā)表于ACL 2017

arxiv地址：http://arxiv.org/abs/1609.06038

代碼：https://github.com/lukecq1231/nli

這篇論文認為序列推理模型并沒有被好好研究秒咐，很多取得好效果的方法都是設計了很復雜的模型鹰贵，所以他們提出 ESIM (Enhancing Sequential Inference Model) 觅捆，并融合了基于句法樹的 tree-LSTM，能在 SNLI 上達到最佳效果（accuracy = 88.6%）。

二置鼻、問題

自然語言推理（NLI: natural language inference）問題：即判斷能否從一個前提p中推導出假設h，簡單來說蜓竹，就是判斷給定兩個句子的三種關系：蘊含箕母、矛盾或無關。

使用數(shù)據(jù)集是 Stanford Natural Language Inference (SNLI) dataset俱济，570k English sentence pairs

這個問題和計算句子相似度有一個比較明顯的不同嘶是，是結果是非對稱的，但我也看到有人用這個模型計算句子的相似度（需要做一點改動）姨蝴。

三俊啼、方法

image-20181008164804595

先放一張模型結構圖，可以看到分為左右兩邊左医，左側就是 ESIM授帕，右側是基于句法樹的 tree-LSTM同木，兩者合在一起交 HIM (Hybrid Inference Model)。整個模型從下往上看跛十，分為三部分：input encoding彤路，local inference modeling, and inference composition.

為了避免重復和麻煩，這篇筆記會只是用左側 ESIM 的部分的標記和模型芥映，右側的處理方法基本一致洲尊。

3.1 notation

a 和 b 是兩個句子詞向量（可能是預訓練或者解析數(shù)）組成的矩陣

image-20181008154213870

3.2 input encoding

使用 BiLSTM 分別學習a 和 b 的詞與上下文信息，得到新的向量表示：

image-20181008154424931

注意這里的 a 和 b 是有下標的奈偏，表示的是詞坞嘀，詞向量的維度是一樣的。

3.3 local inference modeling

使用軟對齊的方法 (soft alignment or soft attention)

3.3.1 計算詞相似度矩陣

image-20181008155131108

3.3.2 句子相互表示做局部推理

image-20181008155248753

用 b 中所有詞向量來表示 a 中每個位置的詞惊来，使用 3.3.1 中計算的相似度進行加權 (softmax)

3.3.3 局部推理信息增強

image-20181008155614228

將以上得到的對兩個句子的表示做差和點積（element-wise product丽涩，每個元素單獨相乘），更清晰地區(qū)別a和a(hat)的局部的推斷信息裁蚁，獲取例如“對立”的推斷關系矢渊。

下面用 $\bar{a}$ , $\bar$ 和 $\hat{a}$ , $\hat枉证$ 表示 3.2 和 3.3.2 產出的結果矮男。

這里可以檢查一下，如果詞向量的維度是300室谚，a 有10個詞毡鉴， $\bar{a}$ 和 $\hat{a}$ 都是 10 * 300 的矩陣，所以 ma 的維度應該是 10 * 1200舞萄，相當于把每個詞的表示從300維擴充到1200維眨补。

3.4 inference composition

仍然是用 BiLSTM 組合 ma 和 mb，公式與 3.2 中相同倒脓，但目標變成了獲取 local inference ma and mb 的上下文信息撑螺。

為了控制模型復雜度，使用了1層網(wǎng)絡+relu激活處理 ma 和 mb崎弃，經 BiLSTM 之后得到的句子矩陣表示分別是 va 和 vb甘晤。

然后使用 avg + max pooling 得到一個定長的向量，輸入到全連接網(wǎng)絡中

image-20181008162311966

這里經過 pooling 之后的結果就與句子中詞的個數(shù) la 和 lb 無關了饲做，v 是一個 4800 維的向量了线婚。

3.5 MLP

一個隱層（tanh激活）
一個softmax的輸出層
用 multi-class cross entropy 作為 loss

四、實驗與效果

詞向量用 Glove pre-train 300維盆均，訓練過程不 fix
優(yōu)化 adam塞弊，第一個 momentum 0.9, 第二個 0.999
learning rate 0.0004
batch size 32
所有 LSTM, tree-LSTM 隱狀態(tài)都是 300 維
dropout 0.5

image-20181008164505885

單獨 ESIM 已經達到88%，超越了之前的很多模型，在融合 tree-LSTM 之后進一步提升到 88.6%

參考

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末游沿，一起剝皮案震驚了整個濱河市饰抒，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌诀黍，老刑警劉巖袋坑，帶你破解...
沈念sama閱讀 221,548評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異眯勾，居然都是意外死亡枣宫，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,497評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門吃环，熙熙樓的掌柜王于貴愁眉苦臉地迎上來也颤，“玉大人，你說我怎么就攤上這事模叙⌒穑” “怎么了鞋屈？”我有些...
開封第一講書人閱讀 167,990評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵范咨，是天一觀的道長。經常有香客問我厂庇，道長渠啊，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 59,618評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任权旷，我火速辦了婚禮替蛉，結果婚禮上，老公的妹妹穿的比我還像新娘拄氯。我一直安慰自己躲查，他們只是感情好，可當我...
茶點故事閱讀 68,618評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布译柏。她就那樣靜靜地躺著镣煮，像睡著了一般。火紅的嫁衣襯著肌膚如雪鄙麦。梳的紋絲不亂的頭發(fā)上典唇，一...
開封第一講書人閱讀 52,246評論 1贊 308
城市分裂傳說
那天，我揣著相機與錄音胯府，去河邊找鬼介衔。笑死，一個胖子當著我的面吹牛骂因，可吹牛的內容都是我干的炎咖。我是一名探鬼主播，決...
沈念sama閱讀 40,819評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼乘盼！你這毒婦竟也來了急迂？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,725評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤蹦肴，失蹤者是張志新（化名）和其女友劉穎僚碎，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體阴幌，經...
沈念sama閱讀 46,268評論 1贊 320
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡勺阐，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,356評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了渊抽。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,488評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡议忽，死狀恐怖，靈堂內的尸體忽然破棺而出栈幸，到底是詐尸還是另有隱情，我是刑警寧澤速址，帶...
沈念sama閱讀 36,181評論 5贊 350
?日本核電站爆炸內幕
正文年R本政府宣布玩焰，位于F島的核電站，受9級特大地震影響芍锚，放射性物質發(fā)生泄漏昔园。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,862評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一默刚、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧荤西，春花似錦、人聲如沸嗅钻。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,331評論 0贊 24
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽养篓。三九已至秃流，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間柳弄，已是汗流浹背概说。一陣腳步聲響...
開封第一講書人閱讀 33,445評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工嚣伐，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留糖赔，地道東北人轩端。一個月前我還...
沈念sama閱讀 48,897評論 3贊 376
代替公主和親
正文我出身青樓放典，卻偏偏與公主長得像基茵，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子拱层，可洞房花燭夜當晚...
茶點故事閱讀 45,500評論 2贊 359