論文閱讀:Enhanced LSTM for Natural Language Inference

一、摘要

Chen, Q., Zhu, X., Ling, Z., Wei, S., Jiang, H., & Inkpen, D. (2016). Enhanced LSTM for Natural Language Inference, (2008). https://doi.org/10.18653/v1/P17-1152

發(fā)表于ACL 2017

arxiv地址:http://arxiv.org/abs/1609.06038

代碼:https://github.com/lukecq1231/nli

這篇論文認為序列推理模型并沒有被好好研究秒咐,很多取得好效果的方法都是設計了很復雜的模型鹰贵,所以他們提出 ESIM (Enhancing Sequential Inference Model) 觅捆,并融合了基于句法樹的 tree-LSTM,能在 SNLI 上達到最佳效果(accuracy = 88.6%)。

二置鼻、問題

自然語言推理(NLI: natural language inference)問題:即判斷能否從一個前提p中推導出假設h,簡單來說蜓竹,就是判斷給定兩個句子的三種關系:蘊含箕母、矛盾或無關。

使用數(shù)據(jù)集是 Stanford Natural Language Inference (SNLI) dataset俱济,570k English sentence pairs

這個問題和計算句子相似度有一個比較明顯的不同嘶是,是結果是非對稱的,但我也看到有人用這個模型計算句子的相似度(需要做一點改動)姨蝴。

三俊啼、方法

image-20181008164804595

先放一張模型結構圖,可以看到分為左右兩邊左医,左側就是 ESIM授帕,右側是基于句法樹的 tree-LSTM同木,兩者合在一起交 HIM (Hybrid Inference Model)。整個模型從下往上看跛十,分為三部分:input encoding彤路,local inference modeling, and inference composition.

為了避免重復和麻煩,這篇筆記會只是用左側 ESIM 的部分的標記和模型芥映,右側的處理方法基本一致洲尊。

3.1 notation

ab 是兩個句子詞向量(可能是預訓練或者解析數(shù))組成的矩陣

image-20181008154213870

3.2 input encoding

使用 BiLSTM 分別學習ab 的詞與上下文信息,得到新的向量表示:

image-20181008154424931

注意這里的 a 和 b 是有下標的奈偏,表示的是詞坞嘀,詞向量的維度是一樣的。

3.3 local inference modeling

使用軟對齊的方法 (soft alignment or soft attention)

3.3.1 計算詞相似度矩陣

image-20181008155131108

3.3.2 句子相互表示做局部推理

image-20181008155248753

b 中所有詞向量來表示 a 中每個位置的詞惊来,使用 3.3.1 中計算的相似度進行加權 (softmax)

3.3.3 局部推理信息增強

image-20181008155614228

將以上得到的對兩個句子的表示做差和點積(element-wise product丽涩,每個元素單獨相乘),更清晰地區(qū)別a和a(hat)的局部的推斷信息裁蚁,獲取例如“對立”的推斷關系矢渊。

下面用 \bar{a}, \bar\hat{a}, \hat枉证 表示 3.2 和 3.3.2 產出的結果矮男。

這里可以檢查一下,如果詞向量的維度是300室谚,a 有10個詞毡鉴,\bar{a}\hat{a} 都是 10 * 300 的矩陣,所以 ma 的維度應該是 10 * 1200舞萄,相當于把每個詞的表示從300維擴充到1200維眨补。

3.4 inference composition

仍然是用 BiLSTM 組合 ma 和 mb,公式與 3.2 中相同倒脓,但目標變成了獲取 local inference ma and mb 的上下文信息撑螺。

為了控制模型復雜度,使用了1層網(wǎng)絡+relu激活處理 ma 和 mb崎弃,經 BiLSTM 之后得到的句子矩陣表示分別是 va 和 vb甘晤。

然后使用 avg + max pooling 得到一個定長的向量,輸入到全連接網(wǎng)絡中

image-20181008162311966

這里經過 pooling 之后的結果就與句子中詞的個數(shù) la 和 lb 無關了饲做,v 是一個 4800 維的向量了线婚。

3.5 MLP

  • 一個隱層(tanh激活)

  • 一個softmax的輸出層

  • 用 multi-class cross entropy 作為 loss

四、實驗與效果

  • 詞向量用 Glove pre-train 300維盆均,訓練過程不 fix
  • 優(yōu)化 adam塞弊,第一個 momentum 0.9, 第二個 0.999
  • learning rate 0.0004
  • batch size 32
  • 所有 LSTM, tree-LSTM 隱狀態(tài)都是 300 維
  • dropout 0.5
image-20181008164505885

單獨 ESIM 已經達到88%,超越了之前的很多模型,在融合 tree-LSTM 之后進一步提升到 88.6%

參考

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末游沿,一起剝皮案震驚了整個濱河市饰抒,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌诀黍,老刑警劉巖袋坑,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異眯勾,居然都是意外死亡枣宫,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門吃环,熙熙樓的掌柜王于貴愁眉苦臉地迎上來也颤,“玉大人,你說我怎么就攤上這事模叙⌒穑” “怎么了鞋屈?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵范咨,是天一觀的道長。 經常有香客問我厂庇,道長渠啊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任权旷,我火速辦了婚禮替蛉,結果婚禮上,老公的妹妹穿的比我還像新娘拄氯。我一直安慰自己躲查,他們只是感情好,可當我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布译柏。 她就那樣靜靜地躺著镣煮,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鄙麦。 梳的紋絲不亂的頭發(fā)上典唇,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機與錄音胯府,去河邊找鬼介衔。 笑死,一個胖子當著我的面吹牛骂因,可吹牛的內容都是我干的炎咖。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼乘盼!你這毒婦竟也來了急迂?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤蹦肴,失蹤者是張志新(化名)和其女友劉穎僚碎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體阴幌,經...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡勺阐,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了渊抽。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡议忽,死狀恐怖,靈堂內的尸體忽然破棺而出栈幸,到底是詐尸還是另有隱情,我是刑警寧澤速址,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布玩焰,位于F島的核電站,受9級特大地震影響芍锚,放射性物質發(fā)生泄漏昔园。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一默刚、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧荤西,春花似錦、人聲如沸嗅钻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽养篓。三九已至秃流,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間柳弄,已是汗流浹背概说。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工嚣伐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留糖赔,地道東北人轩端。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓放典,卻偏偏與公主長得像基茵,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子拱层,可洞房花燭夜當晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內容