淺談多輪檢索式對話最近的兩篇SOTA-『MRFN』&『IMN』

點這里 排版好

新年第一天更博 顯得很有 儀式感(破音~) (雖然已經(jīng)斷更一個月了 捂臉)
祝各位NLPer, 各位dalao 在新的一年里靈感爆棚 投的offer全中 萬肆如意 新年玉快

新年第一天 日常網(wǎng)上沖浪 竟然發(fā)現(xiàn)MRFN終于被放出來了 啊 啊 啊~~

這篇論文我從去年十月一直等到現(xiàn)在

在這期間中不乏有Bert這種神器爆出來

但并沒有打消我對這篇SOTA的期待

IMN 則是上個月中科院幾位博士在arXiv在線發(fā)表的一篇論文 主要是被數(shù)據(jù)嚇壞了 有、厲害??

粗粗看 可能覺得這兩篇文章沒什么關(guān)系 一個是多粒度fusion 一個是類似于Bert的深層次網(wǎng)絡(luò)處理

但仔細思考 IMN dot 之后的結(jié)構(gòu)與MRFN的FLS有異曲同工的作用 不負責的猜測 FLS的設(shè)計思路會成為今后一段時間follow的點

PS: 以上兩篇paper 都承諾開源code (雖然repository里面都沒有code??) 之后會跟一下code 看一下具體效果

概括一下 MRFN

  1. 在原來SMN DAM 兩粒度 基礎(chǔ)上提出三粒度6種表示
  2. 提出多表示匹配-合并(Matching-Aggregation)的三種策略
  3. 使用大量實驗驗證各個表示的作用载弄,驗證context輪次聋涨、平均對話長度變化時各個表示的作用情況
  4. 提出的多表示匹配-合并策略可推廣到其他模型 并在SMN中進行試驗
  5. 比DAM快1.9x的訓練速度

IMN

  1. EMbedding層加入character-EMbedding 解決OOV
  2. EMbedding層后接類似ELMo思路的BiLSTM(paper中 這個結(jié)構(gòu)最work)
  3. dot之后做兩個粒度的分析

MRFN

MRFN = Multi-Representation Fusion Network

MRFN是嚴睿老師組里陶重陽博士,小冰組徐粲學長绣的,武威dalao去年的工作 論文發(fā)表在WSDM2019

全文看下來 包括Motivation,實驗設(shè)計都給我一種很舒服的感覺 感覺一切都順理成章 一氣呵成

事實上 去年十月底 在EMNLP2018的tutorial上嚴老師和武威dalao就已經(jīng)把MRFN的結(jié)果秀出來了

之后徐學長回來分享的時候也提到這篇論文 但論文一直沒放出來

Motivation

這篇文章的Motivation是建立在最近幾年多輪檢索式對話基于的面向交互的思想

回想一下從Multi-view引入交互,到SMN完全基于交互,再到DAM多層交互

交互的粒度越多越work已經(jīng)是大家的共識了

但如何更好的設(shè)計各個粒度之間的層次關(guān)系 減少不必要的性能浪費

作者提出把粒度劃分為word, short-term, long-term三個粒度6種表示

  1. Word
  2. Contextual
    • Sequential: 借用GRU的結(jié)構(gòu)實現(xiàn)句子中間子串信息的獲取
      • RNN能保留短距離詞之間的關(guān)系 相對于sub-sequential
    • Local: 利用CNN獲取N-gram的信息
      • CNN中卷積和池化 相對于獲取中心詞周圍N-gram的信息
  3. Attention-based
    • self-Attention
    • cross-Attention

Model

但怎么把這些粒度有效的融合在一起

回想一下SMN在CNN之后才將wordshort-term兩個粒度的信息融合在一起

image

很自然的想到 如果在之前/之后做fuse效果會怎么樣画切?

這個思路 就很像NIPS14年那篇討論是應(yīng)該先dot還是應(yīng)該先做CNN的paper

作者就提出前中后三種fusion策略

image

其中左側(cè)是之前設(shè)計的6鐘表示

U->U*的過程是簡單的把多個矩陣拼接成一個矩陣

U^*_i \in R^{d^* \times n_i}(d^*=\sum d_k)

fusion則是利用類似CNN的公式

t_{i,j}=f(\hat{e_{i,j}},\bar{e_{i,j}})=ReLU(W_p[(\hat{e_{i,j}}-\bar{e_{i,j}}) \odot \hat{e_{i,j}}-\bar{e_{i,j}});\hat{e_{i,j}} \odot \bar{e_{i,j}}]+b_p)

其中

w_{j,k}^i=V_a^T tanh(W_a[\hat{e_{i,j}\oplus \hat{e_{r,k}}]+b_a})

\alpha_{j,k}^i=\frac{exp(\omega_{j,k}^i)}{\sum(exp(\omega_{j,k}^i))}

\bar{e_{i,j}}=\sum{\alpha_{j,k}^i}\hat{e_{r,k}}

之后就跟上GRUMLR得到相應(yīng)的score值

Experiment

本文做了大量的實驗 羨慕MSRA有用不完的機器 嗚嗚嗚

  1. 先是對比之前存在的一些模型
image

可以看出FLS效果比DAM提升比較顯著 即使是 FIS在Dubbo數(shù)據(jù)集上也比DAM略微好一點

  1. 然后還做了把模型結(jié)構(gòu)中各個部分去掉之后的一些結(jié)果
image

可以看出Contextual兩個部分效果略有重疊導致了去除其一掉點不會太多 總的來說Contextual在模型中提點最大

  1. 還做了模型拓展性方面的實驗 把fusion三策略移到SMN也得到了不錯的結(jié)果
image
  1. 最后還探究了多輪對話Context輪次 對話長度變化時各個表示的作用占比情況
image

全篇看下來 對于一個做系統(tǒng)出身的出身來看 十分舒服 可以說是比較Science 得到的結(jié)果也比較significantly

IMN

IMN = Interactive Matching Network

相對而言 IMN 論文寫得有點隨意 取名字也有、??(不是噴 吐槽一下)

image

同樣 IMN的作者也想到了用character來減緩OOV的問題

創(chuàng)新點在于 EMbedding層之后用了一個類似ELMo的處理策略 來獲取Sentence之間的信息

(當然 如果現(xiàn)在來做 用Bert做同樣的事情可能會更好)

除了上述的idea之外 作者還在dot完之后分成兩個粒度做處理

仔細一想 這和MRFN的FLS本質(zhì)上是一種思路 把fusion的過程往后推遲

image

然后這個result確實厲害 ym dalao

References

  1. Multi-Representation Fusion Network for Multi-turn Response Selection in Retrieval-based Chatbots. Chongyang Tao et al. WSDM2019.
  2. Interactive Matching Network for Multi-Turn Response Selection in Retrieval-Based Chatbots. Jia-Chen Gu et al. 2019
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末囱怕,一起剝皮案震驚了整個濱河市霍弹,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌娃弓,老刑警劉巖典格,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異忘闻,居然都是意外死亡钝计,警方通過查閱死者的電腦和手機恋博,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門齐佳,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人债沮,你說我怎么就攤上這事炼吴。” “怎么了疫衩?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵硅蹦,是天一觀的道長。 經(jīng)常有香客問我,道長童芹,這世上最難降的妖魔是什么涮瞻? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮假褪,結(jié)果婚禮上署咽,老公的妹妹穿的比我還像新娘。我一直安慰自己生音,他們只是感情好宁否,可當我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缀遍,像睡著了一般慕匠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上域醇,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天台谊,我揣著相機與錄音,去河邊找鬼譬挚。 笑死青伤,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的殴瘦。 我是一名探鬼主播狠角,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蚪腋!你這毒婦竟也來了丰歌?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤屉凯,失蹤者是張志新(化名)和其女友劉穎立帖,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悠砚,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡晓勇,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了灌旧。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绑咱。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖枢泰,靈堂內(nèi)的尸體忽然破棺而出描融,到底是詐尸還是另有隱情,我是刑警寧澤衡蚂,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布窿克,位于F島的核電站骏庸,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏年叮。R本人自食惡果不足惜具被,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望只损。 院中可真熱鬧硬猫,春花似錦、人聲如沸改执。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽辈挂。三九已至衬横,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間终蒂,已是汗流浹背蜂林。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留拇泣,地道東北人噪叙。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像霉翔,于是被迫代替她去往敵國和親睁蕾。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容