論文研讀:基于統(tǒng)計重加權(quán)的方法減少通用回復(fù)

論文研讀:基于統(tǒng)計重加權(quán)的方法減少通用回復(fù)

會議名稱:EMNLP2018

文章題目:Towards Less Generic Responses in Neural Conversation Models: A Statistical Re-weighting Method

原文鏈接:https://link.zhihu.com/?target=https%3A//www.paperweekly.site/papers/2440

一句話概括: 針對開放對話領(lǐng)域的對話多對多關(guān)系并且產(chǎn)生通用回復(fù)的問題抢蚀,文章在損失項中引入權(quán)重的概念宅粥,降低通用回復(fù)權(quán)重馋吗,降低過短或者過長語句的權(quán)重秀撇。

論文背景

????神經(jīng)生成模型在機器翻譯中的成功應(yīng)用,即神經(jīng)機器翻譯(Neural Machine Translation, NMT)炼蹦,激發(fā)了研究人員對于神經(jīng)對話模型的熱情凹髓。目前最常用的框架為Seq2Seq模型村斟,其通常通過極大似然法鸠删,最大化回復(fù)的概率得到輸出結(jié)果抱完。但在上述任務(wù)中會存在一些問題,其中最嚴(yán)重的的一個是模型經(jīng)常會產(chǎn)生一個通用的回復(fù)(例如刃泡,我不知道)巧娱,而不是一個有意義的特定回答。

????在開放領(lǐng)域的對話中烘贴,我們經(jīng)常發(fā)現(xiàn)對于一個輸入x禁添,會得到若干意思不一致,但是同樣可以接受的回答桨踪。如問“你吃飯了嗎”老翘,回復(fù)“還沒”,“不餓”,“剛吃完”酪捡,“不急”等等都可以被接受,因此對于xy通常是一個一對多甚至多對多的關(guān)系纳账,如下圖所示:

file

????作者通過這些觀察逛薇,提出了一種統(tǒng)計重加權(quán)的損失函數(shù),減少通用回復(fù)疏虫。

論文方法

????考慮對于語料庫C永罚,其對于樣本(\mathbf{x,y}),損失函數(shù)為:
l(\mathbf{x,y},\theta)=-\sum_{t=1}^{T'}logp(y_t|\mathbf{x,y}_{[t-1];}\theta)
????全樣本集的損失函數(shù)為:
L(C卧秘,\theta)=\sum_{(\mathbf{x,y})\in C}l(\mathbf{x,y},\theta)
????考慮通用回復(fù)出現(xiàn)在很多\mathbf{x}對應(yīng)的回復(fù)中呢袱,因此,如果我們對于\mathbf{x}的兩個回復(fù)中翅敌,如果某個回復(fù)比另一個更加通用羞福,他們會具有相同的損失項(根據(jù)公式1),公式2中會包含大量通用回復(fù)蚯涮,導(dǎo)致模型陷入局部最優(yōu)治专,即模型更加傾向于產(chǎn)生通用回復(fù)。

????基于上述觀察遭顶,但是我們應(yīng)該提高通用回復(fù)的損失张峰,降低不通用回復(fù)的損失。于是提出下面的損失函數(shù):
l_w(\mathbf{x,y},\theta)=w(\mathbf{y|x},\theta)l(\mathbf{x,y},\theta)

????在這里棒旗,w(\mathbf{y|x},\theta)作為一個權(quán)重喘批,取值范圍為(0,1],對于樣本集C上的Batch铣揉,將其損失函數(shù)歸一化為:
L(\mathbb{B},\theta)=\frac{\sum_{\mathbf{x,y\in{\mathbb{B}}}}l_w(\mathbf{x,y},\theta)}{\sum_{\mathbf{x,y\in{\mathbb{B}}}}w(\mathbf{y|x})}
????對于回復(fù)饶深,作者總結(jié)了兩個公共的屬性:

????1. 經(jīng)常出現(xiàn)在訓(xùn)練語料庫中的回復(fù)模式往往是通用的。在這里逛拱,模式指的是整個句子或n-gram粥喜,可以通過回復(fù)之間的相似性來描述。

????2. 特別長或者特別短的回復(fù)都應(yīng)該避免橘券,太長包含太多特定信息额湘,太短通用回復(fù)

????因此作者設(shè)計了權(quán)重:
w(\mathbf{y|x},R,C)= \frac{\Phi(\mathbf{y}) }{max_{r\in R}\{\Phi(r)\}}
????其中\Phi(\mathbf{y})指:
\Phi(\mathbf{y})=\alpha\varepsilon(\mathbf{y})+\beta\mathfrak{F}(\mathbf{y})

????\varepsilon(\mathbf{y})為:
\varepsilon(\mathbf{y})=e^{-af\mathbf{(y)}}

????\mathfrak{F}(\mathbf{y})為:
\mathfrak{F}(\mathbf{y})=e^{-c||\mathbf{y}|-|\mathbf{\hat{y}}||}
這里f(\mathbf{y})是回復(fù)\mathbf{y}在所有回復(fù)中的出現(xiàn)頻次,\hat y為所有回復(fù)的平均長度旁舰,\{\alpha,\beta,a,c\}均為超參數(shù)锋华。

實驗結(jié)果

????作者從社交網(wǎng)站爬取了700萬對話作為實驗,用500作為測試箭窜,對句子通順度毯焕,句子相關(guān)性,可接受度等方面進行評測,同時對權(quán)重的多重設(shè)計的有效性進行了評測(只使用頻次RWE纳猫,長度RWF婆咸,都是用RWEF等)結(jié)果如下:

file

????另外作者利用10萬測試集統(tǒng)計了常用通用回復(fù)的頻次,明顯看到通用回復(fù)變少芜辕。

file

個人總結(jié)

????個人覺得方法還是很有啟發(fā)性的尚骄,通過改變權(quán)重,樣本原本的分布侵续,以此來達到減少通用回復(fù)的目的倔丈。

????但是模型需要顧慮:權(quán)重改變改變了樣本的分布,這種改變是否合理状蜗?噪聲點是否因此被放大需五?在i.i.d條件下,人們通用回復(fù)說得多是否代表通用回復(fù)占比本來就高轧坎,這樣改變的對話系統(tǒng)是否不符合對話方式宏邮?(如在原文中,舉例“孟記普洱茶專營店一貼”缸血,通用回復(fù)為“我也想喝”蜀铲,而文章中的模型為“我喜歡喝茶”,是否前者更符合属百,后者更突兀记劝?)

????但是這篇文章依舊非常具有啟發(fā)性,感謝騰訊AILAB族扰,武漢大學(xué)厌丑,蘇州大學(xué)的大牛們。

本文由飛劍客原創(chuàng)渔呵,如需轉(zhuǎn)載怒竿,請聯(lián)系私信聯(lián)系知乎:@AndyChanCD

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市扩氢,隨后出現(xiàn)的幾起案子耕驰,更是在濱河造成了極大的恐慌,老刑警劉巖录豺,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件朦肘,死亡現(xiàn)場離奇詭異,居然都是意外死亡双饥,警方通過查閱死者的電腦和手機媒抠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來咏花,“玉大人趴生,你說我怎么就攤上這事。” “怎么了苍匆?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵刘急,是天一觀的道長。 經(jīng)常有香客問我浸踩,道長叔汁,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任民轴,我火速辦了婚禮,結(jié)果婚禮上球订,老公的妹妹穿的比我還像新娘后裸。我一直安慰自己,他們只是感情好冒滩,可當(dāng)我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布微驶。 她就那樣靜靜地躺著,像睡著了一般开睡。 火紅的嫁衣襯著肌膚如雪因苹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天篇恒,我揣著相機與錄音扶檐,去河邊找鬼。 笑死胁艰,一個胖子當(dāng)著我的面吹牛款筑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播腾么,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼奈梳,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了解虱?” 一聲冷哼從身側(cè)響起攘须,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎殴泰,沒想到半個月后于宙,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡悍汛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年限煞,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片员凝。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡署驻,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情旺上,我是刑警寧澤瓶蚂,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站宣吱,受9級特大地震影響窃这,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜征候,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一杭攻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧疤坝,春花似錦兆解、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至历谍,卻和暖如春现拒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背望侈。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工印蔬, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人脱衙。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓扛点,卻偏偏與公主長得像,于是被迫代替她去往敵國和親岂丘。 傳聞我的和親對象是個殘疾皇子陵究,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容