#ACL-2016# CopyNet

Incorporating Copying Mechanism in Sequence-to-Sequence Learning

作者來自香港大學(xué)和諾亞方舟實驗室

Motivation

本文的模型通過借鑒人類死記硬背的模式,提出了CopyNet的模型機制裆馒。在很多談話或者文章中姊氓,回答或者摘要的時候需要大量的copy源句子,那么如何copy喷好?從什么地方開始copy翔横?本文模型給出了一種解決方法。

image.png

Model

image.png

首先梗搅,該模型還是一個encoder-decoder的框架禾唁,基于attentive-based 的端到端的模型效览。

encoder

普通的雙向RNN,生成的隱狀態(tài){h1,h2, ... , hn}表示為M.

decoder

decodr部分相對復(fù)雜,在這里decoder有兩個模式荡短,1.生成模式丐枉。2. copy模式。對于對話或者摘要掘托,一如果完全copy源端瘦锹,那么生成的回復(fù)肯定比較生硬,而且表達方面會欠缺很多東西闪盔。而端到端的生成模型弯院,則可以生成一些符合語法并且geneal的回復(fù),對于OOV的問題泪掀,不能很好的解決听绳。那么將兩者進行組合,可以很好的克服彼此的弊端族淮。
另外辫红,對于從哪開始copy的問題凭涂,作者將位置信息加入到了M中祝辣,然后通過類似注意力機制的方法去“注意”復(fù)制哪些信息,并將這種模式稱做selective read切油。再加上attention-based 的decoder 的atentive read蝙斜,這兩種機制的 hybrid coordination 使得copynet的效果很不錯。

詞表:
對于decoder澎胡,作者并沒有向傳統(tǒng)的decoder那樣用softmax求概率孕荠,在這里作者用了兩個詞表X,V. V 表示頻率大的topK的詞攻谁,和一般選取的詞表方法一樣稚伍。而X則表示,所有在源端出現(xiàn)一次的詞戚宦,X和V有交集个曙,如下圖。

image.png

概率的計算公式:

image.png

其中

image.png

生成模式受楼,用的線性映射垦搬,copy模式,用的非線性模式艳汽,并且作者表示tanh激勵函數(shù)比其他函數(shù)要好猴贰。

到這,這里講的都是上圖Figure1里的紅色方框里的東西河狐,對于藍色方框米绕,作者對傳統(tǒng)的decoder的輸入進行了改進瑟捣。除了輸入st-1,和yt-1,ct ,作者將yt-1進行改進,除了自身的embedding外栅干,還加入了類似attention的機制蝶柿,對M進行加權(quán)求和,并且與yt-1的向量合并非驮,共同作為輸入交汤,這樣包含在M中的位置信息,以加權(quán)和的方式進入decoder劫笙,對于copy機制選擇從哪里開始copy有很大的幫助芙扎。

image.png

這個機制就是selective read。

Experiments

作者分別在三個數(shù)據(jù)集(簡單模式填大,摘要戒洼,對話)三個方面進行實驗。實驗結(jié)果都很驚艷允华。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末圈浇,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子靴寂,更是在濱河造成了極大的恐慌磷蜀,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件百炬,死亡現(xiàn)場離奇詭異褐隆,居然都是意外死亡,警方通過查閱死者的電腦和手機剖踊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進店門庶弃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人德澈,你說我怎么就攤上這事歇攻。” “怎么了梆造?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵缴守,是天一觀的道長。 經(jīng)常有香客問我澳窑,道長斧散,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任摊聋,我火速辦了婚禮鸡捐,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘麻裁。我一直安慰自己箍镜,他們只是感情好源祈,可當(dāng)我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著色迂,像睡著了一般香缺。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上歇僧,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天图张,我揣著相機與錄音,去河邊找鬼诈悍。 笑死祸轮,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的侥钳。 我是一名探鬼主播适袜,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼舷夺!你這毒婦竟也來了苦酱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤给猾,失蹤者是張志新(化名)和其女友劉穎疫萤,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體耙册,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡给僵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了详拙。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡蔓同,死狀恐怖饶辙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情斑粱,我是刑警寧澤弃揽,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站则北,受9級特大地震影響矿微,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜尚揣,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一涌矢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧快骗,春花似錦娜庇、人聲如沸塔次。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽励负。三九已至,卻和暖如春匕得,著一層夾襖步出監(jiān)牢的瞬間继榆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工汁掠, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留裕照,地道東北人。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓调塌,卻偏偏與公主長得像晋南,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子羔砾,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,543評論 2 349

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理负间,服務(wù)發(fā)現(xiàn),斷路器姜凄,智...
    卡卡羅2017閱讀 134,633評論 18 139
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,789評論 25 707
  • 最近人工智能隨著AlphaGo戰(zhàn)勝李世乭這一事件的高關(guān)注度政溃,重新掀起了一波新的關(guān)注高潮,有的說人工智能將會如何超越...
    MiracleJQ閱讀 2,818評論 2 1
  • 近日态秧,谷歌官方在 Github開放了一份神經(jīng)機器翻譯教程董虱,該教程從基本概念實現(xiàn)開始,首先搭建了一個簡單的NMT模型...
    MiracleJQ閱讀 6,353評論 1 11
  • 手機可能是我們現(xiàn)在最親密的“朋友”了申鱼,中國社會心態(tài)研究報告顯示愤诱,中國大學(xué)生每天用在手機上的時間達到了5個多小時,也...
    莫西時光記閱讀 1,498評論 0 6