自然語言生成工具箱 - DNPG(二)

文章名稱

【ACL-2019】A Deep Generative Framework for Paraphrase Generation

核心要點

上一屆主要講解了作者提出的釋義生成的模型結(jié)構(gòu)使套。本解講解如何對該模型的參數(shù)進行學(xué)習(xí)妆绞,以及模型之上利用無監(jiān)督的領(lǐng)域遷移技術(shù),實現(xiàn)跨預(yù)料的釋義短語生成渔期。

方法細節(jié)

問題引入

可以通過最最大化如下圖所示的條件概率來進行端到端的訓(xùn)練某筐,但是從頭開始學(xué)習(xí)不能為分割器和聚合器提供(特別)有用的監(jiān)督信息,因此并不是最佳的訓(xùn)練方式吠谢。

具體做法

為了解決分割器和聚合器訓(xùn)練的問題晦嵌,作者利用弱監(jiān)督的方式,利用[1]中的詞對齊模型荸实,建立平行(釋義)語料中匀们,詞與詞之間的對應(yīng)關(guān)系,并隨機sample一些(包含罕見詞匯的)對其后的短語對准给,給他們賦予標簽z^*=0(即具有短語級別的釋義粒度)泄朴,其他部分標簽為句子級別方咆。并以此為監(jiān)督信息隅居,在初期指導(dǎo)模型參數(shù)學(xué)習(xí)。隨著迭代的深入券腔,逐漸弱化這個顯示監(jiān)督信息的影響畔规。整個監(jiān)督的損失函數(shù)如下圖所示局扶,其中\lambda是超參數(shù),逐漸被從1減弱到0叁扫。

loss function

我們可以利用ROUGE三妈、BLEU、iBELU等指標對模型生成的句子進行評價莫绣。除了這些量化指標之外畴蒲,我們還可以基于DNPG模型的一些特性,對模型生成結(jié)果進行可解釋性的分析对室。例如模燥,利用DNPG預(yù)測的每個單詞的釋義粒度(詞/短語還是句子)以及Multi-Head Attention的注意力結(jié)果,我們可以提取詞掩宜、短語釋義對蔫骂,或者是釋義句式。具體的說锭亏,1)通過注意力的激活值纠吴,可以觀測到詞/短語的對齊;2)通過把對齊的詞/短語利用統(tǒng)一的占位符進行替換慧瘤,我們可以得到固定的句式戴已。具體的提取方法如下圖算法所示。

template extraction

此外锅减,可以通過手動指定輸入語句每一個短語的釋義粒度標簽糖儡,并且調(diào)整模型參數(shù)和結(jié)構(gòu),實現(xiàn)對釋義生成過程的控制怔匣。例如握联,1)期望生成句子級別的釋義桦沉,可以強制要求詞/短語級別的解碼器使用copy模式(\rho_t=1)保證詞/短語粒度的釋義結(jié)構(gòu)不變,同時利用特殊的占位符替換詞/短語金闽,在實現(xiàn)句子級別釋義生成后替換回詞/短語纯露;2)期望實現(xiàn)詞/短語粒度的釋義,可以只利用詞/短語粒度的釋義的解碼器進行釋義生成代芜,并且只生成所有詞的釋義粒度標簽不是句子層級的位置埠褪。

當需要進行釋義生成的領(lǐng)域沒有平行語料的時候,需要進行無監(jiān)督的領(lǐng)域遷移挤庇。我們可以直接利用訓(xùn)練好的釋義生成模型在目標域上進行生成钞速,但是由于兩個領(lǐng)域的語言模型可能不一致,需要進行遷移嫡秕。作者利用RL的方法把分隔器P_{sep}(Z|X)遷移到目標域渴语,優(yōu)化的目標函數(shù)如下圖所示。

domain adaptation loss
domain adaptation reward

其中昆咽,r_l(z_{1:l}, X)表示到當前位置生成的分割的reward驾凶,而P_{LM}(\overline{X}_{\overline{l}}, \overline{X}_{1:\overline{l}-1})表示在源語料域上訓(xùn)練的語言模型,該模型被用來在目標與上充當語言模型來產(chǎn)生得分函數(shù)潮改,指導(dǎo)分割器訓(xùn)練狭郑。作者采用這個方法構(gòu)造reward的理念在于,兩個語料領(lǐng)域共享相同的句式結(jié)構(gòu)汇在。α用來懲罰被標記為詞/短語釋義類別的長句子片段翰萨,因為長片段應(yīng)該被識別為句子級別的釋義,這個級別的釋義具有更多的語義信息糕殉。整個算是函數(shù)采用Policy Gradient進行優(yōu)化亩鬼。訓(xùn)練的流程圖如下圖所示。

tranning process

心得體會

領(lǐng)域遷移

作者進行領(lǐng)域遷移的時候阿蝶,假設(shè)的是句子模式是一致的雳锋,并且利用語言模型來調(diào)整分割器。這種思路在相同語種和句法結(jié)構(gòu)比較相似的語料是可以實現(xiàn)的羡洁。但是在語法風(fēng)格變化比較大的語料上可能效果會出現(xiàn)偏差玷过。個人感覺,利用句子模式訓(xùn)練得到的語言模型來構(gòu)造reward思路值得借鑒筑煮,感興趣的同學(xué)可以留意相關(guān)工作中辛蚊,領(lǐng)域遷移的部分。

文章引用

[1] Franz Josef Och and Hermann Ney. 2003. A systematic comparison of various statistical alignment models. Computational Linguistics, 29(1):19–51.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載真仲,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者袋马。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市秸应,隨后出現(xiàn)的幾起案子虑凛,更是在濱河造成了極大的恐慌碑宴,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件桑谍,死亡現(xiàn)場離奇詭異延柠,居然都是意外死亡,警方通過查閱死者的電腦和手機锣披,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進店門捕仔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人盈罐,你說我怎么就攤上這事∩了簦” “怎么了盅粪?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長悄蕾。 經(jīng)常有香客問我票顾,道長,這世上最難降的妖魔是什么帆调? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任奠骄,我火速辦了婚禮,結(jié)果婚禮上番刊,老公的妹妹穿的比我還像新娘含鳞。我一直安慰自己,他們只是感情好芹务,可當我...
    茶點故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布蝉绷。 她就那樣靜靜地躺著,像睡著了一般枣抱。 火紅的嫁衣襯著肌膚如雪熔吗。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天佳晶,我揣著相機與錄音桅狠,去河邊找鬼。 笑死轿秧,一個胖子當著我的面吹牛中跌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播淤刃,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼晒他,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了逸贾?” 一聲冷哼從身側(cè)響起陨仅,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤津滞,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后灼伤,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體触徐,經(jīng)...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年狐赡,在試婚紗的時候發(fā)現(xiàn)自己被綠了撞鹉。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,505評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡颖侄,死狀恐怖鸟雏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情览祖,我是刑警寧澤孝鹊,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站展蒂,受9級特大地震影響又活,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜锰悼,卻給世界環(huán)境...
    茶點故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一柳骄、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧箕般,春花似錦耐薯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至丙者,卻和暖如春复斥,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背械媒。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工目锭, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人纷捞。 一個月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓痢虹,卻偏偏與公主長得像,于是被迫代替她去往敵國和親主儡。 傳聞我的和親對象是個殘疾皇子奖唯,可洞房花燭夜當晚...
    茶點故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內(nèi)容