學(xué)界?|?百度AAAI?2018論文提出新型NMT模型木缝,性能堪比深層模型

姓名:張萌? ? ? ? ? 學(xué)號(hào)17021211113

轉(zhuǎn)自:http://mp.weixin.qq.com/s/4fYvp9XFyJP4fE9BYvYLBw

【嵌牛導(dǎo)讀】:近日,AAAI 2018 公布論文接收列表,百度機(jī)器翻譯團(tuán)隊(duì)的論文《Multi-channel Encoder for Neural Machine Translation》上榜蜡坊。文章提出了一種多信道編碼器(MCE)模型,可改進(jìn)傳統(tǒng)神經(jīng)機(jī)器翻譯(NMT)模型單一信道編碼的缺點(diǎn)赎败。該模型在中英翻譯上的 BLEU 值提升了超過(guò) 6 個(gè)百分點(diǎn)秕衙,在英法翻譯上用單層模型取得了可與深層模型媲美的效果。本文對(duì)該論文的主要內(nèi)容做了介紹僵刮。

【嵌牛鼻子】:NMT模型

【嵌牛提問(wèn)】:新的NMT模型是什么据忘?

【嵌牛正文】:

基于注意力的神經(jīng)機(jī)器翻譯無(wú)疑成為 NMT 最有效的架構(gòu),在許多語(yǔ)言對(duì)上超越了傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯(SMT)系統(tǒng)(Sen-nrich et al. 2017)搞糕∮碌酰基于注意力的模型之所以能夠大大超越典型的編碼器-解碼器模型,在于它能夠通過(guò)一個(gè)相對(duì)簡(jiǎn)單的匹配函數(shù)動(dòng)態(tài)檢索相關(guān)聯(lián)的源語(yǔ)塊(類(lèi)似 SMT 中的對(duì)齊)窍仰。換言之汉规,基于注意力的模型受益于豐富的源語(yǔ)句表征及其表示局部結(jié)構(gòu)的靈活性。

在典型的基于注意力的 NMT 系統(tǒng)中驹吮,使用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(biRNN) 對(duì)源語(yǔ)句進(jìn)行編碼针史,利用 RNN 生成向量序列,粗略來(lái)說(shuō)這些向量就是源語(yǔ)句單詞的上下文感知嵌入(context-aware embedding)碟狞。這種設(shè)計(jì)下啄枕,編碼器學(xué)習(xí)相對(duì)一致的句子組合。如今族沃,編碼器中的 RNN 已經(jīng)被一些先進(jìn)的門(mén)控機(jī)制變體所替代频祝,例如 LSTM 和 GRU。對(duì)翻譯來(lái)說(shuō)脆淹,普遍希望解碼器采用極其符合自己語(yǔ)言架構(gòu)的語(yǔ)句組合塊智润。

在此需求下,百度研究員提出了一種多信道編碼模型(MCE)未辆,采用不同層次組合的編碼組件窟绷。更具體而言,除了編碼 RNN 的隱態(tài)咐柜,MCE 為不帶組合的原始編碼采取了原始詞嵌入兼蜈,并在 NTM 中以類(lèi)似于帶有不同頻率的視覺(jué)信道的方式為更復(fù)雜的組合專(zhuān)門(mén)設(shè)計(jì)了外部存儲(chǔ)器攘残。所有三個(gè)編碼策略在由參數(shù)控制的解碼過(guò)程中被適當(dāng)混合,并能夠以端到端的方式被學(xué)習(xí)为狸。更具體說(shuō)歼郭,百度設(shè)計(jì)了一個(gè)可以自動(dòng)調(diào)節(jié)不同編碼信道權(quán)重的門(mén)控機(jī)制。

在此論文中辐棒,作者們也調(diào)查了 MCE 在不同的翻譯任務(wù)上的表現(xiàn)病曾。首先,在 NIST 中翻英任務(wù)上測(cè)試了該模型漾根,相比于強(qiáng)大的 DL4MT 系統(tǒng)平均提升了 6.52 的 BLEU 得分泰涂。此外,在 WMT 2014 英翻法任務(wù)上辐怕,單個(gè)淺層模型獲得了 38.8 的 BLEU 得分逼蒙,可媲美于頂級(jí)模型。

論文:Multi-channel Encoder for Neural Machine Translation

圖片發(fā)自簡(jiǎn)書(shū)App

論文鏈接:https://arxiv.org/abs/1712.02109

摘要:基于注意力的編碼器-解碼器是非常有效的神經(jīng)機(jī)器翻譯(NMT)架構(gòu)寄疏,它通常依賴(lài)于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在解碼過(guò)程中構(gòu)建由 attentive reader 調(diào)用的塊是牢。盡管使用門(mén)控機(jī)制編碼 RNN,但這種編碼器的設(shè)計(jì)在源語(yǔ)句上產(chǎn)生了相對(duì)一致的組合陕截。另一方面驳棱,我們常常希望解碼器能夠在不同層次上采取若干個(gè)源語(yǔ)句來(lái)匹配其自身語(yǔ)言結(jié)構(gòu):比如,我們也許想采取原始形式的實(shí)體名农曲,同時(shí)采取一個(gè)習(xí)語(yǔ)(idiom)作為一個(gè)完美的組成單元社搅。受此需求啟發(fā),我們提出了多信道編碼器(Multi-channel Encoder/MCE)朋蔫,它增強(qiáng)了不同層面組合的編碼組件罚渐。更具體的是,除卻編碼 RNN 的隱藏狀態(tài)驯妄,1)MCE 為不帶組合的原始編碼采取了原始詞嵌入荷并;2)神經(jīng)圖靈機(jī)(NTM)專(zhuān)門(mén)設(shè)計(jì)的外部存儲(chǔ)器用于更加復(fù)雜的組合,而所有三種編碼策略在解碼時(shí)被恰當(dāng)?shù)鼗旌锨嗳印h英翻譯的實(shí)證研究表明源织,我們的模型在強(qiáng)大的開(kāi)源 NMT 系統(tǒng) DL4MT1 上實(shí)現(xiàn)了 6.52 個(gè) BLEU 百分點(diǎn)的提升。在 WMT14 英法語(yǔ)翻譯務(wù)中微猖,我們的單一淺層系統(tǒng)達(dá)到了 38.8 的 BLEU 值谈息,與當(dāng)前最優(yōu)的深度模型相當(dāng)。

圖片發(fā)自簡(jiǎn)書(shū)App


圖 1:左圖是傳統(tǒng)的基于注意力的 NMT 模型凛剥,包含編碼器侠仇、解碼器和一個(gè)注意力機(jī)制。右邊是我們的全新 NMT 模型,帶有多個(gè)信道編碼器逻炊,包含來(lái)自雙向 RNN 的隱藏狀態(tài)互亮、NTM 中的外部存儲(chǔ)和直接來(lái)自輸入序列的嵌入,并設(shè)計(jì)了一種門(mén)控注釋?zhuān)╣ated annotation)自動(dòng)學(xué)習(xí)不同解碼組件的權(quán)重余素。

圖片發(fā)自簡(jiǎn)書(shū)App

圖 2:編碼器中 NTM 的圖示豹休,每一時(shí)間步上 RNN 在 NTM 中的讀和寫(xiě)。

圖片發(fā)自簡(jiǎn)書(shū)App

表 1:不同系統(tǒng)在中翻英任務(wù)上的表現(xiàn)桨吊。相比于強(qiáng)大的開(kāi)源系統(tǒng) DL4MT威根,我們的模型有極大的改進(jìn)。我們也列出了與近期開(kāi)源的兩個(gè)工具包 T2T视乐、ConvS2S 的對(duì)比洛搀。要知道,T2T 和 ConvS2S 都是多層的深度模型炊林。

圖片發(fā)自簡(jiǎn)書(shū)App

表 2:英翻法任務(wù):BLEU 得分姥卢。其中 RNN 表示基礎(chǔ)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型卷要,MCE 模型結(jié)合了從 RNN 的嵌入渣聚、隱藏狀態(tài)以及 NTM 中的外部存儲(chǔ)三種編碼組件。注意僧叉,我們的模型不執(zhí)行 PosUNK奕枝,且使用小型詞匯量。

圖片發(fā)自簡(jiǎn)書(shū)App

圖 3:不同語(yǔ)句長(zhǎng)度下的性能瓶堕。

百度機(jī)器翻譯簡(jiǎn)介:百度機(jī)器翻譯團(tuán)隊(duì)繼 2015 年推出全球首個(gè) NMT 線上翻譯服務(wù)之后隘道,通過(guò)持續(xù)不斷的技術(shù)創(chuàng)新,在 NMT 模型研究和產(chǎn)品商業(yè)化應(yīng)用上屢創(chuàng)佳績(jī)郎笆。在今年的百度世界大會(huì)上成功展示了自動(dòng)同聲傳譯系統(tǒng)谭梗,語(yǔ)音識(shí)別和機(jī)器翻譯技術(shù)無(wú)縫銜接,翻譯結(jié)果流暢自然宛蚓。同時(shí)激捏,百度也在今年推出了一鍵式多語(yǔ)種 WIFI 翻譯機(jī),產(chǎn)品自帶 80 多個(gè)國(guó)家的 4G 網(wǎng)絡(luò)凄吏、語(yǔ)種自動(dòng)識(shí)別远舅,提供多語(yǔ)種高質(zhì)量語(yǔ)音翻譯。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末痕钢,一起剝皮案震驚了整個(gè)濱河市图柏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌任连,老刑警劉巖蚤吹,帶你破解...
    沈念sama閱讀 211,348評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異随抠,居然都是意外死亡裁着,警方通過(guò)查閱死者的電腦和手機(jī)余佃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)跨算,“玉大人爆土,你說(shuō)我怎么就攤上這事≈畈希” “怎么了步势?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,936評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)背犯。 經(jīng)常有香客問(wèn)我坏瘩,道長(zhǎng),這世上最難降的妖魔是什么漠魏? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,427評(píng)論 1 283
  • 正文 為了忘掉前任倔矾,我火速辦了婚禮,結(jié)果婚禮上柱锹,老公的妹妹穿的比我還像新娘哪自。我一直安慰自己,他們只是感情好禁熏,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,467評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布壤巷。 她就那樣靜靜地躺著,像睡著了一般瞧毙。 火紅的嫁衣襯著肌膚如雪胧华。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,785評(píng)論 1 290
  • 那天宙彪,我揣著相機(jī)與錄音矩动,去河邊找鬼。 笑死释漆,一個(gè)胖子當(dāng)著我的面吹牛悲没,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播灵汪,決...
    沈念sama閱讀 38,931評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼檀训,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了享言?” 一聲冷哼從身側(cè)響起峻凫,我...
    開(kāi)封第一講書(shū)人閱讀 37,696評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎览露,沒(méi)想到半個(gè)月后荧琼,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,141評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,483評(píng)論 2 327
  • 正文 我和宋清朗相戀三年命锄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了堰乔。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,625評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡脐恩,死狀恐怖镐侯,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情驶冒,我是刑警寧澤苟翻,帶...
    沈念sama閱讀 34,291評(píng)論 4 329
  • 正文 年R本政府宣布,位于F島的核電站骗污,受9級(jí)特大地震影響崇猫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜需忿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,892評(píng)論 3 312
  • 文/蒙蒙 一诅炉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧屋厘,春花似錦涕烧、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)景鼠。三九已至仲翎,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間铛漓,已是汗流浹背溯香。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留浓恶,地道東北人玫坛。 一個(gè)月前我還...
    沈念sama閱讀 46,324評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像包晰,于是被迫代替她去往敵國(guó)和親湿镀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,492評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容