機(jī)器翻譯學(xué)術(shù)視野-2018.03.02

1咕宿,Going beyond zero-shot MT: combining phonological, morphological and semantic factors

本文將多語(yǔ)種詞匯的多種特征融入到NMT編碼器的embedding信息中圆存,特征包括語(yǔ)言語(yǔ)義標(biāo)注信息吮旅、詞性信息、Lemma尤揣、Stem,近似的發(fā)音編碼、Babel Synset同義詞信息男旗、toptic信息。文中詳細(xì)分析了多語(yǔ)種語(yǔ)料特征欣鳖,相比拉丁語(yǔ)系(ro\it\es\gr)察皇,日耳曼語(yǔ)系(en\de\nl)共享更多的詞匯。本文NMT系統(tǒng)采用Nematus工具泽台,在訓(xùn)練語(yǔ)料源句子加上<2trg>標(biāo)簽什荣,源語(yǔ)言詞匯的表征是其所有特征的合并。從結(jié)果來(lái)看怀酷,所有特征融合在smalldata上可以提升0.7個(gè)bleu稻爬。

2,The Samsung and University of Edinburgh’s submission to IWSLT17

本文系統(tǒng)只參加了雙語(yǔ)翻譯任務(wù)蜕依,en-de桅锄,使用Nematus工具。IWSLT提供了大量的平行訓(xùn)練語(yǔ)料样眠,本文使用句子對(duì)齊和語(yǔ)言識(shí)別來(lái)清洗和過(guò)濾語(yǔ)料友瘤。句子對(duì)齊:使用NMT系統(tǒng)自動(dòng)翻譯原文本,使用翻譯結(jié)果和目標(biāo)文本的bleu值左右預(yù)測(cè)對(duì)齊概率的一個(gè)特征檐束。具體是訓(xùn)練一個(gè)PSMT系統(tǒng)來(lái)清除不合適的短語(yǔ)辫秧,然后把德語(yǔ)翻譯成英語(yǔ),最后使用句子對(duì)齊工具來(lái)處理每一個(gè)平行句對(duì)被丧。本文選擇3K句子進(jìn)行人工打分盟戏,然后訓(xùn)練模型根據(jù)句子對(duì)齊分?jǐn)?shù)預(yù)測(cè)人工分?jǐn)?shù),然后使用回歸模型應(yīng)用與整個(gè)語(yǔ)料晚碾,挑選出得分比較高的句子抓半。反向翻譯語(yǔ)料是使用NMT翻譯單語(yǔ)語(yǔ)料來(lái)構(gòu)成平行語(yǔ)料。最終用來(lái)訓(xùn)練的語(yǔ)料包括允許格嘁、過(guò)濾的平行語(yǔ)料笛求、過(guò)采樣的域內(nèi)數(shù)據(jù)和反向翻譯的數(shù)據(jù)。通過(guò)調(diào)參和finetuning之后,效果總體提升5個(gè)bleu探入。

3狡孔,F(xiàn)BK’s Multilingual Neural Machine Translation System for IWSLT 2017

本文參與multilingual和zero-shot任務(wù),系統(tǒng)使用many2many訓(xùn)練方法蜂嗽。本文使用OpenNMT工具苗膝,encoder和decoder各4層網(wǎng)絡(luò)。本文做了以下對(duì)比試驗(yàn)植旧,multilingual model和Single Pair model辱揭,multilingual model和zero-shot,zero-shot和pivoting病附。從實(shí)驗(yàn)結(jié)果來(lái)看问窃,單個(gè)multilingual model效果好于Single Pair model,Zero-shot model proved效果要好于Single Pair model pivoting完沪。

4域庇,KIT’s Multilingual Neural Machine Translation systems for IWSLT 2017

本文將NMT網(wǎng)絡(luò)結(jié)構(gòu)分成五個(gè)主要的組成單元:embedding layers, encoders, decoders, attention and output layers。本文研究了對(duì)于multilingual任務(wù)覆积,哪些單元可以共享听皿。數(shù)據(jù)處理:句子長(zhǎng)度超過(guò)50,句對(duì)長(zhǎng)度差異較大的句子被清除宽档,特殊的日期尉姨、數(shù)字和符號(hào)進(jìn)行歸一化,使用Smartcasing吗冤,BPE詞典大小為40K啊送。embedding layers和output layers不共享,smal data上欣孤,share-rnn效果好于share-all0.7個(gè)bleu,large data上兩者效果一致昔逗。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末降传,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子勾怒,更是在濱河造成了極大的恐慌婆排,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,544評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件笔链,死亡現(xiàn)場(chǎng)離奇詭異段只,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)鉴扫,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門赞枕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事炕婶〗闵模” “怎么了?”我有些...
    開封第一講書人閱讀 162,764評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵柠掂,是天一觀的道長(zhǎng)项滑。 經(jīng)常有香客問我,道長(zhǎng)涯贞,這世上最難降的妖魔是什么枪狂? 我笑而不...
    開封第一講書人閱讀 58,193評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮宋渔,結(jié)果婚禮上州疾,老公的妹妹穿的比我還像新娘。我一直安慰自己傻谁,他們只是感情好孝治,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著审磁,像睡著了一般谈飒。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上态蒂,一...
    開封第一講書人閱讀 51,182評(píng)論 1 299
  • 那天杭措,我揣著相機(jī)與錄音,去河邊找鬼钾恢。 笑死手素,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的瘩蚪。 我是一名探鬼主播泉懦,決...
    沈念sama閱讀 40,063評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼疹瘦!你這毒婦竟也來(lái)了崩哩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,917評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤言沐,失蹤者是張志新(化名)和其女友劉穎邓嘹,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體险胰,經(jīng)...
    沈念sama閱讀 45,329評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡汹押,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評(píng)論 2 332
  • 正文 我和宋清朗相戀三年速缆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了一睁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辙喂。...
    茶點(diǎn)故事閱讀 39,722評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖毅臊,靈堂內(nèi)的尸體忽然破棺而出矾端,到底是詐尸還是另有隱情幅虑,我是刑警寧澤耳胎,帶...
    沈念sama閱讀 35,425評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站细诸,受9級(jí)特大地震影響沛贪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜震贵,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評(píng)論 3 326
  • 文/蒙蒙 一利赋、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧猩系,春花似錦媚送、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至拿霉,卻和暖如春吟秩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背绽淘。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工涵防, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沪铭。 一個(gè)月前我還...
    沈念sama閱讀 47,729評(píng)論 2 368
  • 正文 我出身青樓壮池,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親杀怠。 傳聞我的和親對(duì)象是個(gè)殘疾皇子椰憋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容