論文筆記-Is ChatGPT A Good Translator? A Preliminary Study

大家好,今天給大家看下騰訊AI實(shí)驗(yàn)室關(guān)于chatGPT在機(jī)器翻譯中表現(xiàn)的一篇論文。論文地址戳https://arxiv.org/pdf/2301.08745v2.pdf卦方。

這篇文章發(fā)表還是蠻早的嗽仪,所以做的東西相對(duì)來說比較簡單荒勇,大家盡量看圖理解。內(nèi)容主要包括翻譯prompt闻坚,多語言翻譯和健壯性三個(gè)部分沽翔。首先看下它用的測試集信息。


1.png

1 翻譯prompt
ChatGPT的prompt會(huì)嚴(yán)重影響獲得的結(jié)果窿凤,是實(shí)驗(yàn)中非常重要的變量仅偎。這里chatGPT給了多個(gè)做翻譯的prompts,然后他們把這些prompts分成三類分別做了實(shí)驗(yàn)雳殊,結(jié)果如下橘沥,可見第三個(gè)prompt結(jié)果最好,就在接下來的論文中統(tǒng)一使用該prompt夯秃。這里用的數(shù)據(jù)是來自Flores-101的Zh>En數(shù)據(jù)座咆。


2.png
3.png

2 多語言翻譯
和先有的商業(yè)翻譯模型相比,chatGPT在高資源數(shù)據(jù)上表現(xiàn)很好仓洼,但是在低資源和語系很遠(yuǎn)的語言上表現(xiàn)不行介陶。這里提出了叫做pivot prompting的方法來提高翻譯效果。這個(gè)也是很有效的解決方法衬潦,不光是在機(jī)器翻譯中斤蔓,大家平時(shí)盡量問chatGPT英文問題植酥,再讓它把英文回答翻譯為中文镀岛,這樣比直接使用中文效果好很多。
這里用的數(shù)據(jù)也是Flores-101友驮, 具體包括德語(De)漂羊,英語(En),羅馬尼亞語(Ro),和中文(Zh)卸留。


4.png

2.1 資源不同
比較En<>De, En<>Ro走越,可以看到>En這個(gè)方向的結(jié)果更好。

2.2 語系
比較En<>De耻瑟, Zh<>En和Ro<>Zh旨指,可以看到語言之間的語系越近,翻譯結(jié)果越好喳整,這個(gè)也是很自然的谆构,畢竟chatGPT中絕大部分?jǐn)?shù)據(jù)是英語,拉丁語系直接可以更加的進(jìn)行知識(shí)遷移框都,效果更好搬素。

2.3 Pivot Prompting
上面已經(jīng)說過這個(gè)了,這里說下它的效果。


5.png
6.png

3 翻譯健壯性
在生物醫(yī)學(xué)摘要和reddit評(píng)論這里熬尺,chatGPT沒用商業(yè)翻譯模型好摸屠,但是在口語翻譯上表現(xiàn)非常好。這里還可以下length ration(LR)參數(shù)來看下欠翻譯問題粱哼。


7.png
8.png

問題
1 首先是測試集的選擇季二,GPT的訓(xùn)練數(shù)據(jù)是單語數(shù)據(jù),這樣所有的翻譯任務(wù)可以看作是零樣本學(xué)習(xí)揭措,從這個(gè)角度說論文里用的wmt21,19是OK的戒傻。但我會(huì)選wmt22,這樣可以100%保證測試集不在訓(xùn)練數(shù)據(jù)中蜂筹。

2 評(píng)估方法使用了bleu需纳、chrf和TER,強(qiáng)烈建議加上comet分?jǐn)?shù)艺挪,這個(gè)分?jǐn)?shù)更加可靠不翩。comet工具戳https://github.com/Unbabel/COMET

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市麻裳,隨后出現(xiàn)的幾起案子口蝠,更是在濱河造成了極大的恐慌,老刑警劉巖津坑,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件妙蔗,死亡現(xiàn)場離奇詭異,居然都是意外死亡疆瑰,警方通過查閱死者的電腦和手機(jī)眉反,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來穆役,“玉大人寸五,你說我怎么就攤上這事」⒈遥” “怎么了梳杏?”我有些...
    開封第一講書人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長淹接。 經(jīng)常有香客問我十性,道長,這世上最難降的妖魔是什么塑悼? 我笑而不...
    開封第一講書人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任劲适,我火速辦了婚禮,結(jié)果婚禮上拢肆,老公的妹妹穿的比我還像新娘减响。我一直安慰自己靖诗,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開白布支示。 她就那樣靜靜地躺著刊橘,像睡著了一般。 火紅的嫁衣襯著肌膚如雪颂鸿。 梳的紋絲不亂的頭發(fā)上促绵,一...
    開封第一講書人閱讀 49,784評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音嘴纺,去河邊找鬼败晴。 笑死,一個(gè)胖子當(dāng)著我的面吹牛栽渴,可吹牛的內(nèi)容都是我干的尖坤。 我是一名探鬼主播,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼闲擦,長吁一口氣:“原來是場噩夢啊……” “哼慢味!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起墅冷,我...
    開封第一講書人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤纯路,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后寞忿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體驰唬,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年腔彰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了叫编。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡萍桌,死狀恐怖宵溅,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情上炎,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布雏搂,位于F島的核電站藕施,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏凸郑。R本人自食惡果不足惜裳食,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望芙沥。 院中可真熱鬧诲祸,春花似錦浊吏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至着憨,卻和暖如春墩衙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背甲抖。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來泰國打工漆改, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人准谚。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓挫剑,卻偏偏與公主長得像,于是被迫代替她去往敵國和親柱衔。 傳聞我的和親對(duì)象是個(gè)殘疾皇子暮顺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容