2016年谷歌發(fā)布了其基于人工智能的神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)(GNMT:Google?Neural Machine Translation)沽讹,并宣稱這款產(chǎn)品實現(xiàn)了幾乎與人工翻譯的無差別化耘分,一時給業(yè)界帶來了巨大的震動钦铁。今天我想給大家解讀德國《明鏡周刊》的一篇文章,文章中介紹了一家德國本土的創(chuàng)業(yè)公司DeepL菇爪。這家公司一出場就把矛頭指向了目前行業(yè)的老大谷歌翻譯撑瞧,并自稱自家研發(fā)的翻譯系統(tǒng)已經(jīng)在NMT技術(shù)上超越了谷歌。
DeepL是一家總部位于德國科隆的創(chuàng)業(yè)公司乙嘀,它的前身是做在線翻譯詞典的Linguee末购。大家可能對Linguee并不熟悉,但這個詞典真心好用, 我在德國的時候遇到一些很難翻的專有名詞基本都是靠這個詞典虎谢,它會把網(wǎng)絡(luò)上已經(jīng)有的關(guān)于這個詞的對照翻譯全部搜羅來并進行準(zhǔn)確度與常用度的匹配分類來推薦盟榴,非常靠譜婴噩,只可惜目前翻譯語言還沒有中文擎场。Linguee雖然很早就建立了爬蟲系統(tǒng)來抓取互聯(lián)網(wǎng)上的雙語詞句對照翻譯, 但對于句子而言翻譯出來的還是一片混亂几莽,以至于不得不請專業(yè)的翻譯人員進行整句配對評估和完善工作迅办。其實不止是Linguee,當(dāng)時谷歌的神翻譯也經(jīng)常在國外的互聯(lián)網(wǎng)論壇中被拿來開心一下银觅。但就在大約三年前礼饱,神經(jīng)網(wǎng)絡(luò)機器翻譯還沒有出現(xiàn)在大眾視野中時,DeepL團隊已經(jīng)搭乘了第一班快車開始大量投入研發(fā)究驴。雖然這班車上都是體量級強大的競爭對手镊绪,但DeepL有自信可以超越它們。
要說神經(jīng)網(wǎng)絡(luò)翻譯的突然出現(xiàn)對于很多人工智能方面的專家而言就好像發(fā)現(xiàn)了一個新的物種一樣興奮洒忧,這項技術(shù)可以說完全突破了傳統(tǒng)機器翻譯的短語配對思路蝴韭,而是將整句作為翻譯的基本單元。那么DeepL究竟有哪些優(yōu)勢可以讓它放言稱超越谷歌翻譯呢熙侍?
首先DeepL有著強大而完備的數(shù)據(jù)基礎(chǔ)榄鉴,這得歸功于Linguee多年來出色的數(shù)據(jù)采集和管理履磨, Linguee的數(shù)據(jù)集已經(jīng)有超過十億組對照翻譯語句, 號稱世界上最大的人工翻譯數(shù)據(jù)集。 其次DeepL并沒有采用NMT產(chǎn)品通用的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 庆尘,而采用了通過其技術(shù)積累更加完善的卷積神經(jīng)網(wǎng)絡(luò) (CNN)剃诅,相比RNN而言CNN能夠使翻譯更加精準(zhǔn)自然。就像DeepL的總工程師Kultylowski在一次演講中說到的一樣驶忌,他把DeepL的算法比做一個孩子矛辕, 當(dāng)一個孩子第一次在叢林中漫步的時候,他首先要學(xué)會的就是怎么樣讓自己的腳在遇到樹枝石塊等一些障礙物的時候抬起來并邁過去付魔,以防被這些障礙物絆倒聊品,對于成年人來講這個動作已經(jīng)被大腦學(xué)習(xí)過了,所以大腦在處理這部分信息的時候會根據(jù)學(xué)習(xí)到的模型產(chǎn)生一系列信號完成相應(yīng)的動作几苍。DeepL強大的數(shù)據(jù)會訓(xùn)練它的算法穿越在世界各種語言的叢林中自如漫步翻屈。DeepL為證明其實力還邀請了專業(yè)的譯者進行了與其他競品的測評,測評結(jié)果顯示DeepL遠超其他NMT翻譯系統(tǒng)穩(wěn)居第一妻坝,這其中當(dāng)然包括谷歌伸眶。鑒于這只是DeepL自己給出的測評結(jié)果,官網(wǎng)也并未公布出更多測評信息刽宪,所以我自己也拿DeepL和谷歌翻譯做了幾組英德互譯的對比測驗赚抡,果然DeepL翻譯得要比谷歌更加自然貼切,大家不妨也可以去試下纠屋。
雖然DeepL目前的技術(shù)可以在神經(jīng)網(wǎng)絡(luò)翻譯的競跑中保持領(lǐng)先,但這可能只是暫時的盾计,因為在這個比賽中不僅有美國強大的對手步步緊逼售担,中國的有道翻譯也緊隨其后。在2017年有道發(fā)布了其自主研發(fā)的神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)署辉。在如此激烈的競爭下我們不禁會想到族铆,在不久的將來人工智能翻譯是否會完全取代人工翻譯?
對于這個問題哭尝,在德國一家知名翻譯公司從事了多年翻譯工作的Andrew Wakeman表示他并不擔(dān)心自己的工作哥攘,相反他認為人工智能將改變而不會消滅他的工作。
就像在這個行業(yè)中的其他人一樣材鹦,Wakeman早在很多年前就開始使用電腦輔助的翻譯工具逝淹,它可以給出Wakeman一些常用短語的翻譯建議,同時還可以識別出之前翻譯過的內(nèi)容并加以提醒桶唐,這種方法被稱作 “機器輔助式的人工翻譯” (MAHT:Machine-Assisted Human Translation)栅葡。 隨著人工智能對翻譯領(lǐng)域的不斷滲透,Wakeman的角色也從MAHT過渡到了MTPE (Machine Translation Post-Editing 機器翻譯后期編輯)尤泽。 人工智能翻譯系統(tǒng)首先可以在幾秒內(nèi)完成翻譯欣簇,接下來再由人工對一些錯誤疏漏或是文化用語上的誤解進行修改完善规脸,這樣一來翻譯人員就逐漸轉(zhuǎn)變成了審校人員,充當(dāng)起了機器翻譯的助手熊咽。Wakeman對于這種轉(zhuǎn)變并沒有深感憂慮莫鸭,他認為現(xiàn)在人工智能工具已經(jīng)進入了很多領(lǐng)域,他們就像是辦公室里被過度激勵而拼命工作的同事一樣横殴,雖然能夠以最快的速度完成最多的工作被因,但同時也需要有經(jīng)驗的同事對其工作進行引導(dǎo)管控和評估完善。這種人類和機器的分工階段被稱為人工智能時代的初級階段滥玷,在這個階段人工智能普遍充當(dāng)?shù)氖羌訌娚a(chǎn)效率的角色氏身。比如現(xiàn)在一些大型律師事務(wù)所已經(jīng)將文件審核整理等一些基礎(chǔ)性的工作交給人工智能來做。
雖然目前在初級階段的人工智能可能還不會搶走翻譯人員的工作惑畴,但是主輔角色的轉(zhuǎn)換或許會使他們的薪酬大大縮水蛋欣,畢竟就目前而言翻譯肯定要比審核校對掙得更多。
或許有朝一日機器翻譯可以完全取代人工翻譯如贷,可以像人一樣用自己的閱讀陷虎、經(jīng)驗、情感杠袱、理解去詮釋一篇文章尚猿,但這一天應(yīng)該還非常非常遙遠,相反我們可以想想當(dāng)今社會是不是過于高估了人工智能楣富,而低估了人類智能呢凿掂?