“預測未來最好的方式是創(chuàng)造未來”
——彼得·德魯克
人機合譯路漫漫
基于深度神經(jīng)網(wǎng)絡算法帶來的機器翻譯質(zhì)量大幅躍升已成為業(yè)內(nèi)共識。機翻質(zhì)量在部分領域已經(jīng)逼近人工翻譯結(jié)果裕便,特別是新聞領域绒净,微軟2018年已宣布“我們研發(fā)的機器翻譯系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平”偿衰。
另一方面挂疆,當機器翻譯取代人工翻譯的論調(diào)不再甚囂塵上,巴別塔即將建成之類的狂妄逐漸止息哎垦,我們必將重新冷靜地審視人類語言的復雜度囱嫩。作為承載文化和思維的載體,一種語言轉(zhuǎn)換為另一種語言漏设,即使在信息交換和日常閱讀層面墨闲,我認為人機合譯是一條繞不過去且漫長的路。
那么郑口,在神經(jīng)網(wǎng)絡機器翻譯時代鸳碧,我們需要一款什么樣的人機合譯工具?特別是筆譯工具犬性?
看似有許多工具可選擇瞻离,比如到谷歌翻譯框里復制粘貼,或者用近年出現(xiàn)的文檔翻譯——上傳文檔乒裆,下載機翻后的文檔套利,初步解決和機翻和格式問題。但記憶庫術語庫不能復用鹤耍,不能去重肉迫,不能協(xié)作,其實某種程度上還停留在word文檔的翻譯時代稿黄,用來輔助閱讀可以喊衫,作為一款筆譯工具,顯然還遠遠不夠杆怕。
筆譯工具面臨革新
計算機輔助翻譯工具已經(jīng)有30余年的歷史族购,從Trados到目前基于云端的CAT工具壳贪,具備機器翻譯、格式解析還原寝杖、記憶庫術語庫管理违施、多人協(xié)作等功能,但上手門檻高朝墩,版本復雜醉拓,讓非專業(yè)譯者、甚至對技術不夠敏感的專業(yè)譯者望而卻步收苏。此外亿卤,大部分CAT還停留在“模板”時代,套用和匹配記憶庫術語庫鹿霸,譯后編輯的結(jié)果無法反饋給機器排吴,機器下次還犯同樣的錯誤……
特別是編輯器翻譯體驗,丟掉格式和上下文的陌生翻譯環(huán)境懦鼠,某種程度上是時代的局限钻哩,對于大部分時間都停留在編輯器的譯者顯然不夠友好。
從時代的大背景看:依據(jù)摩爾定律肛冶,人類的信息存儲能力每18個月翻一番街氢。在海量的信息中,我們見到的世界睦袖,僅是一個翻譯過的世界珊肃,一個只有母語承載的信息繭房。
隨著信息的爆發(fā)馅笙,世界在拉平伦乔,可以預見,一個多語的董习、更多場景和維度的烈和、變化更快的世界在向我們展開。機器翻譯雖然可以解決速度問題皿淋,但無法解決精準度和人們對所讀到信息的信賴問題招刹。
傳統(tǒng)CAT工具,囿于高專業(yè)門檻窝趣、人機無法互動等局限疯暑,無法走下“專業(yè)工具”的高臺,俯身為更多各行各業(yè)專業(yè)人士賦能高帖,從而也不能解決譯者資源的問題。
因此我們認為畦粮,神經(jīng)網(wǎng)絡機器翻譯時代散址,用戶需要更簡單乖阵、更智能、更普惠的筆譯工具预麸,能將語言和工具的能力賦予譯者瞪浸,特別是那些沒有掌握工具和語言的各行業(yè)專業(yè)人士,進而從根本上解決譯者資源的問題吏祸。
譯者核心能力之變
20年前对蒲,輸入法變得易用,使得人人具有打字的能力贡翘,而不再依賴于少數(shù)以打字為業(yè)的打字員蹈矮,因為人人皆打字員。
20年后鸣驱,基于現(xiàn)在“編程從娃娃抓起”的現(xiàn)狀泛鸟,可以預見人人將具有編程的能力,將自己的更多想法用代碼實現(xiàn)踊东,而不僅僅依賴以編程為業(yè)的開發(fā)者北滥,因為人人皆開發(fā)者。
同樣闸翅,10年后再芋,更多的人士將被賦予語言和工具的能力,在某些信息交換層面坚冀,消化越來越多的翻譯需求济赎,而不僅僅依賴以翻譯為職業(yè)的譯者,因為人人皆譯者遗菠。
當然联喘,我相信打字員(速記員)、譯者辙纬、開發(fā)者作為一種專業(yè)職業(yè)將會長期存在豁遭,但越來越多的碎片化場景和市場需求必將催生更多的供應端資源。
傳統(tǒng)譯者核心能力模型主要由語言能力(中文能力+外語能力)贺拣、工具能力(信息檢索能力蓖谢、翻譯工具應用能力)、專業(yè)知識(所翻譯領域的背景知識積累或快速獲取能力)
構(gòu)成譬涡。隨著機器翻譯和翻譯工具的進一步發(fā)展闪幽,對譯者語言能力和工具要求將進一步降低,而專業(yè)背景知識的重要性日益凸顯涡匀。
這一趨勢演化的結(jié)果盯腌,將產(chǎn)生新的譯者群體——各行業(yè)專業(yè)人士。被賦予語言和工具能力的各行業(yè)專業(yè)人士陨瘩,運用自己背景知識腕够,將在某種程度上级乍、在更多的場景解決快速增長的語言需求。
所見即所得的人機合譯平臺
順應這一趨勢帚湘,2019年11月10日玫荣,我們發(fā)布蘭亭譯——一款所見即所得的人機合譯工具。希望將語言和工具的能力賦予譯者大诸,賦予更多各行業(yè)專業(yè)人士捅厂,實現(xiàn)人人皆譯者的愿景。
蘭亭譯整合了高質(zhì)量的神經(jīng)機器翻譯引擎资柔,部分程度上打破了表格式編輯器的傳統(tǒng)焙贷,實現(xiàn)了全程保留格式的所見即所得的創(chuàng)新。同時結(jié)合公司算法優(yōu)勢建邓,探索
閉環(huán)互反饋盈厘、人機合譯之道。
“蘭亭集序”作為“天下第一行書”官边,代表書法作品沸手、代表中國文化、也代表人文精神注簿。我們希望結(jié)合科技與人文契吉,以讓用戶感到親切的方式,做用戶的朋友诡渴,為用戶創(chuàng)造愉悅的翻譯體驗捐晶。
神經(jīng)網(wǎng)絡機器翻譯時代,我們需要一款什么樣的筆譯工具妄辩?
蘭亭譯就是我們的一點嘗試惑灵。
誠惶誠恐,但充滿動力眼耀。借用一句話:“我們的動力是什么英支?我們試圖用我們僅有的天分去表達我們深層的感受,去表達我們對前人所有貢獻的感激哮伟,去為歷史長河加上一點什么干花。”
我們也用這一點嘗試楞黄,對Trados這樣開創(chuàng)輔助翻譯先河的前輩池凄、對致力于改進各種翻譯工具的同仁、對那些推動了機器翻譯質(zhì)量提升的計算機科學家和工程師鬼廓、對那些為跨越人類溝通障礙而努力的譯者和語言服務從業(yè)者肿仑,表達我們的敬意和感激。
-End-
【往期精選】
2020語言服務展望之一|蒙永業(yè):2020中國語言服務行業(yè)發(fā)展趨勢
2020語言服務展望之二|吳永波:5G元年開啟語言數(shù)字世界新十年
2020語言服務展望之三|王民杰:2020年同聲翻譯市場展望
2020語言服務展望之四|崔啟亮:中國語言服務40年回顧與展望
2020語言服務展望之五|韋忠和:全球語言服務行業(yè)2019回顧
2020語言服務展望之六|韋忠和:全球語言服務行業(yè)2020展望
機器翻譯全球市場觀察|Unbabel獲6000萬美元C輪融資
機器翻譯全球市場觀察|Videolocalize發(fā)布多語配音平臺
機器翻譯全球市場觀察|金融機器翻譯公司Lingua?Custodia
2018機器翻譯“胡說”系列之二|婁東來、黃國平尤慰、魏勇鵬
2018機器翻譯“胡說”系列之一|朱靖波勾邦、崔啟亮、韋忠和