人工智能能夠自學(xué)翻譯地球上的任何語言

據(jù)fastcompany報(bào)道当悔,最新出現(xiàn)的兩個(gè)機(jī)器翻譯系統(tǒng)完成了嶄新的突破——可以在無需人類翻譯文本的學(xué)習(xí)資料的情況下版述,自主學(xué)習(xí)翻譯地球上的任何語言粮呢。機(jī)器翻譯發(fā)展驚人千康,但是地球上還是有數(shù)以億計(jì)的人無法享受它的好處——因?yàn)樗麄兊恼Z言在翻譯器的下拉菜單中根本找不到悴务。 現(xiàn)在睹限,兩個(gè)新的人工智能系統(tǒng)——一個(gè)來自西班牙的delPaísVasco大學(xué)(UPV),另一個(gè)來自卡內(nèi)基梅隆大學(xué)(CMU)——承諾會(huì)改變這一切讯檐,為像《星際迷航》(Star Trek)中那樣的真正的宇宙通用譯者(universal translator)的到來打開大門羡疗。

要了解這些新系統(tǒng)的潛力,首先要了解當(dāng)前的機(jī)器翻譯是如何工作的别洪。 目前機(jī)器翻譯的事實(shí)標(biāo)桿是谷歌翻譯叨恨,這個(gè)系統(tǒng)涵蓋了從南非語到祖魯語的103種語言,包括世界上前10種語言——順序?yàn)闈h語挖垛,西班牙語痒钝,英語秉颗,印度語,孟加拉語送矩,葡萄牙語蚕甥,俄語,日語栋荸,德語菇怀, 和爪哇語。 Google的系統(tǒng)使用人類監(jiān)督的神經(jīng)網(wǎng)絡(luò)晌块,比較平行文本——以前由人類翻譯過的書籍和文章爱沟。 通過比較這些平行文本中的大量數(shù)據(jù),Google翻譯可以學(xué)習(xí)任意兩種指定語言之間的對等關(guān)系匆背,從而獲得在它們之間快速轉(zhuǎn)換的能力钥顽。有時(shí)候翻譯結(jié)果會(huì)很有趣,可能并不能真正反映原文的意思靠汁,但總的來說,這些翻譯是功能性的闽铐,隨著時(shí)間的推移蝶怔,他們會(huì)越來越好。

Google的做法很好兄墅,而且很有效踢星。但不幸的是,它并不是全球通用隙咸。這是因?yàn)橛斜O(jiān)督的培訓(xùn)需要很長的時(shí)間以及很多監(jiān)督人員——因?yàn)樘嗔算逶茫雀枋褂昧吮姲惨驗(yàn)椴⒎鞘澜缢姓Z言之間都有足夠多的并行翻譯文本。想想看:根據(jù)世界語言民族學(xué)目錄五督,地球上有6,909種生活語言藏否。其中414種的使用人數(shù)占人類總數(shù)的94%。由于Google翻譯涵蓋了103個(gè)充包,因此會(huì)留下6,806種語言沒有機(jī)器翻譯——其中有311種語言的使用人數(shù)超過百萬副签。總的來說基矮,至少有八億人不能享受機(jī)器自動(dòng)翻譯的好處淆储。

這兩個(gè)新的系統(tǒng)——可以在任何語言之間翻譯單詞和句子——無需通過比較大量由人類翻譯的平行文本來學(xué)習(xí)。他們也不需要監(jiān)督家浇。相反本砰,他們使用未監(jiān)督的機(jī)器學(xué)習(xí),并比較不同語言的隨機(jī)文本钢悲。這是如何運(yùn)作的?由于語言的詞語分類是相似的点额,所以系統(tǒng)猜測這些詞是否相等舔株,用這些信息構(gòu)建翻譯詞典。他們從中找出句子結(jié)構(gòu)咖楣,通過在不同的語言之間來回翻譯來評估他們猜測的結(jié)果督笆。

正如UPV的研究員Mikel Artetxe所描述的那樣:“想象一下,你給了一個(gè)人很多的中文書籍和阿拉伯語書籍——這些書都不重疊——然后這個(gè)人必須學(xué)會(huì)把中文翻譯成阿拉伯語诱贿。 這似乎是不可能的娃肿,對吧?“事實(shí)上,這看起來實(shí)在太不可能了珠十,以至于微軟人工智能專家Di He(這兩個(gè)研究項(xiàng)目的啟發(fā)者)告訴科學(xué)界料扰,他得知”即使沒有人工監(jiān)控,電腦也可以學(xué)習(xí)翻譯”的時(shí)候焙蹭,整個(gè)人都震驚了晒杈。

一個(gè)警告就是,這個(gè)系統(tǒng)并不像目前的平行文本深度學(xué)習(xí)系統(tǒng)那么精確——但是正如Di He指出的那樣孔厉,電腦能夠在沒有任何人類指導(dǎo)的情況下猜測所有這些事實(shí)拯钻,這一事實(shí)本身簡直不可思議。 我們只是接觸到了這種新的學(xué)習(xí)方法的表面撰豺》喟悖看起來,可能很快就有一個(gè)真正的通用翻譯污桦,讓我們能夠與任何人用對方的母語交談了亩歹,這不再僅僅是科幻的東西。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末凡橱,一起剝皮案震驚了整個(gè)濱河市小作,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌稼钩,老刑警劉巖顾稀,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異变抽,居然都是意外死亡础拨,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門绍载,熙熙樓的掌柜王于貴愁眉苦臉地迎上來诡宗,“玉大人,你說我怎么就攤上這事击儡∷郑” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵阳谍,是天一觀的道長蛀柴。 經(jīng)常有香客問我螃概,道長,這世上最難降的妖魔是什么鸽疾? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任吊洼,我火速辦了婚禮,結(jié)果婚禮上制肮,老公的妹妹穿的比我還像新娘冒窍。我一直安慰自己,他們只是感情好豺鼻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布综液。 她就那樣靜靜地躺著,像睡著了一般儒飒。 火紅的嫁衣襯著肌膚如雪谬莹。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天桩了,我揣著相機(jī)與錄音附帽,去河邊找鬼。 笑死井誉,一個(gè)胖子當(dāng)著我的面吹牛士葫,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播送悔,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼爪模!你這毒婦竟也來了欠啤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤屋灌,失蹤者是張志新(化名)和其女友劉穎洁段,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體共郭,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡祠丝,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了除嘹。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片写半。...
    茶點(diǎn)故事閱讀 39,688評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖尉咕,靈堂內(nèi)的尸體忽然破棺而出叠蝇,到底是詐尸還是另有隱情,我是刑警寧澤年缎,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布悔捶,位于F島的核電站铃慷,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蜕该。R本人自食惡果不足惜犁柜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望堂淡。 院中可真熱鬧馋缅,春花似錦、人聲如沸淤齐。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽更啄。三九已至稚疹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間祭务,已是汗流浹背内狗。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留义锥,地道東北人柳沙。 一個(gè)月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像拌倍,于是被迫代替她去往敵國和親赂鲤。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容