如果機(jī)器能跨越語言障礙,“懵圈”的將不止是翻譯

前段時(shí)間看到一條新聞钙畔,說的是谷歌的機(jī)器翻譯取得了顛覆性的進(jìn)展茫陆,據(jù)說,它的機(jī)器翻譯的準(zhǔn)確度已經(jīng)可以和人工翻譯媲美了擎析,這也意味著人工智能的翻譯和人工翻譯這二者的水平已經(jīng)相當(dāng)接近了簿盅。

可能很多朋友沒有看到這條新聞,也可能一些朋友看到這條新聞的對(duì)它一掠而過揍魂。也許是我個(gè)人的原因桨醋,我對(duì)這條新聞特別的注意,因?yàn)槲宜较聦?duì)此有一個(gè)尺度——機(jī)器翻譯的成熟度现斋,其實(shí)就標(biāo)志著人工智能的成熟度讨盒。

我記得大概是一年以前,我和凱文·凱利——也就是我們通常說的KK步责,在優(yōu)酷做對(duì)話的時(shí)候,我向他問到過這個(gè)問題禀苦。我問:“我們現(xiàn)在的工作當(dāng)中蔓肯,馬上面臨失業(yè)的工作有哪些?”由于當(dāng)時(shí)現(xiàn)場有同聲傳譯的人振乏,他說蔗包,也許做同聲傳譯的人將加入最早失業(yè)的隊(duì)伍里去。

當(dāng)時(shí)我聽了以后非常震驚慧邮。我一直非常敬佩做同聲傳譯的人调限,他們能夠完全不假思索的將一種語言從耳朵里聽進(jìn)去舟陆,再將另一種語言從嘴里說出來。這樣一種技能耻矮,我覺得是一種挑戰(zhàn)人語言能力和智力的工作秦躯,而KK竟然說他們是最早會(huì)失業(yè)的人群。

KK這樣認(rèn)為的理由很簡單裆装。翻譯技能是一種通過不斷地積累踱承、修正、試錯(cuò)哨免,最后逐漸完善的一種工作茎活,而今天的計(jì)算機(jī)已經(jīng)遠(yuǎn)不是單機(jī)計(jì)算的方式,現(xiàn)在的計(jì)算機(jī)是是網(wǎng)絡(luò)計(jì)算的琢唾,大量信息载荔、大量知識(shí)每時(shí)每刻匯入到云端,將每一個(gè)節(jié)點(diǎn)上獲得的認(rèn)知混入到共享的云里采桃。這個(gè)時(shí)候人類的智慧懒熙、人類的知識(shí)、人類的智能就會(huì)形成一種類似于“拔一毛而利天下”的一種功能芍碧。

我們每一個(gè)人的聰明過去都只屬于我們自己煌珊,很少每時(shí)每刻把這種智能混入到一個(gè)人類共有的大腦當(dāng)中。今天借助于云端的計(jì)算泌豆,我們不自覺地將我們每個(gè)人通過學(xué)習(xí)獲得的認(rèn)知都可以混入到人類共有的大腦里定庵。而且匯聚的知識(shí)的數(shù)量龐大,并隨著數(shù)量的數(shù)據(jù)的增大而形成一種知識(shí)的涌現(xiàn)踪危。

當(dāng)單個(gè)節(jié)點(diǎn)的知識(shí)蔬浙、個(gè)體的知識(shí)不斷的匯入到人類共有的大腦的時(shí)候,一方面數(shù)據(jù)每時(shí)每刻都在增加贞远,而且數(shù)據(jù)的增加符合梅特卡夫定律——就是說當(dāng)匯聚的量越大的時(shí)候畴博,那些節(jié)點(diǎn)性的知識(shí)、碎片性的知識(shí)以一種我們不知道的方式化合起來蓝仲,形成一種全新的知識(shí)俱病。

這樣一種形成方式我們把它稱之為“涌現(xiàn)”,就是低智能袱结、低能量的個(gè)體匯聚起來形成一種高智能的亮隙、高能量的超級(jí)有機(jī)體。比如螞蟻垢夹,它是一種低智能的動(dòng)物溢吻,但是很多的螞蟻匯聚到一起,他們會(huì)形成一種遠(yuǎn)超于他們個(gè)體智能的集體智能果元,包括蜜蜂促王、白蟻犀盟、蝙蝠都有這種由于巨量的匯聚而形成的涌現(xiàn)。

所以蝇狼,將來人類知識(shí)的增長阅畴、知識(shí)的進(jìn)化一旦不是由單個(gè)個(gè)體來承擔(dān),而是人類所有個(gè)體都匯聚成一個(gè)整體的時(shí)候题翰,這種知識(shí)的進(jìn)化速度比以前任何物種的進(jìn)化速度都要快得多恶阴。所以他認(rèn)定,將來豹障,在很快時(shí)間內(nèi)——五年之內(nèi)冯事,機(jī)器翻譯就有可能替代人工翻譯。

剛剛說到的這條新聞似乎讓我感受到血公,人工智能對(duì)于人的智能的挑戰(zhàn)已經(jīng)漸漸接近人的腳步聲昵仅。安迪.格魯夫說,很多真正具有挑戰(zhàn)性的東西累魔、壞消息都是踏著貓步而來的摔笤。貓走路是沒有聲音的,除非聽覺極其敏感的人——比如說盲人能聽到貓過來的聲音垦写,我們普通的人是感受不到這種聲音的吕世。

事實(shí)上,在很多產(chǎn)業(yè)里梯投,形成顛覆性創(chuàng)新的那些技術(shù)往往都是在人的眼皮子底下在進(jìn)化命辖,而它的最初形態(tài)看上去是非常簡陋的。比如說數(shù)碼相機(jī)剛剛出來的時(shí)候甚至只有10萬像素分蓖。這個(gè)行業(yè)用了很長的時(shí)間把10萬像素提高到100萬像素——我還真見過100萬像素的數(shù)碼相機(jī)尔艇,大家可以想象100萬像素的數(shù)碼相機(jī)拍出來的清晰度能有多高。

現(xiàn)在么鹤,我能在電腦里找到的像素最低的照片是200萬像素的諾基亞手機(jī)拍出來的终娃。在今天看來,這樣的照片如果不是因?yàn)橛袣v史價(jià)值蒸甜,我真的想馬上把它刪掉棠耕,質(zhì)量非常低。從10萬像素到100萬像素花了很長時(shí)間柠新,從100萬像素到200萬像素還是經(jīng)歷了很慢的進(jìn)程昧辽,200萬像素到300萬像素的速度就漸漸加快。

當(dāng)數(shù)碼相機(jī)到500萬像素的時(shí)候登颓,它已經(jīng)讓人感受到,它不再是一個(gè)玩具了红氯,在某種程度上它是可以派上正當(dāng)用場的框咙。當(dāng)我們意識(shí)到它已經(jīng)開始成熟的時(shí)候咕痛,它飛快的從500萬像素成長到800萬像素,從800萬像素到1000萬喇嘱、1500萬茉贡,現(xiàn)在很多手機(jī)的像素都達(dá)到1700萬,甚至超過2000萬者铜。記得當(dāng)我看到那種1500萬單反相機(jī)拍出的照片的時(shí)候腔丧,我覺得已經(jīng)是到極致了,但是今天我們看來都是稀松平常的作烟。

所以很多行業(yè)愉粤、很多產(chǎn)品,當(dāng)他們剛剛問世的時(shí)候拿撩,都是非常幼稚衣厘、非常簡陋,讓你覺得他就跟玩具一樣压恒,使用這樣的工具如同是兒戲影暴,但是技術(shù)就是在我們不以為然當(dāng)中以一種指數(shù)級(jí)的速度在往前發(fā)展。一旦技術(shù)讓我們刮目相看探赫,讓人們覺得已經(jīng)很成熟甚至近乎完美的時(shí)候型宙,不僅僅表示現(xiàn)有的產(chǎn)品成熟,而且表明它正在以更高的速度往前發(fā)展伦吠。

所以2016年滿世界都在談?wù)撊斯ぶ悄茏倍遥侨斯ぶ悄苤两襁€沒有拿出讓人覺得肅然起敬、讓人刮目相看的產(chǎn)品讨勤,我們很多人對(duì)其聽之任之箭跳,覺得它要真的成氣候是猴年馬月的事情。但是潭千,成熟技術(shù)到來的方式谱姓,和我們有的時(shí)候在一個(gè)車站等車等了半個(gè)小時(shí)車還不來的時(shí)候是非常相似的——我們等得非常疲憊,干脆到別的地方散散步刨晴、溜達(dá)溜達(dá)再回來的時(shí)候屉来,發(fā)現(xiàn)車已經(jīng)早就走了。

為什么谷歌機(jī)器翻譯的成就特別值得注意狈癞?這是因?yàn)樵谌斯ぶ悄茴I(lǐng)域有幾個(gè)層級(jí)茄靠,而機(jī)器翻譯已經(jīng)是在最深的層級(jí)上了。一般來說蝶桶,所謂智能首先在識(shí)別慨绳,識(shí)別各種各樣的信號(hào),最初級(jí)的識(shí)別是語音識(shí)別,所以我們現(xiàn)在很多人已經(jīng)開始在用一些語音輸入的軟件脐雪,有的時(shí)候你覺得還可以用厌小,有的時(shí)候會(huì)讓你失望得無言以對(duì)。

有一次我嘗試用語音輸入來寫一篇文章战秋,后來發(fā)現(xiàn)不行璧亚,校改需要的時(shí)間往往比我從一開始打字需要的時(shí)間還要長,因?yàn)橐屑?xì)的看那些錯(cuò)誤脂信。剛開始我很自然的認(rèn)為是因?yàn)槲业陌l(fā)音不標(biāo)準(zhǔn)導(dǎo)致語音識(shí)別錯(cuò)誤癣蟋,后來我做了一個(gè)實(shí)驗(yàn),我用中央人民廣播電臺(tái)的播音員讀的話對(duì)著手機(jī),結(jié)果還是一大堆錯(cuò)誤,這顯然不僅僅是語音不標(biāo)準(zhǔn)的問題轴或。

比語音識(shí)別更難的是圖像識(shí)別。今年6月份秉撇,我到硅谷的時(shí)候去參觀吳韌博士的新大腦公司。我們進(jìn)去的時(shí)候門口有攝像頭秋泄,進(jìn)去的時(shí)候已經(jīng)被錄像了琐馆,但是那時(shí)候不知道。后來我到了他的辦公室恒序,他的助理問我們要名片瘦麸,然后在電腦里輸入了什么東西,把電腦轉(zhuǎn)過來問:這是您的照片吧歧胁?

我一看滋饲,說:“是『拔。”那是他根據(jù)名字在網(wǎng)上搜到一張差不多是十年前的照片屠缭。然后他照片馬上輸入到庫里,不到一分鐘崭参,他們就在海量的錄像庫里找到我剛才進(jìn)來的那段錄像呵曹,問:“這是您吧?” 我說這是我何暮,這種人臉識(shí)別要比語音識(shí)別難度更大奄喂。

但是更難的是語義識(shí)別。每一種語言識(shí)別都有它的模糊性海洼,它的每一個(gè)詞都有其雙關(guān)性跨新,對(duì)語境的強(qiáng)依賴等等。以漢語為例坏逢,在老舍的《茶館》里不是有那么一段話嗎——有兩個(gè)壞家伙來敲詐王掌柜的時(shí)候有一段很著名的對(duì)話域帐。

“王掌柜的赘被,您那天說的那點(diǎn)意思,什么時(shí)候意思意思俯树?”

“您說的那點(diǎn)意思得多少意思傲备埂?”

“嗨许饿,王掌柜您是明白人,您還能把那點(diǎn)意思搞得沒意思嗎舵盈?”

如果這段話要讓電腦來識(shí)別真是太難了陋率,如果想讓外國人剛學(xué)漢語的時(shí)候說這一段話,會(huì)讓他抓狂秽晚。

再比如野蠻女友對(duì)她的男友說的第一句話——“我現(xiàn)在出發(fā)了瓦糟,你要是到了你就等著「坝”第二句是——“我要是到了你還沒到菩浙,你就等著!”第三句話是——“你要是到了你不等著句伶,你就等著熬Ⅱ摺!”

這三句話要是讓電腦來識(shí)別考余,真的會(huì)抓狂先嬉。要是有一天電腦不僅能明白剛才第一段里的各種每一個(gè)“意思”的意思,明白第二段對(duì)話的每一個(gè)“等著”的真實(shí)含義楚堤,那人工智能真的是到了相當(dāng)成熟的地步疫蔓。

而今天的谷歌翻譯取得的這個(gè)成果還只是階段性的,研究人員讓精通兩門語言的人——比如說讓母語是西班牙語也精通英語的人身冬,讓他來評(píng)判機(jī)器將兩種語言互譯的時(shí)候是否準(zhǔn)確衅胀。與此同時(shí),再找精通兩種語言的人來進(jìn)行翻譯酥筝,最后按對(duì)照的結(jié)果按6分算滚躯,機(jī)器的得分是5.53分,人的得分是5.55分樱哼,得分已經(jīng)是相當(dāng)接近了哀九。

但是大家要注意,人的進(jìn)化速度搅幅、人的智力增長速度是很慢的阅束,甚至在很多時(shí)候是在逐漸退化的。比如說你25歲的時(shí)候腦子很好用茄唐,到30歲的時(shí)候腦子就不一定好用息裸,到40蝇更、50歲就逐漸衰退了。

而電腦由于處于云計(jì)算的時(shí)代呼盆、一個(gè)大數(shù)據(jù)的時(shí)代年扩,我們最聰明的時(shí)刻都會(huì)匯聚到云里去,這個(gè)云相當(dāng)于人類共有的大腦访圃。人的這些聰明已經(jīng)被匯聚到里面厨幻,即使這個(gè)人得了阿茲海默綜合征,但是你的聰明已經(jīng)被匯聚到人類共有的大腦腿时。

關(guān)鍵是這些碎片認(rèn)知以我們所不知道的方式迅速的匯集况脆,就像在物理世界中,水蒸氣蒸發(fā)到空中變成云批糟,一朵朵小云又變成更大的云格了,更大的云和更大的云之間又會(huì)匯聚在一起,這個(gè)過程是非郴斩Γ恐怖的盛末。

換句話說,機(jī)器智力進(jìn)化的速度是遠(yuǎn)遠(yuǎn)超乎人的否淤∏牡可能在幾年后的某一天,機(jī)器翻譯突然就成熟了叹括。原來我們出國算墨,不懂外語是最讓我們自卑,最讓我們畏手畏腳的汁雷,而以后出國時(shí)候的第一焦慮就不存在了净嘀。在這種情況下,人類的文明將會(huì)出現(xiàn)一種什么樣的結(jié)果侠讯,我們今天還不可預(yù)測挖藏。

當(dāng)語言的障礙被超越,甚至機(jī)器將比人的翻譯還要準(zhǔn)確厢漩,不僅能解讀你的語言膜眠,甚至根據(jù)每個(gè)人的性格、語言習(xí)慣溜嗜,過去說話和寫作方式宵膨,像偵探一樣解讀你話里背后的意思,然后以一種你自己都感到心驚膽戰(zhàn)的方式把它解讀出來之后炸宵,讓我們感到“懵圈”的將不僅僅是翻譯們要失業(yè)的問題辟躏,它真的會(huì)帶來我們今天還不能清晰想象的一種文明的巨變,真正稱得上會(huì)是一個(gè)數(shù)字化文藝復(fù)興時(shí)代土全。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末捎琐,一起剝皮案震驚了整個(gè)濱河市会涎,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌瑞凑,老刑警劉巖末秃,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異籽御,居然都是意外死亡练慕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門技掏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來贺待,“玉大人,你說我怎么就攤上這事零截。” “怎么了秃臣?”我有些...
    開封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵涧衙,是天一觀的道長。 經(jīng)常有香客問我奥此,道長弧哎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任稚虎,我火速辦了婚禮撤嫩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蠢终。我一直安慰自己序攘,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開白布寻拂。 她就那樣靜靜地躺著程奠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪祭钉。 梳的紋絲不亂的頭發(fā)上瞄沙,一...
    開封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音慌核,去河邊找鬼距境。 笑死,一個(gè)胖子當(dāng)著我的面吹牛垮卓,可吹牛的內(nèi)容都是我干的垫桂。 我是一名探鬼主播,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼扒接,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼伪货!你這毒婦竟也來了们衙?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤碱呼,失蹤者是張志新(化名)和其女友劉穎蒙挑,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體愚臀,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡忆蚀,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了姑裂。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片馋袜。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖舶斧,靈堂內(nèi)的尸體忽然破棺而出欣鳖,到底是詐尸還是另有隱情,我是刑警寧澤茴厉,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布泽台,位于F島的核電站,受9級(jí)特大地震影響矾缓,放射性物質(zhì)發(fā)生泄漏怀酷。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一嗜闻、第九天 我趴在偏房一處隱蔽的房頂上張望蜕依。 院中可真熱鬧,春花似錦琉雳、人聲如沸样眠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽吹缔。三九已至,卻和暖如春锯茄,著一層夾襖步出監(jiān)牢的瞬間厢塘,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來泰國打工肌幽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留晚碾,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓喂急,卻偏偏與公主長得像格嘁,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子廊移,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容