前段時(shí)間看到一條新聞钙畔,說的是谷歌的機(jī)器翻譯取得了顛覆性的進(jìn)展茫陆,據(jù)說,它的機(jī)器翻譯的準(zhǔn)確度已經(jīng)可以和人工翻譯媲美了擎析,這也意味著人工智能的翻譯和人工翻譯這二者的水平已經(jīng)相當(dāng)接近了簿盅。
可能很多朋友沒有看到這條新聞,也可能一些朋友看到這條新聞的對(duì)它一掠而過揍魂。也許是我個(gè)人的原因桨醋,我對(duì)這條新聞特別的注意,因?yàn)槲宜较聦?duì)此有一個(gè)尺度——機(jī)器翻譯的成熟度现斋,其實(shí)就標(biāo)志著人工智能的成熟度讨盒。
我記得大概是一年以前,我和凱文·凱利——也就是我們通常說的KK步责,在優(yōu)酷做對(duì)話的時(shí)候,我向他問到過這個(gè)問題禀苦。我問:“我們現(xiàn)在的工作當(dāng)中蔓肯,馬上面臨失業(yè)的工作有哪些?”由于當(dāng)時(shí)現(xiàn)場有同聲傳譯的人振乏,他說蔗包,也許做同聲傳譯的人將加入最早失業(yè)的隊(duì)伍里去。
當(dāng)時(shí)我聽了以后非常震驚慧邮。我一直非常敬佩做同聲傳譯的人调限,他們能夠完全不假思索的將一種語言從耳朵里聽進(jìn)去舟陆,再將另一種語言從嘴里說出來。這樣一種技能耻矮,我覺得是一種挑戰(zhàn)人語言能力和智力的工作秦躯,而KK竟然說他們是最早會(huì)失業(yè)的人群。
KK這樣認(rèn)為的理由很簡單裆装。翻譯技能是一種通過不斷地積累踱承、修正、試錯(cuò)哨免,最后逐漸完善的一種工作茎活,而今天的計(jì)算機(jī)已經(jīng)遠(yuǎn)不是單機(jī)計(jì)算的方式,現(xiàn)在的計(jì)算機(jī)是是網(wǎng)絡(luò)計(jì)算的琢唾,大量信息载荔、大量知識(shí)每時(shí)每刻匯入到云端,將每一個(gè)節(jié)點(diǎn)上獲得的認(rèn)知混入到共享的云里采桃。這個(gè)時(shí)候人類的智慧懒熙、人類的知識(shí)、人類的智能就會(huì)形成一種類似于“拔一毛而利天下”的一種功能芍碧。
我們每一個(gè)人的聰明過去都只屬于我們自己煌珊,很少每時(shí)每刻把這種智能混入到一個(gè)人類共有的大腦當(dāng)中。今天借助于云端的計(jì)算泌豆,我們不自覺地將我們每個(gè)人通過學(xué)習(xí)獲得的認(rèn)知都可以混入到人類共有的大腦里定庵。而且匯聚的知識(shí)的數(shù)量龐大,并隨著數(shù)量的數(shù)據(jù)的增大而形成一種知識(shí)的涌現(xiàn)踪危。
當(dāng)單個(gè)節(jié)點(diǎn)的知識(shí)蔬浙、個(gè)體的知識(shí)不斷的匯入到人類共有的大腦的時(shí)候,一方面數(shù)據(jù)每時(shí)每刻都在增加贞远,而且數(shù)據(jù)的增加符合梅特卡夫定律——就是說當(dāng)匯聚的量越大的時(shí)候畴博,那些節(jié)點(diǎn)性的知識(shí)、碎片性的知識(shí)以一種我們不知道的方式化合起來蓝仲,形成一種全新的知識(shí)俱病。
這樣一種形成方式我們把它稱之為“涌現(xiàn)”,就是低智能袱结、低能量的個(gè)體匯聚起來形成一種高智能的亮隙、高能量的超級(jí)有機(jī)體。比如螞蟻垢夹,它是一種低智能的動(dòng)物溢吻,但是很多的螞蟻匯聚到一起,他們會(huì)形成一種遠(yuǎn)超于他們個(gè)體智能的集體智能果元,包括蜜蜂促王、白蟻犀盟、蝙蝠都有這種由于巨量的匯聚而形成的涌現(xiàn)。
所以蝇狼,將來人類知識(shí)的增長阅畴、知識(shí)的進(jìn)化一旦不是由單個(gè)個(gè)體來承擔(dān),而是人類所有個(gè)體都匯聚成一個(gè)整體的時(shí)候题翰,這種知識(shí)的進(jìn)化速度比以前任何物種的進(jìn)化速度都要快得多恶阴。所以他認(rèn)定,將來豹障,在很快時(shí)間內(nèi)——五年之內(nèi)冯事,機(jī)器翻譯就有可能替代人工翻譯。
剛剛說到的這條新聞似乎讓我感受到血公,人工智能對(duì)于人的智能的挑戰(zhàn)已經(jīng)漸漸接近人的腳步聲昵仅。安迪.格魯夫說,很多真正具有挑戰(zhàn)性的東西累魔、壞消息都是踏著貓步而來的摔笤。貓走路是沒有聲音的,除非聽覺極其敏感的人——比如說盲人能聽到貓過來的聲音垦写,我們普通的人是感受不到這種聲音的吕世。
事實(shí)上,在很多產(chǎn)業(yè)里梯投,形成顛覆性創(chuàng)新的那些技術(shù)往往都是在人的眼皮子底下在進(jìn)化命辖,而它的最初形態(tài)看上去是非常簡陋的。比如說數(shù)碼相機(jī)剛剛出來的時(shí)候甚至只有10萬像素分蓖。這個(gè)行業(yè)用了很長的時(shí)間把10萬像素提高到100萬像素——我還真見過100萬像素的數(shù)碼相機(jī)尔艇,大家可以想象100萬像素的數(shù)碼相機(jī)拍出來的清晰度能有多高。
現(xiàn)在么鹤,我能在電腦里找到的像素最低的照片是200萬像素的諾基亞手機(jī)拍出來的终娃。在今天看來,這樣的照片如果不是因?yàn)橛袣v史價(jià)值蒸甜,我真的想馬上把它刪掉棠耕,質(zhì)量非常低。從10萬像素到100萬像素花了很長時(shí)間柠新,從100萬像素到200萬像素還是經(jīng)歷了很慢的進(jìn)程昧辽,200萬像素到300萬像素的速度就漸漸加快。
當(dāng)數(shù)碼相機(jī)到500萬像素的時(shí)候登颓,它已經(jīng)讓人感受到,它不再是一個(gè)玩具了红氯,在某種程度上它是可以派上正當(dāng)用場的框咙。當(dāng)我們意識(shí)到它已經(jīng)開始成熟的時(shí)候咕痛,它飛快的從500萬像素成長到800萬像素,從800萬像素到1000萬喇嘱、1500萬茉贡,現(xiàn)在很多手機(jī)的像素都達(dá)到1700萬,甚至超過2000萬者铜。記得當(dāng)我看到那種1500萬單反相機(jī)拍出的照片的時(shí)候腔丧,我覺得已經(jīng)是到極致了,但是今天我們看來都是稀松平常的作烟。
所以很多行業(yè)愉粤、很多產(chǎn)品,當(dāng)他們剛剛問世的時(shí)候拿撩,都是非常幼稚衣厘、非常簡陋,讓你覺得他就跟玩具一樣压恒,使用這樣的工具如同是兒戲影暴,但是技術(shù)就是在我們不以為然當(dāng)中以一種指數(shù)級(jí)的速度在往前發(fā)展。一旦技術(shù)讓我們刮目相看探赫,讓人們覺得已經(jīng)很成熟甚至近乎完美的時(shí)候型宙,不僅僅表示現(xiàn)有的產(chǎn)品成熟,而且表明它正在以更高的速度往前發(fā)展伦吠。
所以2016年滿世界都在談?wù)撊斯ぶ悄茏倍遥侨斯ぶ悄苤两襁€沒有拿出讓人覺得肅然起敬、讓人刮目相看的產(chǎn)品讨勤,我們很多人對(duì)其聽之任之箭跳,覺得它要真的成氣候是猴年馬月的事情。但是潭千,成熟技術(shù)到來的方式谱姓,和我們有的時(shí)候在一個(gè)車站等車等了半個(gè)小時(shí)車還不來的時(shí)候是非常相似的——我們等得非常疲憊,干脆到別的地方散散步刨晴、溜達(dá)溜達(dá)再回來的時(shí)候屉来,發(fā)現(xiàn)車已經(jīng)早就走了。
為什么谷歌機(jī)器翻譯的成就特別值得注意狈癞?這是因?yàn)樵谌斯ぶ悄茴I(lǐng)域有幾個(gè)層級(jí)茄靠,而機(jī)器翻譯已經(jīng)是在最深的層級(jí)上了。一般來說蝶桶,所謂智能首先在識(shí)別慨绳,識(shí)別各種各樣的信號(hào),最初級(jí)的識(shí)別是語音識(shí)別,所以我們現(xiàn)在很多人已經(jīng)開始在用一些語音輸入的軟件脐雪,有的時(shí)候你覺得還可以用厌小,有的時(shí)候會(huì)讓你失望得無言以對(duì)。
有一次我嘗試用語音輸入來寫一篇文章战秋,后來發(fā)現(xiàn)不行璧亚,校改需要的時(shí)間往往比我從一開始打字需要的時(shí)間還要長,因?yàn)橐屑?xì)的看那些錯(cuò)誤脂信。剛開始我很自然的認(rèn)為是因?yàn)槲业陌l(fā)音不標(biāo)準(zhǔn)導(dǎo)致語音識(shí)別錯(cuò)誤癣蟋,后來我做了一個(gè)實(shí)驗(yàn),我用中央人民廣播電臺(tái)的播音員讀的話對(duì)著手機(jī),結(jié)果還是一大堆錯(cuò)誤,這顯然不僅僅是語音不標(biāo)準(zhǔn)的問題轴或。
比語音識(shí)別更難的是圖像識(shí)別。今年6月份秉撇,我到硅谷的時(shí)候去參觀吳韌博士的新大腦公司。我們進(jìn)去的時(shí)候門口有攝像頭秋泄,進(jìn)去的時(shí)候已經(jīng)被錄像了琐馆,但是那時(shí)候不知道。后來我到了他的辦公室恒序,他的助理問我們要名片瘦麸,然后在電腦里輸入了什么東西,把電腦轉(zhuǎn)過來問:這是您的照片吧歧胁?
我一看滋饲,說:“是『拔。”那是他根據(jù)名字在網(wǎng)上搜到一張差不多是十年前的照片屠缭。然后他照片馬上輸入到庫里,不到一分鐘崭参,他們就在海量的錄像庫里找到我剛才進(jìn)來的那段錄像呵曹,問:“這是您吧?” 我說這是我何暮,這種人臉識(shí)別要比語音識(shí)別難度更大奄喂。
但是更難的是語義識(shí)別。每一種語言識(shí)別都有它的模糊性海洼,它的每一個(gè)詞都有其雙關(guān)性跨新,對(duì)語境的強(qiáng)依賴等等。以漢語為例坏逢,在老舍的《茶館》里不是有那么一段話嗎——有兩個(gè)壞家伙來敲詐王掌柜的時(shí)候有一段很著名的對(duì)話域帐。
“王掌柜的赘被,您那天說的那點(diǎn)意思,什么時(shí)候意思意思俯树?”
“您說的那點(diǎn)意思得多少意思傲备埂?”
“嗨许饿,王掌柜您是明白人,您還能把那點(diǎn)意思搞得沒意思嗎舵盈?”
如果這段話要讓電腦來識(shí)別真是太難了陋率,如果想讓外國人剛學(xué)漢語的時(shí)候說這一段話,會(huì)讓他抓狂秽晚。
再比如野蠻女友對(duì)她的男友說的第一句話——“我現(xiàn)在出發(fā)了瓦糟,你要是到了你就等著「坝”第二句是——“我要是到了你還沒到菩浙,你就等著!”第三句話是——“你要是到了你不等著句伶,你就等著熬Ⅱ摺!”
這三句話要是讓電腦來識(shí)別考余,真的會(huì)抓狂先嬉。要是有一天電腦不僅能明白剛才第一段里的各種每一個(gè)“意思”的意思,明白第二段對(duì)話的每一個(gè)“等著”的真實(shí)含義楚堤,那人工智能真的是到了相當(dāng)成熟的地步疫蔓。
而今天的谷歌翻譯取得的這個(gè)成果還只是階段性的,研究人員讓精通兩門語言的人——比如說讓母語是西班牙語也精通英語的人身冬,讓他來評(píng)判機(jī)器將兩種語言互譯的時(shí)候是否準(zhǔn)確衅胀。與此同時(shí),再找精通兩種語言的人來進(jìn)行翻譯酥筝,最后按對(duì)照的結(jié)果按6分算滚躯,機(jī)器的得分是5.53分,人的得分是5.55分樱哼,得分已經(jīng)是相當(dāng)接近了哀九。
但是大家要注意,人的進(jìn)化速度搅幅、人的智力增長速度是很慢的阅束,甚至在很多時(shí)候是在逐漸退化的。比如說你25歲的時(shí)候腦子很好用茄唐,到30歲的時(shí)候腦子就不一定好用息裸,到40蝇更、50歲就逐漸衰退了。
而電腦由于處于云計(jì)算的時(shí)代呼盆、一個(gè)大數(shù)據(jù)的時(shí)代年扩,我們最聰明的時(shí)刻都會(huì)匯聚到云里去,這個(gè)云相當(dāng)于人類共有的大腦访圃。人的這些聰明已經(jīng)被匯聚到里面厨幻,即使這個(gè)人得了阿茲海默綜合征,但是你的聰明已經(jīng)被匯聚到人類共有的大腦腿时。
關(guān)鍵是這些碎片認(rèn)知以我們所不知道的方式迅速的匯集况脆,就像在物理世界中,水蒸氣蒸發(fā)到空中變成云批糟,一朵朵小云又變成更大的云格了,更大的云和更大的云之間又會(huì)匯聚在一起,這個(gè)過程是非郴斩Γ恐怖的盛末。
換句話說,機(jī)器智力進(jìn)化的速度是遠(yuǎn)遠(yuǎn)超乎人的否淤∏牡可能在幾年后的某一天,機(jī)器翻譯突然就成熟了叹括。原來我們出國算墨,不懂外語是最讓我們自卑,最讓我們畏手畏腳的汁雷,而以后出國時(shí)候的第一焦慮就不存在了净嘀。在這種情況下,人類的文明將會(huì)出現(xiàn)一種什么樣的結(jié)果侠讯,我們今天還不可預(yù)測挖藏。
當(dāng)語言的障礙被超越,甚至機(jī)器將比人的翻譯還要準(zhǔn)確厢漩,不僅能解讀你的語言膜眠,甚至根據(jù)每個(gè)人的性格、語言習(xí)慣溜嗜,過去說話和寫作方式宵膨,像偵探一樣解讀你話里背后的意思,然后以一種你自己都感到心驚膽戰(zhàn)的方式把它解讀出來之后炸宵,讓我們感到“懵圈”的將不僅僅是翻譯們要失業(yè)的問題辟躏,它真的會(huì)帶來我們今天還不能清晰想象的一種文明的巨變,真正稱得上會(huì)是一個(gè)數(shù)字化文藝復(fù)興時(shí)代土全。