—摘要—
人工智能是計算機出現(xiàn)之后發(fā)明的朽色,用機器來模仿人類學(xué)習(xí)和其他智能的技術(shù)酱酬。
是否會出現(xiàn)超越人類的機器生命是頗具爭議的話題,混沌的數(shù)字世界需要我們攜手同行仆救。
相比數(shù)據(jù)抒和,機器智能的發(fā)展歷史遠(yuǎn)沒有那么悠久。雖然人類歷史上有過關(guān)于智能生命的諸多神話和幻想彤蔽,比如古希臘火神赫菲斯托斯用黃金鍛造的機器人少女摧莽,文藝復(fù)興時期的煉金術(shù)士通過注入意識制作的人工生命何蒙庫魯茲,以及19世紀(jì)幻想小說中會思考的機器人等等顿痪。但真正進入科學(xué)家嚴(yán)肅研究視野的機器智能始于20世紀(jì)40年代基于抽象數(shù)學(xué)推理的可編程數(shù)字計算機的發(fā)明镊辕。
由于分析和理解常常容易產(chǎn)生誤差油够,人類發(fā)明了數(shù)學(xué)這一相對精確的工具。在描述了一些基礎(chǔ)問題后征懈,歷史上許多偉大的數(shù)學(xué)和哲學(xué)學(xué)者開始試圖將一切人類思考過程都簡化為數(shù)學(xué)表達(dá)石咬。霍布斯就在其著作《利維坦》中談到:“推理就是計算“卖哎,羅素和其老師懷特海共同撰寫的《數(shù)學(xué)原理》則想要證明整個純粹數(shù)學(xué)是從邏輯的前提推導(dǎo)出來的鬼悠,并嘗試只使用邏輯概念定義數(shù)學(xué)概念。
然而羅素等人的理論在很多情況下只能是設(shè)想亏娜,因為那時的我們還遠(yuǎn)遠(yuǎn)沒有掌握海量的數(shù)據(jù)資源焕窝,也就無法真正將數(shù)理邏輯全部付諸現(xiàn)實領(lǐng)域。計算機的發(fā)明深刻地改變了這一狀況维贺,通過快速迭代的計算能力它掂,它在短短幾十年間不斷地突破著人類對于數(shù)據(jù)邊界的想象。著名的邱奇-圖靈論題就曾指出:一臺僅能處理0和1這樣簡單二元符號的機器(計算機)能夠模擬任意數(shù)學(xué)推理過程——既然計算機有一天可能“推理萬物”溯泣,這就大大激發(fā)了人類探討機器思考的興趣虐秋。
—?人工智能 深度學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò)?—
后來我們將這種計算機能夠模仿人類思考的技術(shù)稱之為人工智能(Artificial Intelligence,簡稱AI)发乔,該詞源自1956年的達(dá)特茅斯會議熟妓。在這次會議中雪猪,一群計算機和信息科學(xué)專家花了兩個月的時間討論“用機器來模仿人類學(xué)習(xí)以及其他方面的智能”的問題栏尚。雖然最后大家并沒有達(dá)成普遍的共識,但是卻為會議討論的內(nèi)容起了一個名字:人工智能只恨。這標(biāo)志著人類更為清晰地認(rèn)識到計算機可能發(fā)揮的巨大價值译仗,并希望借此發(fā)明一套能夠幫助我們解決數(shù)理邏輯的應(yīng)用和提升人類自身智慧的方法,1956年也被普遍認(rèn)為是人工智能的元年官觅。
在這之后的50至60年代中期纵菌,AI迎來了第一波高潮。這個階段的AI在多個領(lǐng)域都取得了突破性的成績休涤。這其中包括獨立證明羅素《數(shù)學(xué)原理》中的若干條定理咱圆,以及擊敗跳棋的美國州冠軍等,我們驚呼不久就會產(chǎn)生超越人類智慧的計算機器功氨。但很快序苏,研究者發(fā)現(xiàn)自己對未來的估計過于樂觀,由于計算機性能的瓶頸捷凄、計算復(fù)雜性指數(shù)級增長以及數(shù)據(jù)量缺失等原因忱详,在完成一些初級問題的回答之后,AI在語音識別跺涤、機器翻譯等領(lǐng)域遲遲不能突破匈睁,行業(yè)很快陷入低谷监透。
1980年代,一類名為“專家系統(tǒng)“的AI開始為全世界的公司所采納航唆,它的優(yōu)勢在于能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則回答解決某一特定領(lǐng)域的問題胀蛮。由于設(shè)計簡單、容易編程且能夠規(guī)避不少常識錯誤糯钙,專家系統(tǒng)在醫(yī)學(xué)診斷醇滥、氣象預(yù)測、工程物理等多個領(lǐng)域發(fā)揮了作用超营。
如果說最初的AI是人類在剛剛獲得新工具的時候自信滿滿地全面進擊的話鸳玩,專家系統(tǒng)則是我們暫時與遠(yuǎn)大情懷作別,退回到一步步去解決具體問題的實踐之中演闭。但這一次的“腳踏實地”也沒能持續(xù)多長不跟,在經(jīng)歷了幾次耀眼的亮相之后,專家系統(tǒng)很快就由于維護費用高昂米碰,且實用性僅針對某些特定場景逐漸式微窝革。進入到90年代初,不僅僅是專家系統(tǒng)吕座,整個AI行業(yè)都因無法找到合適的發(fā)展路徑而徹底停滯不前虐译。
這個時候的很多人已經(jīng)對所謂智能不再抱希望,整個技術(shù)界都不看好AI的未來吴趴,許多頂尖的計算機科學(xué)家也紛紛離開了這個行業(yè)漆诽。到了90年代中期,很多研究團隊甚至已經(jīng)拿不到任何的資助锣枝。但即使面臨這樣的窘境厢拭,以后來被稱為“深度學(xué)習(xí)之父”的辛頓教授為代表的一群資深研究人員仍舊沒有放棄。在獲得了加拿大高級研究所的贊助之后撇叁,辛頓團隊遷往了多倫多供鸠,與他同期的理查德·薩頓和約書亞·本西奧同樣也在加拿大政府的支持下,以堅韌的精神繼續(xù)著自己的研究陨闹。
我們常常說的對于一項新事物楞捂,人類很容易在短期內(nèi)高估,而在長期低估其價值——這句話用在AI身上再合適不過了趋厉。上帝為人類打開了一扇門寨闹,只不過他擔(dān)心擠進去的人太多,而且不夠虔誠觅廓,所以總是會頗費心機的為我們設(shè)置重重障礙鼻忠。很多時候,疑惑的產(chǎn)生不過是我們沒有投入足夠的思考和耐心,找出混沌中左右事情發(fā)展的關(guān)鍵矛盾而已帖蔓。好在總有一些像辛頓這樣的杰出人物矮瘟,能夠不為外界一時的看法所動,始終專注地堅持著自己的理想塑娇,并靜靜等待觸發(fā)它轉(zhuǎn)變的臨界點澈侠。
對于AI來說,這個臨界點就是數(shù)據(jù)埋酬。沒錯哨啃,就是一開始我們早就習(xí)以為常的數(shù)據(jù)。我們在之前大數(shù)據(jù)的文章中也已經(jīng)提到写妥,數(shù)據(jù)量在達(dá)到一定的規(guī)模之后拳球,就可以發(fā)揮與以往完全不同的巨大影響力。就在AI研究者們?nèi)松凶顬榛野档臅r刻珍特,對行業(yè)未來走向起到至關(guān)重要作用的互聯(lián)網(wǎng)技術(shù)逐漸在商業(yè)領(lǐng)域走紅祝峻。伴隨著互聯(lián)網(wǎng)的興起,數(shù)據(jù)維度和數(shù)量急速增加扎筒,我們在前面文章中談到的始于70年代的數(shù)據(jù)統(tǒng)計驅(qū)動的方法開始發(fā)揮價值莱找。通過引入這一方法,AI開始進入又一輪發(fā)展高潮嗜桌。
尤其是2006年以來奥溺,由辛頓等人主導(dǎo)的深度學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)的研究方法開始大放異彩骨宠,將AI從實驗室和小規(guī)模場景真正推向了應(yīng)用化浮定、商業(yè)化的前臺。今天我們一談到AI诱篷,很多問題都會和它們相關(guān)壶唤,比如人工神經(jīng)網(wǎng)絡(luò)聽上去很神秘雳灵,意思是AI在模仿人腦的神經(jīng)系統(tǒng)嗎棕所?深度學(xué)習(xí)是說計算機可以像人類一樣學(xué)習(xí)和掌握復(fù)雜深入的知識?在這個基礎(chǔ)上悯辙,未來會不會有能夠替代人類的智能出現(xiàn)琳省?諸如此類等等。
對于上面每個問題的回答都不簡單躲撰。AI本身就包含各種復(fù)雜的數(shù)學(xué)和計算模型针贬,加上媒體五花八門的報道,常常會把很多非專業(yè)人士弄得一頭霧水拢蛋。我們大可不用理會這些晦澀的概念桦他,僅僅稍微了解一下AI的發(fā)展軌跡儒将,就可以獲知以上問題的基本答案椅您。
AI主流技術(shù)的發(fā)展經(jīng)歷過三個階段。第一個階段大致對應(yīng)我們前面所說的達(dá)特茅斯會議之后的早期通用人工智能時期。我們認(rèn)為只要機器被賦予邏輯推理能力就可以實現(xiàn)智能踊东,因而傾向于利用AI解決所有的問題。第二個階段開始巧骚,不同的學(xué)術(shù)派別吭产、研究方法此起彼伏,我們上面談到的專家系統(tǒng)大多采用的就是這其中一支叫做“符號學(xué)派”的方法脉幢。與第一階段不同歪沃,這個時候最有影響力的觀點是需要將人類知識總結(jié)起來灌輸給AI。
第三個階段一直持續(xù)到今天嫌松,在擁有了更多數(shù)據(jù)之后沪曙,這個階段的主要方法是將計算機需要學(xué)習(xí)的數(shù)據(jù)丟進一個復(fù)雜的、包含多個層級的數(shù)據(jù)處理網(wǎng)絡(luò)萎羔,也就是我們經(jīng)常聽說的人工神經(jīng)網(wǎng)絡(luò)(其實只是借用了生物學(xué)名詞做了形象的比喻而已珊蟀,和人腦沒有半點關(guān)系),然后不斷調(diào)整結(jié)果數(shù)據(jù)直至得到滿意的目標(biāo)模型外驱。這個分析過程非常像人類學(xué)習(xí)新知識育灸,于是科學(xué)界給它起了一個名字叫做“深度學(xué)習(xí)“。AlphaGo戰(zhàn)勝李世石主要采用的就是這種方法昵宇,通過在單個圍棋領(lǐng)域不斷地對機器進行數(shù)據(jù)“訓(xùn)練”磅崭,AlphaGo在這個代表人類最高智慧的游戲上所具備的“聰明”程度已經(jīng)超過了我們。
—?算法算力?AlphoGo?數(shù)字編碼?—
關(guān)于未來會不會有替代人類智能的機器出現(xiàn)瓦哎,這是一個老生常談砸喻,且一直存在爭議的話題。但至少目前可以比較肯定的是蒋譬,我們現(xiàn)在還處在弱人工智能的時代割岛,只能依賴AI解決一些局部的問題。雖然AI已經(jīng)在圍棋中獲勝犯助,但這并不代表它能夠在各個方面都超過人類——從某種角度來說癣漆,那只不過是通過給機器“喂”數(shù)據(jù)得到的暴力破解結(jié)果而已。
判斷AI是否超過人類的更為核心的標(biāo)準(zhǔn)在于其是否能夠具備跨領(lǐng)域推理剂买、抽象和嘗試的能力惠爽。考慮到目前的AI在這些方面還相當(dāng)稚嫩——比如懂得下圍棋的程序并不能欣賞棋局中的博弈之美瞬哼,也不能將之抽象出來用于商業(yè)決策婚肆,人類距離開發(fā)真正能夠達(dá)到甚至超越自身智慧的物種還有相當(dāng)長的路要走。
但無論如何坐慰,我們已經(jīng)切身體會到AI帶給我們的便利较性。借助對大數(shù)據(jù)的使用,世界被亞馬遜、騰訊們的算法圍繞著赞咙。它們精心計算著人類社會發(fā)生的一點一滴永毅,并且小心翼翼地進入到我們的生活。AI會根據(jù)你過往的消費記錄人弓,智能的計算出你的消費傾向沼死,并據(jù)此推送旅游折扣券或者促銷信息給到你,你甚至?xí)@奇地發(fā)現(xiàn)它能夠預(yù)測到你下個月國外旅行的計劃崔赌;AI還可以幫助我們翻譯論文意蛀、查找資料,以及在不久的將來為所有人駕駛汽車健芭。人類開始有能力把自己從日诚卦浚瑣事中解放出來,從事一些更加高級的工作慈迈,并擁有更多時間去娛樂和享受生活若贮。
在這個智能的世界,一切將會變得更加高效痒留。AI會幫我們尋找復(fù)雜問題的解決方案谴麦,從而省去許多無謂的奔波;AI將會朝著越來越接近人類智慧的方向發(fā)展伸头,直到有一天帶給我們目前無法想象的繁榮……說到這里匾效,我們似乎找到了之前文章中提出的問題的答案,腦海中再一次涌現(xiàn)出完美世界的圖景恤磷。我們知道AI是在大數(shù)據(jù)基礎(chǔ)上建構(gòu)的一整套算法模型面哼,既然如此,我們是不是可以把這個理想的世界簡單表述為下面的公式:
理想模型=(萬物數(shù)據(jù)化+相對精確+相關(guān)性)+算法
似乎還缺點什么扫步?對了魔策,我們還需要很多很多這樣的機器,開足馬力去計算所有復(fù)雜的數(shù)學(xué)方程河胎,也就是被全部數(shù)據(jù)化了的世界闯袒,然后只需給到人類一個簡潔優(yōu)美的答案。按照嚴(yán)謹(jǐn)?shù)挠嬎銠C語言仿粹,能夠支撐這個世界高速運轉(zhuǎn)的機器的能力被統(tǒng)稱為“算力”搁吓。我們再將前三項合并為“理想數(shù)據(jù)模型“,這樣公式就可以被寫作:
理想模型=理想數(shù)據(jù)模型+算法+算力
因為算法和算力作用的發(fā)揮非常依賴大數(shù)據(jù)的搜集和發(fā)展吭历,因而我們暫時沒有在公式中給它們加上任何限定的詞匯。在算法方面擂橘,目前的AI實際上是以大數(shù)據(jù)的相對精確晌区、相關(guān)性為底層,比如AlphaGo和它之后的改進版本主要都是通過不斷豐富數(shù)據(jù)實現(xiàn)迭代升級的,雖然模型本身也會調(diào)校朗若,但相比早先的算法改進并不大恼五。而且AlphaGO在下棋的時候,算法也不會告訴它為什么要下這一步哭懈,只是程序的計算結(jié)果說明這樣走更合理而已灾馒。
從算力角度,AI也在不斷地提升遣总,以匹配持續(xù)增加的數(shù)據(jù)計算量睬罗。AlphaGo的計算能力已經(jīng)是1997年戰(zhàn)勝當(dāng)時國際象棋世界冠軍的IBM計算機“深藍(lán)”的3萬倍。而即使是二十多年前的深藍(lán)旭斥,每秒鐘的計算就已經(jīng)達(dá)到兩億步容达,并且輸入了一百多年來優(yōu)秀棋手的兩百多萬盤對局。
正如有一天隨著大數(shù)據(jù)“大“到一定程度之后垂券,相對精確和相關(guān)性可能會顯得不再必要花盐,我們現(xiàn)在對于算法和算力的理解也可能隨著技術(shù)的進步而產(chǎn)生改變。在未來的某個時候菇爪,人類可能會掌握更精確的算法模型算芯,即使在小數(shù)據(jù)的場景中也能夠解決問題;在這種情況下凳宙,算力也就不會無限地增長下去也祠,而是在達(dá)到新的臨界點后開始下降。這樣計算資源是否就能被極大地節(jié)省下來近速?我們又會將這些剩余的資源投入什么新的領(lǐng)域呢诈嘿?是用于人類大腦和基因的改造?還是去探索無盡的宇宙削葱?
我們暫時還無法完整地回答這些問題奖亚,
但是我們可以從智能的發(fā)展歷史中找到一些脈絡(luò)。 以語義理解為例析砸, 我們的故事仍舊從熟悉的混沌-矛盾-演化模型開始昔字。
我們的祖先在五千多年前發(fā)明了最早的文字, 而后又經(jīng)過漫長的歷史演變首繁, 逐漸形成了較為完善的語言表達(dá)和語法的規(guī)則作郭。
人類主要就是通過學(xué)習(xí)語言、文字來了解新知識的弦疮。后來我們知道數(shù)字從中分離出來夹攒,并且在之后的幾千年與文字越走越遠(yuǎn)。但二者之間并不是毫無聯(lián)系的胁塞,由于數(shù)字具有一些文字不具備的屬性咏尝,比如更有利于確保信息傳遞的無誤压语,早在公元前4世紀(jì),我們就已經(jīng)開始嘗試將一些語言和文字轉(zhuǎn)化為數(shù)字進行表達(dá)编检。例如當(dāng)時猶太人為了避免圣經(jīng)在抄寫中的錯誤胎食,會將每一個希伯來字母對應(yīng)成一個數(shù)字,這樣每行文字加起來便得到一個特定的數(shù)字允懂,以此作為這一行的校驗碼厕怜。
進入到20世紀(jì),人類又將大量文字轉(zhuǎn)換成數(shù)字編碼寫入計算機蕾总,并通過智能的模型對其進行理解和推演粥航。AI最基本的應(yīng)用場景就是讓機器模仿人類去理解這些文字和它背后所表達(dá)的語義,也就是我們常常聽到的自然語言理解谤专。
語義理解的歷史由來已久躁锡,中國漢代許慎的著作《說文解字》,就是對漢字字形置侍、來源及詞意的解析映之;北魏酈道元編寫的《水經(jīng)注》,也是對先人地理古籍《水經(jīng)》進行框架上的陳述和表意上的解釋擴展蜡坊。
除了對文字和語句進行解析之外杠输,廣義的自然語言理解還包括機器翻譯,以及語音識別和知識理解等等秕衙。制作于公元前196年的古埃及羅塞塔石碑蠢甲,用希臘、古埃及和當(dāng)時的通俗體文字記載了國王托勒密五世登基的詔書据忘,從1798年被人發(fā)現(xiàn)到1822年法國語言學(xué)家商博良對其破解翻譯鹦牛,前后花費了整整21年的時間。雖然在AI出現(xiàn)之后的翻譯方法并沒有比19世紀(jì)先進多少勇吊,但因為有了數(shù)據(jù)和計算模型曼追,現(xiàn)在我們翻譯石碑所需要花費的時間會遠(yuǎn)遠(yuǎn)少于當(dāng)時。
時至今日汉规,對于絕大多數(shù)不是特別復(fù)雜的論文礼殊、外文資料等,我們都能夠借助機器進行理解和翻譯针史。我們通過發(fā)明語音識別的程序晶伦,將國際會議演講者的內(nèi)容實時轉(zhuǎn)換成多國語言;我們還可以借助余弦定理啄枕、貝葉斯網(wǎng)絡(luò)等數(shù)學(xué)模型對文獻(xiàn)資料進行分類婚陪,并從中抽取概念和分析主題。伴隨著AI的發(fā)展射亏,我們正在掙脫巴別塔的束縛近忙,讓思想和靈魂彼此碰撞竭业。
—?自然語言理解 隱馬爾可夫模型 同行?—
然而事情的發(fā)展并不是一開始就如此順利智润,人類在通過計算機進行自然語言理解的道路上經(jīng)歷了不少矛盾和曲折及舍。作為AI早期犯下的一系列錯誤的重要組成部分,最初我們在自然語言理解領(lǐng)域采用的方式也是把人類的經(jīng)驗傳授給機器窟绷。這些知識主要來自于數(shù)世紀(jì)以來已經(jīng)比較成熟的語言學(xué)的語法規(guī)則锯玛、語義分析等。但很快弊端就開始顯現(xiàn)兼蜈,首先是文法規(guī)則浩如煙海攘残,即使用計算機覆蓋哪怕20%-30%的真實語句,規(guī)則數(shù)量就已經(jīng)多到語言學(xué)家來不及寫的程度为狸,并且隨著覆蓋度的增加歼郭,還要用新的文法規(guī)則解釋當(dāng)中產(chǎn)生前后矛盾的語句。
其次是文法在文章中體現(xiàn)出的上下文相關(guān)特性辐棒,用程序語言很難進行解析病曾。計算機更加善于解碼上下文無關(guān)的文法,舉例來說漾根,我們都知道中文博大精深泰涂,“方便”一詞在不同的上下文語境中涵義大不相同。比如以下三個句子:
1. 我今天下午去你家找你辐怕,不知道你方便不方便——表示有機會逼蒙、有時間;
2. 我晚餐有些吃多了寄疏,現(xiàn)在想去方便一下——表示排泄是牢、大小便;
3. 我和張總是老同學(xué)了陕截,希望在這次合作上貴公司能夠給予方便——提供便利驳棱、幫助。
理解這些意思需要較好的生活常識艘策,而基于規(guī)則方法組織起來的AI往往對此處理效果不佳蹈胡,這也就是我們之前談到的現(xiàn)在的AI還難以和人類擁有同等智慧的情形。
但人類會就此變得束手無策了嗎朋蔫?答案是否定的罚渐。我們發(fā)現(xiàn)有些事情并不是沒有合適的解決方案,需要的僅僅是一些看問題的角度轉(zhuǎn)換而已驯妄。既然問題出現(xiàn)在人類在語言學(xué)上積累的規(guī)則和經(jīng)驗難以有效轉(zhuǎn)移荷并,那么不妨讓我們換一個角度。1970年以后青扔,IBM華生實驗室的賈里尼克教授就拋棄了我們一直以來對于語言規(guī)則的執(zhí)著源织,轉(zhuǎn)而采用統(tǒng)計學(xué)的方法處理AI遇到的問題翩伪,最早的嘗試來自于當(dāng)中的語音識別領(lǐng)域。
語音識別的本質(zhì)就是機器將說話者表達(dá)的語音轉(zhuǎn)化成文字的過程谈息。比如我們現(xiàn)在對著Siri(蘋果手機的語音識別程序)說話缘屹,IOS系統(tǒng)就可以將用戶希望了解的天氣、出行等各項信息推送出來侠仇。在這里說話者的一系列語音首先被手機記錄下來轻姿,我們用o1,o2,o3…(觀測信號)來表示。接收到這些信號后逻炊,AI將推測出這些信息的本來樣子是s1,s2,s3…(信號源信息)互亮。接下來AI會根據(jù)推測結(jié)果向系統(tǒng)發(fā)出相應(yīng)的調(diào)取指令,最后余素,
收到這些指令的系統(tǒng)將會回復(fù)給用戶“今日天氣晴朗”豹休,“建議改換路線躲避擁堵”等信息。
在應(yīng)用統(tǒng)計方法之前桨吊,計算機要識別出復(fù)雜的人類語音需要學(xué)習(xí)大量的語法規(guī)則威根,而轉(zhuǎn)變的核心就是將這個學(xué)習(xí)過程簡化為概率統(tǒng)計模型。上面的例子中屏积,問題變成了從所有的源信息中找到最可能產(chǎn)生出觀測信號的那一個信息医窿。也就是在已知o1,o2,o3…的情況下,求令條件概率:
P(s1,s2,s3,...|o1,o2,o3,...)達(dá)到最大值的那個信息串s1,s2,s3…炊林,即
這個公式比較復(fù)雜姥卢,但可以用隱馬爾可夫模型來估計,語音識別也成為隱馬爾可夫模型最早成功應(yīng)用的場景渣聚。隱馬爾可夫模型是指這樣一種情況独榴,其輸入狀態(tài)是不直接可見的,但輸出依賴于該狀態(tài)下奕枝,是可見的棺榔,每個狀態(tài)通過可能的輸出記號有了可能的概率分布。
對應(yīng)到上述案例中隘道,也就是運用該模型症歇,在給定已知參數(shù)的條件下,用概率的方法求出公式中不可見(隱含)的信號源信息谭梗。賈里尼克領(lǐng)導(dǎo)的實驗室在當(dāng)時提出用隱含馬爾可夫模型來識別語音忘晤,使得錯誤率相比之前降低了2/3。接下來激捏,這一模型還被陸續(xù)地用于基因測序设塔、股票預(yù)測和投資等多個行業(yè)。對此吳軍老師的《數(shù)學(xué)之美》有非常詳細(xì)地闡述远舅,這里我們不做具體地展開闰蛔。
除了語音識別痕钢,在機器翻譯等其他自然語言理解的行業(yè)原理也類似。我們可以把翻譯問題簡單理解為AI很難像人類一樣去推測文字背后所要表達(dá)的上下文邏輯序六,但是之所以能夠給出較為正確的識別結(jié)果任连,在于它用概率的方法去判斷代表不同意思的詞匯出現(xiàn)在該語句中的概率。
比如“pen“在英語中的意思既可以譯為“筆“难咕,也可以是”圍欄“课梳,但是當(dāng)句子中有“bag”(書包)一詞的話距辆,pen是筆的意思的概率將遠(yuǎn)遠(yuǎn)超過圍欄余佃,這時候機器給出的翻譯結(jié)果就會是筆。通過這種方法的運用跨算,計算機甚至完全不知道說話者要表達(dá)的是什么意思爆土,僅僅通過進行概率計算就可以做出相對準(zhǔn)確的識別。事實上诸蚕,AlphaGO下棋的核心也是采用了概率統(tǒng)計模型步势,每一步?jīng)Q策的背后都是概率上贏面最大的考量。
然而通過統(tǒng)計模型解決自然語言理解問題的方法并沒有在賈里尼克之后就被所有人接受背犯,研究者們分裂成了規(guī)則學(xué)派和統(tǒng)計學(xué)派兩大陣營坏瘩。到了90年代初期,矛盾雙方仍是唇槍舌劍不斷漠魏,互不認(rèn)同彼此的方法倔矾。之所以出現(xiàn)這種情況是因為規(guī)則學(xué)派的人認(rèn)為統(tǒng)計方法只能處理淺層的自然語言理解的問題,深層次的研究則仍需借助規(guī)則經(jīng)驗的使用柱锹。直到2005年哪自,隨著數(shù)據(jù)的不斷完備,Google基于統(tǒng)計方法開發(fā)的翻譯系統(tǒng)全面超過基于規(guī)則建構(gòu)的SysTran禁熏,自然語言的處理才完全演化成采用概率統(tǒng)計的方式壤巷,規(guī)則學(xué)派終于徹底退出歷史舞臺。
我們早就聽說了不少關(guān)于堅持和放棄的故事瞧毙,比如20世紀(jì)美國在技術(shù)上大幅領(lǐng)先的調(diào)頻無線電技術(shù)花了整整半個世紀(jì)才徹底戰(zhàn)勝調(diào)幅技術(shù)胧华。我們也認(rèn)為自己已經(jīng)汲取了不少這方面的教訓(xùn)。什么時候放棄宙彪?何時又應(yīng)該堅持矩动?事情在時時處處考驗著人類的智慧。然而問題在于身處其中的人們經(jīng)常不愿意理性辯證地思考您访,卻總是固執(zhí)地覺得自己不會是錯誤的一方铅忿。
在圖像和藝術(shù)繪畫方面,逐步演進的AI也開始發(fā)揮威力灵汪。目前AI在人臉圖像識別領(lǐng)域的精度已經(jīng)達(dá)到了99.83%檀训,這已經(jīng)超過了人眼的平均精度99.15%柑潦。在藝術(shù)創(chuàng)作上,2016年微軟的智能設(shè)備通過自主“學(xué)習(xí)”倫勃朗的作品繪畫風(fēng)格和主題“創(chuàng)作”了一張男子肖像畫峻凫,參觀者感覺它與掛在美術(shù)館的倫勃朗真跡相比一點也不突兀渗鬼。
近些年我們討論AI,并不會過多涉及人腦和意識模擬的話題荧琼,而是將重點集中在解決實際落地的問題之上譬胎。但這種AI能夠代表所謂的智能嗎?著名學(xué)者侯世達(dá)就在近期接受的采訪中表示命锄,目前的AI不過是對數(shù)據(jù)的妥協(xié)下制造出的很厲害的解題程序而已堰乔,根本談不上真正的智能。在其于上世紀(jì)70年代末撰寫的傳世名作《GEB》(《哥德爾脐恩、艾舍爾镐侯、巴赫書:集異璧之大成》)一書中,就曾主張人類可以通過認(rèn)知的循環(huán)升級驶冒,最終創(chuàng)造出超越自身的智慧和意識苟翻,讓機器能夠產(chǎn)生機器本身。
如果按照這種說法骗污,或許我們現(xiàn)在發(fā)明的所有AI工具崇猫,從更長的人類歷史來看,遠(yuǎn)遠(yuǎn)還不能被稱為智能需忿?未來的智能需要具備意識和情感嗎诅炉?它是否需要擁有和人類一樣的同理心?我們理想中完美的智能世界贴谎,是僅僅包含了物質(zhì)的存在汞扎,還是也應(yīng)該具有主觀的精神和意志?
回到我們最初的理想模型擅这,或許真到了智能可以搞定一切問題的時候澈魄,我們可能不愿意全部交給它處理,因為擔(dān)心聰明的計算機侵犯我們的安全和隱私仲翎?我們需要適應(yīng)AI帶給我們的一系列變化痹扇,比如機器將會替代大量人類的工作,這種情況下我們應(yīng)該以何謀生溯香?智能的機器會變得越來越強大鲫构,為了規(guī)范它們和人類的共處模式,是否又需要建立新的法律和社會秩序玫坛?
在AI快速發(fā)展的今天结笨,人類已然擁有了無比豐富的知識,全世界的經(jīng)濟發(fā)展為何仍不時陷入困境?除了自然因素之外炕吸,為什么我們居住的土地上仍然存在大量的饑荒和瘟疫伐憾?AI幫我們克服了許多過去無法克服的難題,為什么人類依然經(jīng)常生活在冷漠和猜忌之中赫模?我們的生產(chǎn)力在大數(shù)據(jù)和智能的助推下獲得了長足的進步树肃,但為什么彼此的信任和協(xié)作還是難以大范圍達(dá)成?
這樣看來瀑罗,我們的問題可能并不是什么數(shù)據(jù)或者智能胸嘴,如果僅僅依靠它們也根本無法建立人類心目中的完美世界。一定存在著某個關(guān)鍵的方法斩祭,只是我們暫時還沒有發(fā)現(xiàn)而已劣像。即便我們訪遍了地球上每個數(shù)據(jù)的角落,也用AI翻閱了無數(shù)的經(jīng)典停忿,卻久久無法找到問題的答案驾讲。在科技為我們不斷創(chuàng)造繁榮的同時,無論是西方還是東方席赂,正在被越來越多的焦慮和無措的情緒所籠罩。站在無邊的曠野上时迫,人類四處張望颅停,卻總是無法找到一個溫暖的擁抱;即使身處繁華和喧囂之中掠拳,有美酒和音樂相伴癞揉,我們的心卻還是時不時感到落寞和孤單。
終于在2009年溺欧,一個名叫中本聰?shù)募一镌谒l(fā)明的比特幣上給了我們最初的提示喊熟,后來我們又從中提煉出區(qū)塊鏈這項新的技術(shù),并已經(jīng)開始著手將它應(yīng)用于解決各項棘手的問題姐刁。區(qū)塊鏈將為我們提供大規(guī)模信任的基礎(chǔ)芥牌,消除猜忌和疑慮,降低彼此間溝通的成本聂使。借助這一技術(shù)壁拉,大數(shù)據(jù)、AI和量子計算們可以發(fā)揮更大的價值柏靶,從而幫助我們穿越低潮和迷霧嗎弃理?在它的幫助下,人類或許就可以攜起手來屎蜓,勇敢地走進混沌的數(shù)字世界痘昌,然后一起邁向更完美的遠(yuǎn)方?無論如何,對于我們來說辆苔,這是又一次巨大的希望笔诵。
數(shù)字無界,愿相伴同行姑子!
*文章為作者李凱龍原創(chuàng)獨立觀點乎婿。 未經(jīng)授權(quán), 禁止擅自轉(zhuǎn)載街佑。
*李凱龍谢翎,劫波科技創(chuàng)始人兼CEO。
李先生就讀于清華大學(xué)經(jīng)濟管理學(xué)院和法學(xué)院獲得碩士學(xué)位沐旨,擁有香港中文大學(xué)mba及北京外國語大學(xué)語言文學(xué)學(xué)士文憑森逮,并被公派到歐洲多個國家留學(xué)。李先生曾供職中美頂級的一/二級市場投資及基金磁携;曾于騰訊從事研究與投資工作褒侧,期間在騰訊研究院擔(dān)任首席研究員;曾出任中國五百強佳兆業(yè)金融控股總裁助理職務(wù)谊迄,負(fù)責(zé)戰(zhàn)略業(yè)務(wù)規(guī)劃及金融/科技/消費板塊的投融資和運營管理闷供。李先生還是清華-伯克利深圳學(xué)院和香港中文大學(xué)博士及研究生課程講授學(xué)者,并為清華大學(xué)院系校友會之理事统诺。