對于人工智能來說,前60年的人工智能歷程毅待,可以用“無窮動”來形容尚卫;后60年的人工智能發(fā)展,可以用“無窮大”來期許尸红。
(本文系BT傳媒·《商業(yè)價值》雜志4月刊封面文章吱涉,小長假鈦媒體深度閱讀重磅推薦)
1956年的夏天,一場在美國達(dá)特茅斯(Dartmouth)大學(xué)召開的學(xué)術(shù)會議外里,多年以后被認(rèn)定為全球人工智能研究的起點(diǎn)邑飒。2016年的春天,一場AlphaGo與世界頂級圍棋高手李世石的人機(jī)世紀(jì)對戰(zhàn)级乐,把全球推上了人工智能浪潮的新高疙咸。
經(jīng)歷了兩次起伏,人工智能現(xiàn)在進(jìn)入了全球爆發(fā)的前夜风科。僅在中國就有上億人直接或間接地觀看了AlphaGo與李世石的比賽撒轮,而在2016年初乞旦,還有IBM在全球大舉推廣基于IBM Watson的認(rèn)知計算,Watson的前身就是1997年打敗了國際象棋大師卡斯帕羅夫的“深藍(lán)”题山。
中國有句古話叫做60年一輪回兰粉。然而對于人工智能來說,往后的60年并不僅是輪回顶瞳,而是新生玖姑。前60年的人工智能歷程,可以用“無窮動”來形容慨菱;后60年的人工智能發(fā)展焰络,可以用“無窮大”來期許。
“無窮動”是一首意大利小提琴名曲符喝,卡耐基·梅隆大學(xué)人工智能教授邢波用這個名字命名自己研究小組研發(fā)的新一代分布式機(jī)器學(xué)習(xí)系統(tǒng)闪彼。“無窮動”又是一種寓意协饲,代表了在過去60年間甚至到更遠(yuǎn)的古代畏腕,人們對于智能機(jī)器永無止境的想象以及去實(shí)踐的沖動。
人們對于智能機(jī)器的想像永無止境
亞里士多德曾說過茉稠,如果機(jī)器能干很多活描馅,豈不能讓人類解放出來《撸《星球大戰(zhàn)》《黑客帝國》《人工智能》等科幻電影流昏,激發(fā)了一代又一代學(xué)者和實(shí)業(yè)家,前伏后繼地投入到人工智能的研究中吞获。AlphaGo算法的主要發(fā)明人况凉,就是受了“深藍(lán)”的影響而加入AI的行列。
在前60年的發(fā)展中各拷,人工智能研究也取得了階段性成果刁绒,特別是有監(jiān)督深度學(xué)習(xí)在自然語言理解、語音識別烤黍、圖像識別等人工智能基礎(chǔ)領(lǐng)域知市,都已經(jīng)發(fā)展到了成熟階段。接下來速蕊,就是AlphaGo開創(chuàng)的無監(jiān)督深度學(xué)習(xí)的未來——擺脫人類“監(jiān)督”的增強(qiáng)學(xué)習(xí)嫂丙。
實(shí)際上,隨著計算機(jī)的發(fā)明规哲,人們一直在探討跟啤,這到底會導(dǎo)致什么樣的人工智能?一種預(yù)見是可以產(chǎn)生功能性的人工智能,這就是今天有監(jiān)督深度學(xué)習(xí)所廣泛取得的成果隅肥。還有一種觀點(diǎn)是人工智能可以模仿人的思維和感情活動竿奏,這就是無監(jiān)督深度學(xué)習(xí)將要開創(chuàng)的未來。
當(dāng)智能機(jī)器可以自己張開眼睛看世界腥放,通過自主探索世界來獲得智能的話泛啸,未來可能出現(xiàn)的變化就是“無窮大”了。從“無窮動”到“無窮大”秃症,2016年注定是一個精彩之年候址。
上篇:前60年“無窮動”的韻律
人工智能頭60年的發(fā)展,就是在起起伏伏种柑、寒冬與新潮岗仑、失望與希望之間的無窮動韻律,尋找著理論與實(shí)踐的最佳結(jié)合點(diǎn)莹规。
從清華大學(xué)畢業(yè)后赔蒲,邢波到Rutgers大學(xué)和伯克利攻讀研究生泌神,之后到卡耐基·梅隆大學(xué)成為一名人工智能領(lǐng)域的教授良漱。卡耐基·梅隆是全球重要的人工智能研究基地欢际,很多原創(chuàng)性成果都出自這所大學(xué)母市。
卡耐基·梅隆大學(xué)人工智能教授邢波
邢波在卡耐基·梅隆大學(xué)成立了一個人工智能小組SAILING LAB,試圖在人工智能各個方面產(chǎn)生突破损趋,理論研究包括概率圖模型的最大似然和最大間隔學(xué)習(xí)患久、非參數(shù)空間高維推理、非穩(wěn)態(tài)時間序列分析浑槽、非參數(shù)貝葉斯化推理等蒋失,應(yīng)用研究包括計算生物學(xué)、群體遺傳學(xué)桐玻、基因組學(xué)篙挽、社交網(wǎng)絡(luò)和社交群體、互聯(lián)網(wǎng)級文本挖掘和自然語言處理镊靴、計算金融等铣卡。
2016年3月19日,在AlphaGo戰(zhàn)勝李世石后的第4天偏竟,邢波隨著《未來論壇》之理解未來系列講座走進(jìn)了京東集團(tuán)煮落。邢波回顧了全球人工智能歷程,人工智能作為一個科學(xué)和工程領(lǐng)域踊谋,得益于20個世紀(jì)國際科學(xué)蝉仇、計算機(jī)科學(xué)、信息論、控制論等很多科學(xué)發(fā)展的交匯點(diǎn)量淌。人工智能的研究基于一個很基本的假設(shè)骗村,即認(rèn)為人的思維活動可以用機(jī)械方式替代。
60年前的全球人工智能大會
談到人工智能呀枢,就不能不提到鼻祖式人物:圖靈胚股。1936年,英國數(shù)學(xué)家裙秋、邏輯學(xué)家阿蘭·麥席森·圖靈(1912~1954)提出了一種抽象的計算模型——圖靈機(jī)(TuringMachine)琅拌,用紙帶式機(jī)器來模擬人們進(jìn)行數(shù)學(xué)運(yùn)算的過程,圖靈本人被視為計算機(jī)科學(xué)之父摘刑。
1959年进宝,圖靈發(fā)表了一篇劃時代的論文《計算機(jī)器與智能》,文中提出了人工智能領(lǐng)域著名的圖靈測試——如果電腦能在5分鐘內(nèi)回答由人類測試者提出的一系列問題枷恕,且其超過30%的回答讓測試者誤認(rèn)為是人類所答党晋,則電腦就通過測試并可下結(jié)論為機(jī)器具有智能。
卡耐基·梅隆大學(xué)
圖靈測試的概念極大影響人工智能對于功能的定義徐块,在這個途徑上未玻,卡耐基·梅隆兩位科學(xué)家希爾伯特·西蒙(HerbertSimon)、曼紐爾·布盧姆(ManuelBlum)做了前期的工作胡控,這二位又被稱為邏輯理論家扳剿,他們非常精妙地證明了羅素《數(shù)學(xué)原理》52道中的38道。西蒙宣稱在10年之內(nèi)昼激,機(jī)器就可以達(dá)到和人類智能一樣的高度庇绽。西蒙和布盧姆均為圖靈獎獲得者。
第一批人工智能探索者找到共同的語言后橙困,于整整60年前的1956年瞧掺,在美國達(dá)特茅斯大學(xué)開了一次會,希望確立人工智能作為一門科學(xué)的任務(wù)和完整路徑凡傅。與會者們也宣稱辟狈,人工智能的特征都可以被精準(zhǔn)描述,精準(zhǔn)描述后就可以用機(jī)器來模擬和實(shí)現(xiàn)像捶。后來普遍認(rèn)為上陕,達(dá)特茅斯會議標(biāo)志著人工智能的正式誕生。
人工智能第一次浪潮和寒冬
達(dá)特茅斯會議推動了全球第一次人工智能浪潮的出現(xiàn)拓春,即為1956年到1974年释簿。當(dāng)時樂觀的氣氛彌漫著整個學(xué)界,在算法方面出現(xiàn)了很多世界級的發(fā)明硼莽,其中包括一種叫做增強(qiáng)學(xué)習(xí)的雛形(即貝爾曼公式)庶溶,增強(qiáng)學(xué)習(xí)就是谷歌AlphaGo算法核心思想內(nèi)容≈笞荩現(xiàn)在常聽到的深度學(xué)習(xí)模型,其雛形叫做感知器偏螺,也是在那幾年間發(fā)明的行疏。
60年前的達(dá)特茅斯大學(xué)
除了算法和方法論有了新的進(jìn)展,在第一次浪潮中套像,科學(xué)家們還造出了聰明的機(jī)器酿联。其中,有一臺叫做STUDENT(1964)的機(jī)器能證明應(yīng)用題夺巩,還有一臺叫做ELIZA(1966)的機(jī)器可以實(shí)現(xiàn)簡單人機(jī)對話贞让。于是,人工智能界認(rèn)為按照這樣的發(fā)展速度柳譬,人工智能真的可以代替人類喳张。
第一次人工智能冬天出現(xiàn)在1974年到1980年。這是怎么回事呢美澳?因為人們發(fā)現(xiàn)邏輯證明器销部、感知器、增強(qiáng)學(xué)習(xí)等等只能做很簡單制跟、非常專門且很窄的任務(wù)舅桩,稍微超出范圍就無法應(yīng)對。這里面存在兩方面局限:一方面凫岖,人工智能所基于的數(shù)學(xué)模型和數(shù)學(xué)手段被發(fā)現(xiàn)有一定的缺陷江咳;另一方面逢净,有很多計算復(fù)雜度以指數(shù)程度增加哥放,所以成為了不可能完成的計算任務(wù)。
先天缺陷導(dǎo)致人工智能在早期發(fā)展過程中遇到瓶頸爹土,所以第一次冬天很快到來甥雕,對人工智能的資助相應(yīng)也就被縮減或取消了。
現(xiàn)代PC“促成”第二次人工智能寒冬
進(jìn)入20世紀(jì)80年代胀茵,卡耐基·梅隆大學(xué)為DEC公司制造出了專家系統(tǒng)(1980)社露,這個專家系統(tǒng)可幫助DEC公司每年節(jié)約4000萬美元左右的費(fèi)用,特別是在決策方面能提供有價值的內(nèi)容琼娘。受此鼓勵峭弟,很多國家包括日本、美國都再次投入巨資開發(fā)所謂第5代計算機(jī)(1982)脱拼,當(dāng)時叫做人工智能計算機(jī)瞒瘸。
在80年代出現(xiàn)了人工智能數(shù)學(xué)模型方面的重大發(fā)明,其中包括著名的多層神經(jīng)網(wǎng)絡(luò)(1986)和BP反向傳播算法(1986)等熄浓,也出現(xiàn)了能與人類下象棋的高度智能機(jī)器(1989)情臭。此外,其它成果包括能自動識別信封上郵政編碼的機(jī)器,就是通過人工智能網(wǎng)絡(luò)來實(shí)現(xiàn)的俯在,精度可達(dá)99%以上竟秫,已經(jīng)超過普通人的水平。于是跷乐,大家又開始覺得人工智能還是有戲肥败。
早期的專家系統(tǒng)Symbolics 3640
然而,1987年到1993年現(xiàn)代PC的出現(xiàn)愕提,讓人工智能的寒冬再次降臨拙吉。當(dāng)時蘋果、IBM開始推廣第一代臺式機(jī)揪荣,計算機(jī)開始走入個人家庭筷黔,其費(fèi)用遠(yuǎn)遠(yuǎn)低于專家系統(tǒng)所使用的Symbolics和Lisp等機(jī)器。相比于現(xiàn)代PC仗颈,專家系統(tǒng)被認(rèn)為古老陳舊而非常難以維護(hù)佛舱。于是,政府經(jīng)費(fèi)開始下降挨决,寒冬又一次來臨请祖。
那時,甚至學(xué)者們都不太好意思說是從事人工智能研究的脖祈。人們開始思考人工智能到底往何處走肆捕,到底要實(shí)現(xiàn)什么樣的人工智能。
現(xiàn)代AI的曙光:新工具盖高、新理念和摩爾定律
如何在有限的資源下做有用的事情慎陵,這是人工智能一直以來的挑戰(zhàn)。一個現(xiàn)實(shí)的途徑就是像人類造飛機(jī)一樣喻奥,從生物界獲得啟發(fā)后席纽,以工程化方法對功能進(jìn)行簡化、部署簡單的數(shù)學(xué)模型以及開發(fā)強(qiáng)大的飛機(jī)引擎撞蚕。
現(xiàn)代AI的曙光發(fā)生在這個階段润梯,出現(xiàn)了新的數(shù)學(xué)工具、新的理論和摩爾定律甥厦。人工智能也在確定自己的方向纺铭,其中一個選擇就是要做實(shí)用性、功能性的人工智能刀疙,這導(dǎo)致了一個新的人工智能路徑辐烂。由于對于人工智能任務(wù)的明確和簡化扯旷,帶來了新的繁榮医寿。
基于神經(jīng)元網(wǎng)絡(luò)的深度學(xué)習(xí)算法示意圖
在新的數(shù)學(xué)工具方面,原來已經(jīng)存在于數(shù)學(xué)或者其他學(xué)科的文獻(xiàn)中的數(shù)學(xué)模型镊辕,被重新發(fā)掘或者發(fā)明出來。當(dāng)時比較顯著幾個成果包括最近獲得圖靈獎的圖模型以及圖優(yōu)化蚁袭、深度學(xué)習(xí)網(wǎng)絡(luò)等征懈,都是大約在15年前重新被提出來,重新開始研究揩悄。
在新的理論方面卖哎,由于數(shù)學(xué)模型對自然世界的簡化,有著非常明確的數(shù)理邏輯删性,使得理論分析和證明成為可能亏娜,可以分析出到底需要多少數(shù)據(jù)量和計算量來以得期望的結(jié)果,這對開發(fā)相應(yīng)的計算系統(tǒng)非常有幫助蹬挺。
在更重要的一方面维贺,摩爾定律讓計算越來越強(qiáng)大,而強(qiáng)大計算機(jī)很少被用在人工智能早期研究中巴帮,因為早期的人工智能研究更多被定義為數(shù)學(xué)和算法研究溯泣。當(dāng)更強(qiáng)大的計算能力被轉(zhuǎn)移到人工智能研究后,顯著提高了人工智能的研究效果榕茧。
由于這一系列的突破垃沦,人工智能又產(chǎn)生了一個新的繁榮期。最早的結(jié)果即為1997年IBM深藍(lán)戰(zhàn)勝國際象棋大師用押。在更加通用型的功能性方面肢簿,機(jī)器在數(shù)學(xué)競賽、識別圖片的比賽中蜻拨,也可以達(dá)到或者超過人類的標(biāo)準(zhǔn)池充。
人工智能的繁榮也促進(jìn)了機(jī)器人的進(jìn)步,包括把人工智能原理用在機(jī)器狗的設(shè)計上官觅。無論是人工智能狗還是無人車駕駛纵菌,都不是用編程方法寫出來阐污,而是通過一套學(xué)習(xí)算法在模擬器中不斷的走路和開車休涤,讓機(jī)器自己產(chǎn)生行為策略,這是人工智能和原先控制論最不同的地方笛辟。
2011年功氨,F(xiàn)acebook的挑戰(zhàn)
在2011年的時候,邢波迎來做教授的第一次學(xué)術(shù)休假手幢,美國教授大概每6年可以做一次休假捷凄。邢波選擇去了一家很年輕的公司做客座教授,這就是當(dāng)時的Facebook围来。那個時候只有500人的Facebook在斯坦福大學(xué)的倉庫里搭起了自己的實(shí)驗室跺涤,當(dāng)時Facebook提出希望連接上億用戶匈睁,也希望能夠運(yùn)用人工智能投放有價值的廣告以增加公司收入。
Facebook當(dāng)時的目標(biāo)為在不久的將來把用戶從1億增長到10億桶错,邢波的任務(wù)就是幫助Facebook實(shí)現(xiàn)這個愿景航唆。作為Facebook的第一個客座教授,他的第一個任務(wù)要把用戶在社交網(wǎng)絡(luò)里連接起來院刁,然后把這種連接投射到社交空間中糯钙,從而做社群檢測并把社群檢測用來實(shí)現(xiàn)用戶分組和特征化。
這個任務(wù)并不難退腥,可以通過混合成員隨機(jī)區(qū)塊模型來實(shí)現(xiàn)任岸,這是2011年最好的處理網(wǎng)絡(luò)數(shù)據(jù)的AI算法。但其中有一個問題狡刘,即計算的復(fù)雜度呈平方級現(xiàn)象享潜,即用戶數(shù)每增加10倍就需要100倍的CPU和存儲,因此單機(jī)最多處理1萬人嗅蔬,這是當(dāng)時最大問題米碰。
邢波于是通過研究算法模型實(shí)現(xiàn)計算加速,包括在社交網(wǎng)絡(luò)抽取比“邊”更強(qiáng)大的特征叫做“三角形”购城,模型也從混合塊模型升級到混合三角模型吕座。混合算法實(shí)現(xiàn)了顯著的革新,計算復(fù)雜度在不斷下降瘪板。當(dāng)時的研究成果被用于全球電影明星網(wǎng)絡(luò)研究吴趴,大約在100萬人左右的網(wǎng)絡(luò),可實(shí)時展示人們在模型驅(qū)動下不斷在社交空間找朋友并落入到不同的社交群侮攀。
100萬的網(wǎng)絡(luò)锣枝、幾億條邊、500多億特征數(shù)兰英,用10核單機(jī)在40分鐘內(nèi)完成了模擬撇叁,這也是驚人的成果。
但問題來了畦贸,F(xiàn)acebook的目標(biāo)用戶不是100萬陨闹,而是1億用戶。100萬用戶模擬只用了一臺筆記本電腦薄坏,而當(dāng)時在Facebook的機(jī)房里有1000臺主機(jī)趋厉,上面跑著可運(yùn)行并行程序Hadoop系統(tǒng)。當(dāng)時邢波把任務(wù)進(jìn)行了并行化處理胶坠,希望能在0.6分鐘內(nèi)處理1億用戶君账。可結(jié)果并不理想沈善,一個星期后依然沒有結(jié)果乡数。
AI對于傳統(tǒng)計算架構(gòu)的挑戰(zhàn)
到底發(fā)生什么事情呢椭蹄?原來,用Hadoop進(jìn)行并行計算的時候净赴,其原理為把計算任務(wù)分解為若干子任務(wù)塑娇,然后在不同機(jī)器上運(yùn)行不同的子任務(wù),當(dāng)每一個子任務(wù)都完成后再通過所有子任務(wù)之間的一次握手通信劫侧,宣告這次并行計算的結(jié)束埋酬。
Hadoop起源于1945年的馮·諾依曼架構(gòu),該架構(gòu)也是現(xiàn)代計算機(jī)的原型烧栋,包括中央處理器写妥、記憶存儲器、輸入和輸出等审姓,通過硬件和軟件實(shí)現(xiàn)簡潔的橋接珍特,而不用對每個晶體管和電子管做局部編程。在20世紀(jì)60年代就已經(jīng)有人看到馮·諾依曼的局限魔吐,當(dāng)有更大的任務(wù)或者速度有更高要求扎筒,需要讓很多臺機(jī)器一起執(zhí)行同一個任務(wù),于是就有了早期的并行計算系統(tǒng)酬姆。
后來嗜桌,萊斯利·蘭伯特(LeslieLamport)創(chuàng)造了BSP橋接模型(1980~1990s),通過簡單抽象把計算和通信分成了兩個不重合的項辞色,每個項只完成各自的計算或通信任務(wù)骨宠。Hadoop(2000s)就是這一思路的優(yōu)秀代表,它可以用不同的機(jī)器以并行方式執(zhí)行子任務(wù)相满,子任務(wù)完成后再通過握手通信完成計算层亿。
Hadoop是當(dāng)前流行的并行計算架構(gòu)
Hadoop現(xiàn)在已經(jīng)成為主流的運(yùn)算平臺,對傳統(tǒng)計算程序像數(shù)據(jù)庫立美、統(tǒng)計數(shù)據(jù)歸納等都相當(dāng)有效匿又。BSP橋接模型的一個最近突破就是Spark(2010s),它與Hadoop的區(qū)別在于建蹄,Hadoop用硬盤作為存儲單元而Spark用內(nèi)存作為存儲單元碌更,但二者的通信原理是一樣的。
于是躲撰,在Hadoop機(jī)制下针贬,整個并行計算的瓶頸出現(xiàn)在機(jī)群里最慢的那臺機(jī)器。而在實(shí)際情況中拢蛋,總會出現(xiàn)最慢的一臺機(jī)器。因為整個機(jī)群是共享計算資源蔫巩,同期還有其它計算任務(wù)跑在機(jī)器上爭搶計算資源谆棱,此外甚至機(jī)房的溫度不均勻也會影響機(jī)器的速度快压。
裝了Hadoop的千臺機(jī)器很好地支持Facebook當(dāng)時其他的業(yè)務(wù),包括搜索業(yè)務(wù)和存儲業(yè)務(wù)垃瞧。為什么到了人工智能業(yè)務(wù)就不行了呢蔫劣?原因是人工智能計算有它的獨(dú)特性,人工智能是迭代式反復(fù)讀取數(shù)據(jù)和刷新模型的方式个从,與傳統(tǒng)計算模式有很大的不同脉幢,這是人工智能發(fā)展遇到的又一瓶頸。
從人工智能角度來講嗦锐,需要完成大型的計算任務(wù)嫌松,光有好的數(shù)學(xué)模型或算法還不夠,還需要強(qiáng)力計算引擎支持奕污,而且這個計算引擎跟原來的不一樣萎羔。這就是當(dāng)時邢波在Facebook機(jī)群上運(yùn)行人工智能程序,每一次迭代接近結(jié)束進(jìn)入下一個迭代時碳默,總會出現(xiàn)已經(jīng)完成99%還有1%的計算沒有完成并且拖延一個星期的情況贾陷。
新的AI計算引擎
人工智能采用了漸進(jìn)迭代方式,迭代速度和迭代效率與數(shù)學(xué)方程難度有關(guān)嘱根。在大數(shù)據(jù)和復(fù)雜任務(wù)情況下髓废,每一次計算中心都要把大數(shù)據(jù)遍歷刷一遍,1000次迭代就要刷1000遍该抒。如果深度學(xué)習(xí)模型有幾十億參數(shù)瓦哎,意味著每次迭代都要把所有參數(shù)刷新一遍。而當(dāng)數(shù)據(jù)和模型同時放大時柔逼,這個任務(wù)就變得無比困難蒋譬。
傳統(tǒng)計算架構(gòu)下的BSP通信協(xié)議,就是先計算再通信愉适、再計算再通信犯助,這是實(shí)現(xiàn)計算一致性基本保障之一。理論上假設(shè)這樣的代價為零维咸,但在工程實(shí)際系統(tǒng)中這并不是一個零代價的工程剂买,各種問題使得機(jī)群不同步,要花很多時間等待計算的一致性癌蓖。
邢波通過自己在Facebook的經(jīng)歷瞬哼,發(fā)現(xiàn)人工智能運(yùn)算和傳統(tǒng)計算非常不一樣,傳統(tǒng)計算由指令集構(gòu)成租副,執(zhí)行指令目的就是執(zhí)行程序坐慰,執(zhí)行的過程中不能出錯。這是傳統(tǒng)執(zhí)行計算任務(wù)經(jīng)典特征用僧,所有操作系統(tǒng)都是圍繞著這個目的來優(yōu)化结胀,包括容錯性和通信有效性等赞咙。
人工智能算法就像爬山,中間可以出錯糟港,只要能到達(dá)山頂攀操。
人工智能的運(yùn)算也是由指令集構(gòu)成,但執(zhí)行指令集的執(zhí)行只是一個過程而不是目的秸抚,目的是優(yōu)化算法速和。就像爬山一樣,目的是爬到山頂剥汤。傳統(tǒng)計算體系是嚴(yán)格設(shè)定登山路線颠放,一步也不能出錯,但人工智能則可以在中間出錯秀姐,只要能到山頂慈迈。
2012年,邢波及其同事設(shè)計了一種新的參數(shù)服務(wù)器模型省有,這個框架下的核心概念痒留,就是人工智能的計算任務(wù)不再像傳統(tǒng)計算任務(wù)那樣以精準(zhǔn)性為前提,而是像執(zhí)行救火任務(wù)的機(jī)群那樣蠢沿,其任務(wù)為“滅火”伸头,至于如何達(dá)到火場只是一個手段。而且“撲火機(jī)群”還需要以機(jī)群為整體給上級一個簡單的指揮界面舷蟀,具體飛行細(xì)節(jié)則由飛行員們自行協(xié)調(diào)恤磷,這是人工智能的新觀點(diǎn)。
基于這樣一個目標(biāo)野宜,邢波及其同事開發(fā)了新的橋接模型——SSP有限異步模型扫步。在有限異步模型下,運(yùn)行機(jī)器服從中央指揮匈子,但每個“戰(zhàn)隊”都有局限性自由度河胎,總體目的是打贏仗。傳統(tǒng)并行計算虎敦,需要很精準(zhǔn)的協(xié)調(diào)游岳;而完全異步模型下,每個機(jī)器各自為政其徙,大部分不能協(xié)調(diào)實(shí)現(xiàn)共同目標(biāo)胚迫。于是,邢波選擇了第三條路線:有限異步模型唾那。
邢波用有限異步橋接原理去構(gòu)建參數(shù)服務(wù)器的編程界面访锻,是一個分享內(nèi)存的大規(guī)模編程界面,程序運(yùn)行速度和精度都有了巨大的提升。而且這個系統(tǒng)并不是為某一個特定人工智能計算而設(shè)計的朗若,更是一個公用的計算平臺模型恼五,在設(shè)計時考慮了整個人工智能程序的普遍共性昌罩。這個系統(tǒng)也有非常靈活的容錯及通訊管理機(jī)制哭懈,最后的結(jié)果就是系統(tǒng)功效的巨大提升。
2013年茎用,邢波研究小組取得了另一個突破遣总。當(dāng)訓(xùn)練巨大模型的時候,需要把模型分解到不同機(jī)器上轨功,每個機(jī)器上完成一個子任務(wù)旭斥,子任務(wù)間必須有效通信,才能保證整體任務(wù)不失敗古涧。于是就設(shè)計了一個動態(tài)調(diào)度器Strads垂券,其原理像拉小提琴十個手指一樣,雖然很快速且每個手指執(zhí)行異步異時的動作羡滑,但最終是為了同一首小提琴曲菇爪。
最后結(jié)果不僅可以保障大型模型程序在很細(xì)顆粒度下的正確性,有時候還能實(shí)現(xiàn)令人吃驚的加速收斂曲線效果柒昏,這是傳統(tǒng)的完全同步運(yùn)行程序無法達(dá)到的結(jié)果凳宙。
人工智能“無窮動”
到了2013年年底的時候,卡耐基·梅隆大學(xué)對這個分布式機(jī)器學(xué)習(xí)系統(tǒng)做了開源發(fā)布职祷,并命名為Petuum氏涩。這個名字源于意大利小提琴帕格尼尼的著名小提琴曲Moto Perpetumm(無窮動)。這首以快著稱的小提琴曲有梆,共3005個音符是尖、演奏者手指起落平均每秒達(dá)16次之多,曲子優(yōu)美而緊湊泥耀,表達(dá)了Petuum的設(shè)計思想饺汹。
著名小提琴曲Moto Perpetumm(無窮動)優(yōu)美而緊湊
Petuum從2013年12月發(fā)布0.1版本后,到2015年7月的1.1版本爆袍,一共發(fā)布了5個版本∈追保現(xiàn)在Petuum解決了1億個網(wǎng)絡(luò)節(jié)點(diǎn)的挑戰(zhàn),只用5臺Petuum機(jī)器就在37小時內(nèi)處理完了1億個節(jié)點(diǎn)陨囊,而1000臺Hadoop機(jī)群預(yù)期可能要跑400個小時弦疮。
Petuum也在不斷的發(fā)展,包括多任務(wù)資源調(diào)配問題蜘醋。如同交響樂隊讓不同樂器表現(xiàn)不同的節(jié)奏與聲音胁塞,Petuum開發(fā)了面向多任務(wù)的靈活資源配置系統(tǒng)。在AI人工智能程序部署方面,Petuum以容器的方式對程序進(jìn)行了封裝啸罢,可以在不同硬件環(huán)境中自如運(yùn)行编检,這是即插即用的設(shè)計思路。整個Petuum系統(tǒng)為輕量級解決方法扰才,輕便可用允懂、方便調(diào)試、易于維護(hù)衩匣,可以說是新一代數(shù)據(jù)中心操作系統(tǒng)蕾总。此外,Petuum還可運(yùn)行在AWS及谷歌公有云中琅捏。
“Petuum就是一個交響樂隊生百,可以有不同的組合,根據(jù)需要演奏出不同的風(fēng)格柄延,一個好的操作系統(tǒng)應(yīng)該有這樣的靈活性蚀浆。”目前搜吧,系統(tǒng)Petuum處在多次發(fā)布中市俊,有規(guī)律發(fā)布開源的軟件,包括平臺和工具庫赎败,工具庫有很多常用人工智能的軟件秕衙,包括深度學(xué)習(xí)、主題模型等等僵刮,可登陸Petuum.org据忘。
Petuum是從軟件優(yōu)化角度對Hadoop和Spark等分布式計算系統(tǒng)進(jìn)行了優(yōu)化,在另外一條線上還有其它的科研機(jī)構(gòu)試圖從硬件角度徹底解決馮·諾依曼架構(gòu)的瓶頸搞糕,這就是神經(jīng)元芯片以及更遠(yuǎn)期的量子計算勇吊。
總之,人工智能頭60年的發(fā)展窍仰,就是在起起伏伏汉规、寒冬與新潮、失望與希望之間的無窮動韻律驹吮,尋找著理論與實(shí)踐的最佳結(jié)合點(diǎn)针史。Petuum的出現(xiàn),為頭60年劃上了一個相對完美的句號碟狞,在于Petuum是在軟件層面的革新啄枕,底層依然使用CPU和GPU組成的標(biāo)準(zhǔn)化服務(wù)器機(jī)群,這在夢想與現(xiàn)實(shí)之間找到一個平衡點(diǎn)族沃。
中篇:人工智能的第一波商業(yè)化浪潮
基于自身轉(zhuǎn)型的需求和龐大的企業(yè)經(jīng)濟(jì)體量频祝,IBM正在真正拉動全球第一次人工智能商業(yè)化浪潮泌参。
盡管人工智能已經(jīng)有了60年的歷史,但是人工智能的規(guī)某?眨化商業(yè)浪潮卻一直遲遲沒有到來沽一。之前,盡管有微軟漓糙、谷歌铣缠、Facebook等大公司不斷投資人工智能技術(shù),但大多把研究成果用于自身業(yè)務(wù)的優(yōu)化與效率提升兼蜈。因此攘残,可以說2016年IBM在全球范圍內(nèi)傾全力推出的“認(rèn)知商業(yè)”拙友,才是真正意義上的人工智能商業(yè)化第一波浪潮为狸。
早在1960年4月25日,在一份給IBM管理者的備忘錄中遗契,當(dāng)時的首席執(zhí)行官小沃森談及IBM面臨的問題是制造“會思考的機(jī)器”辐棒。從大型機(jī)到小型機(jī)、從PC到POWER服務(wù)器牍蜂、從“深藍(lán)”到“IBM Watson”漾根,IBM對“會思考的機(jī)器”的思考從未停止過。尤其自20世紀(jì)90年代人工智能研究陷入低潮以來鲫竞,IBM是少數(shù)堅持投入人工智能研究的企業(yè)辐怕。
作為世界上第一家百年IT企業(yè),IBM堅持每年研發(fā)經(jīng)費(fèi)投入超過60億美元从绘。自從近年來遭遇轉(zhuǎn)型困境后寄疏,人工智能研究成果的商業(yè)化自然成為了IBM的首選。
新一代“IBM Watson”
2016年3月1日僵井,IBM大中華區(qū)董事長陳黎明在IBM論壇2016上陕截,宣布IBM公司105年的歷史上第3個代表商業(yè)戰(zhàn)略的品牌“認(rèn)知商業(yè)”落地中國。此前早在1997年批什,IBM就描繪了“電子商務(wù)”的愿景农曲;2008年,IBM推出了“智慧的地球”驻债。
IBM大中華區(qū)董事長陳黎明宣布IBM認(rèn)知商業(yè)戰(zhàn)略在中國正式落地
“認(rèn)知商業(yè)”基于IBM推出的認(rèn)知計算乳规,其核心為新一代IBM Watson技術(shù)及Watson APIs。這個命名實(shí)際上來自IBM創(chuàng)始人 Thomas J. Watson 老沃森的姓氏合呐,而IBM Watson則是繼“深藍(lán)”之后的下一個超級認(rèn)知計算平臺暮的。提起“深藍(lán)”,可謂無人不知合砂。1997年5月1日青扔,國際象棋大師卡斯帕羅夫最終以25:35的比分輸給了IBM RS/6000SP“深藍(lán)”計算機(jī)源织,舉世震驚。
由于象棋是高度結(jié)構(gòu)化游戲微猖,實(shí)際上“深藍(lán)”并不需要太高的學(xué)習(xí)能力谈息。有關(guān)資料顯示,1997年版的“深藍(lán)”每秒鐘可以計算2億步凛剥,存儲了100多年來優(yōu)秀棋手對局的200多萬棋局侠仇。在“深藍(lán)”成功后,IBM研究院進(jìn)而挑戰(zhàn)人工智能的深度問答(Deep Q&A)犁珠,這是人工智能的一個重要分支逻炊,具有極為廣闊的應(yīng)用空間。
IBM Watson最早現(xiàn)身在2011年2月美國老牌益智節(jié)目“危險邊緣”(Jeopardy!)犁享,與節(jié)目史上最強(qiáng)的兩位答題高手一較高下余素,并最終以優(yōu)異的表現(xiàn)打敗了人類選手。從2004年提出挑戰(zhàn)“Jeopardy!”的構(gòu)想炊昆,到2011年IBM Watson真正打敗“Jeopardy!”桨吊,中間差不多經(jīng)歷了6年的時間。為什么會這么困難凤巨?
Watson并不是簡單的機(jī)器學(xué)習(xí)系統(tǒng)视乐,當(dāng)IBM的研究員開始嘗試構(gòu)造Watson時,發(fā)現(xiàn)傳統(tǒng)的機(jī)器學(xué)習(xí)算法行不通敢茁。傳統(tǒng)的機(jī)器學(xué)習(xí)算法先歸納知識佑淀,把知識形成規(guī)則,再讓機(jī)器根據(jù)規(guī)則進(jìn)行響應(yīng)彰檬。這不足以讓W(xué)atson在“Jeopardy!”節(jié)目中勝出伸刃,由于數(shù)據(jù)量過于龐大,IBM研究員意識到必須讓W(xué)atson能夠自行學(xué)習(xí)知識而盡量減少人工干預(yù)僧叉。
經(jīng)過學(xué)習(xí)和訓(xùn)練奕枝,Watson的Deep Q&A系統(tǒng)能夠從原始信息中自動抽取知識,對知識進(jìn)行分類并且能夠分析和理解自然語言瓶堕。如此隘道,Watson就能夠像人類一樣學(xué)習(xí),并從已經(jīng)發(fā)生的事件進(jìn)行推理和總結(jié)經(jīng)驗郎笆。由于這樣的任務(wù)已經(jīng)超出了前代超級計算機(jī)的能力谭梗,IBM的研究員從頭設(shè)計了IBM Watson系統(tǒng),包括軟件和硬件體系宛蚓。
2011年打敗“Jeopardy!”的時候激捏,IBM Watson是由10臺IBM商用服務(wù)器Power750組成的計算系統(tǒng)。2014年初的時候凄吏,IBM Watson的體積已由1個臥室縮小到3個披薩盒子那么大远舅,運(yùn)算速度是之前的 24 倍闰蛔,智能水平是之前的24倍。
IBM Watson的商業(yè)化進(jìn)程
在小沃森的備忘錄里图柏,強(qiáng)調(diào)“計算機(jī)永遠(yuǎn)不會取代人的主動性序六,也不會取代人類的創(chuàng)造性思維≡榇担”計算機(jī)就是要把人類從無意義的例诀、重復(fù)性的思維模式中解放出來。因此裁着,在IBM Watson的商業(yè)化推廣中繁涂,IBM提出了“認(rèn)知計算”,強(qiáng)調(diào)的人與機(jī)器共存二驰。在認(rèn)知計算時代扔罪,并不是機(jī)器取代人類,而是人機(jī)協(xié)作共同創(chuàng)造更好的結(jié)果诸蚕。
2014年1月12日步势,IBM宣布將投資逾10億美元,創(chuàng)建一個新的IBM Watson 業(yè)務(wù)集團(tuán)背犯,基于云計算交付模式,實(shí)現(xiàn)認(rèn)知計算技術(shù)的商業(yè)化盅抚,從這一點(diǎn)開始標(biāo)志著IBM又一次拉開了世紀(jì)轉(zhuǎn)型漠魏。
位于紐約的IBM Watson大樓
在創(chuàng)建IBM Watson業(yè)務(wù)集團(tuán)的同時,IBM公布了幾項基于Watson的新功能:IBM Watson Discovery Advisor妄均、IBM Watson Analytics以及IBM Watson Explorer 等柱锹,分別用于大數(shù)據(jù)探索、基于自然語言的數(shù)據(jù)可視化分析和應(yīng)用程序開發(fā)框架丰包。目前Watson Analytics在全球已經(jīng)擁有超過100萬注冊用戶禁熏,2016年3月在大中華區(qū)剛推出就獲得了近2萬個注冊用戶。
IBM Watson業(yè)務(wù)集團(tuán)總部位于紐約的“硅巷”(Silicon Alley)邑彪,總部大樓內(nèi)為創(chuàng)業(yè)者提供了相關(guān)的孵化器瞧毙,也為IBM客戶提供了客戶解決方案中心用于體驗認(rèn)知技術(shù),還有一個設(shè)計實(shí)驗室來幫助IBM客戶和合作伙伴持續(xù)提升認(rèn)知應(yīng)用及服務(wù)的用戶體驗寄症。實(shí)際上宙彪,在宣布的10億美元投資中童叠,還包括了1億美元的風(fēng)險投資鸿吆,用于構(gòu)建IBM Watson生態(tài)圈。
為了擴(kuò)展可用的Watson數(shù)據(jù)源望门,IBM Watson Content Marketplace結(jié)合了各種獨(dú)特且多樣化的第三方數(shù)據(jù)篮迎,其中的數(shù)據(jù)和信息可被IBM客戶男图、合作伙伴示姿、開發(fā)者和其它機(jī)構(gòu)用于Watson支持的應(yīng)用和服務(wù)中。迄今為止逊笆,該市場接入了Wikivoyage峻凫、疾病控制中心、Cancer.gov览露、美國臨床腫瘤學(xué)會等多家醫(yī)療機(jī)構(gòu)的合作內(nèi)容荧琼,以及美聯(lián)社、Barchart.com差牛、晨星機(jī)構(gòu)(Morningstar)命锄、RxWiki和WAND等新聞報道檔案、健康管理偏化、金融服務(wù)脐恩、腫瘤學(xué)、醫(yī)藥侦讨、工程及其它領(lǐng)域的知識庫驶冒。IBM還與Twitter、Facebook韵卤、蘋果等公司建立戰(zhàn)略聯(lián)盟骗污,以便能夠存取相關(guān)的數(shù)據(jù)。
IBM專門推出了AlchemyData沈条,通過聚合超過7.5萬個來源的新聞和博客內(nèi)容需忿,利用自然語言處理(NLP)加以強(qiáng)化,讓W(xué)atson應(yīng)用能夠采集市場信號蜡歹、實(shí)現(xiàn)業(yè)務(wù)流程自動化和趨勢分析屋厘。IBM后來收購的AlchemyAPI,就是一家提供人工智能文本和圖像分析服務(wù)的前沿公司月而。
2015年3月汗洒,IBM宣布將向物聯(lián)網(wǎng)投資超過30億美元。利用這一投資父款,在2015年10月IBM公司透露了收購The Weather Channel的B2B溢谤、移動和云業(yè)務(wù)的計劃,并于2016年1月完成收購铛漓,IBM將向包括中國溯香、印度、巴西浓恶、墨西哥和日本在內(nèi)的5大新興市場擴(kuò)展weather.com玫坛。氣象數(shù)據(jù)在業(yè)務(wù)運(yùn)營、市場營銷包晰、風(fēng)險管理等商業(yè)領(lǐng)域湿镀,有著廣泛的價值炕吸。
2015年4月IBM成立Watson Health,加強(qiáng)在醫(yī)療和健康行業(yè)的布局勉痴,先后收購了包括Explorys(一家可以查看5000萬份美國患者病例的分析公司)赫模、Phytel(處理各類健康數(shù)據(jù)及提供數(shù)據(jù)分析的云軟件公司)、醫(yī)療影像公司Merge Healthcare 公司蒸矛。其中瀑罗,Merge的技術(shù)平臺普遍應(yīng)用在7500余家美國醫(yī)院及全球眾多著名臨床研究機(jī)構(gòu)和制藥公司。
2016年剛開年雏掠,IBM就宣布進(jìn)行了郭士納以來一次大型的組織調(diào)整斩祭。這次調(diào)整涉及了IBM的三大部門——全球行業(yè)事業(yè)部門、整合認(rèn)知解決方案部門以及云計算部門乡话,筆者認(rèn)為其中的商業(yè)邏輯將會是全球行業(yè)事業(yè)部門梳理行業(yè)用戶需求摧玫、整合認(rèn)知解決方案部門根據(jù)需求開發(fā)認(rèn)知解決方案、云計算部門提供平臺支持绑青。
2016年3月1日诬像,IBM向中國市場推出“認(rèn)知商業(yè)”品牌,在中國市場展開了鋪天蓋地的宣傳推廣活動闸婴。3月15日坏挠,IBM宣布基于認(rèn)知計算的IBM營銷云落地中國,特別加入了對于微信的支持掠拳。
算法經(jīng)濟(jì)時代的到來
IBM正在轉(zhuǎn)型為一家認(rèn)知計算公司癞揉,其背后的大邏輯是全球正在進(jìn)入一個算法經(jīng)濟(jì)時代。自去年以來溺欧,Gartner就在多份報告中強(qiáng)調(diào),算法連通了人柏肪、事物姐刁、業(yè)務(wù)及信息,將創(chuàng)造全新的商業(yè)價值烦味。在未來聂使,算法將成為企業(yè)的核心資產(chǎn),代替企業(yè)把大數(shù)據(jù)轉(zhuǎn)化為商業(yè)洞察谬俄、自動化業(yè)務(wù)流程以及差異化產(chǎn)品與服務(wù)柏靶。一句話,算法將統(tǒng)治世界溃论。
IBM正在拉動全球第一次人工智能商業(yè)化浪潮
在一個算法經(jīng)濟(jì)時代屎蜓,人工智能算法僅是眾多算法中的一種。IBM董事長Ginni Rometty在去年10月的Gartner全球峰會上說钥勋,Watson并不僅僅是人工智能炬转,人工智能算法是Watson背后32個引擎中的一個辆苔。實(shí)際上在過去的幾年間,除了推動Watson認(rèn)知計算的商業(yè)化之外扼劈,IBM一直在不余遺力的收購商業(yè)算法公司驻啤,納入到IBM整體的算法體系。
IBM于2011年花費(fèi)近4億美元收購了一家叫做Algorithmics的公司荐吵,其業(yè)務(wù)就是用商業(yè)算法來計量金融交易的風(fēng)險骑冗。Algorithmics參與了國際巴寒爾協(xié)議的咨詢與建議,不斷跟蹤巴寒爾協(xié)議進(jìn)展并把新的規(guī)范編入算法中先煎,再把算法賣給各國的銀行用于金融風(fēng)險監(jiān)控贼涩。據(jù)有關(guān)統(tǒng)計,在收購Algorithmics之前榨婆,IBM就已經(jīng)花費(fèi)了140億美元用于收購25家分析公司磁携。
當(dāng)然,在整個IBM算法體系中良风,Watson認(rèn)知計算是“皇冠上的明珠”谊迄。IBM Watson業(yè)務(wù)集團(tuán)高級副總裁Michael Rhodin說:“在IBM 100年的歷史上,Watson是我們最重要的創(chuàng)新之一烟央⊥撑担” IBM 董事長 Ginni Rometty在去年10月的Gartner全球峰會上說,推動全球邁向“認(rèn)知商業(yè)”時代疑俭,“這是我們的登月工程粮呢。”
在已經(jīng)推出的Watson API中钞艇,包括:文本轉(zhuǎn)語音API啄寡,歷經(jīng)12年的研發(fā),最新加入的情商功能讓文本轉(zhuǎn)語音的時候能適應(yīng)語境與情緒哩照;語調(diào)分析器API挺物,可對文本中的語調(diào)進(jìn)行分析,獲得更好的觀察飘弧;情緒分析API识藤,通過復(fù)雜的自然語言處理,感知外部環(huán)境中用戶情緒的變化次伶;視覺識別API痴昧,可以定制化適應(yīng)不同企業(yè)的圖像識別需求等等。據(jù)統(tǒng)計冠王,Watson API每月被調(diào)用高達(dá)13億次赶撰,并且還在快速增長。
目前已經(jīng)有36個國家、17個行業(yè)的企業(yè)在使用Watson的認(rèn)知技術(shù)扣囊,全球超過7.7萬名開發(fā)者在使用Watson Developer Cloud平臺乎折,超過350家生態(tài)系統(tǒng)中合作伙伴及企業(yè)內(nèi)部創(chuàng)新團(tuán)隊正在構(gòu)建基于認(rèn)知技術(shù)的應(yīng)用、產(chǎn)品和服務(wù)侵歇,其中100家企業(yè)已將產(chǎn)品推向市場骂澄。
可以說,基于自身轉(zhuǎn)型的需求和龐大的企業(yè)經(jīng)濟(jì)體量惕虑,IBM正在真正拉動全球第一次人工智能商業(yè)化浪潮坟冲。而在這次大浪潮之下,首先受益的將是商業(yè)智能算法公司溃蔫,包括IBM健提、SAS、QLIK伟叛、Tableau等商業(yè)智能軟件公司將迎來黃金時代私痹。
下篇:未來“無窮大”的AI空間
增強(qiáng)學(xué)習(xí)算法更接近生物學(xué)習(xí)的行為特征,具有探索未知世界的能力统刮。AlphaGo對增強(qiáng)學(xué)習(xí)算法的探索紊遵,打開了“無窮大”的大門。
AlphaGo戰(zhàn)勝人類圍棋高手李世石的事件侥蒙,正好發(fā)生在60年這個時間節(jié)點(diǎn)上暗膜,可以說是全球人工智能界承上啟下的里程碑式事件。簡單說鞭衩,AlphaGo的算法是前60年人工智能研究都很少觸及的領(lǐng)域:增強(qiáng)學(xué)習(xí)学搜,即無監(jiān)督的深度學(xué)習(xí),而前60年的主流算法為有監(jiān)督的深度學(xué)習(xí)论衍。
而在60年這個節(jié)點(diǎn)上瑞佩,經(jīng)過了1980年和2000年兩次寒冬,全球人工智能界又迎來了第三次浪潮坯台。這一次钉凌,隨著前60年有監(jiān)督深度學(xué)習(xí)算法的理論研究和工程化的成熟,以及硬件計算能力的大幅提升和成本的飛速降低捂人,在云計算、大數(shù)據(jù)和移動互聯(lián)網(wǎng)的融合推動下矢沿,人工智能在很多方面都有了突破性進(jìn)展滥搭。
更為重要的是,除了微軟捣鲸、IBM等大公司外瑟匆,谷歌、Facebook栽惶、百度等互聯(lián)網(wǎng)巨頭紛紛向人工智能領(lǐng)域投巨資進(jìn)行研發(fā)愁溜,各國政府也開始意識到人工智能是未來社會的戰(zhàn)略制高點(diǎn)疾嗅,甚至人工智能有可能成為未來社會的一部分。
承上啟下的AlphaGo
當(dāng)AlphaGo戰(zhàn)勝李世石的消息傳來冕象,深藍(lán)之父Murray Campbell就此評價說:“這是人工智能一個時代的結(jié)束代承。”
兩次人機(jī)大戰(zhàn)時隔20年渐扮,這其中最重要的差別在于象棋與圍棋的復(fù)雜度差異巨大论悴。人工智能之所以能夠先戰(zhàn)勝國際象棋冠軍,在于國際象棋可以窮盡接近所有可能的棋局墓律,而圍棋就不一樣了膀估。圍棋棋局究竟有多少種變化?普林斯頓的研究人員給出了一個最小的數(shù)字:19x19格圍棋的合法棋局?jǐn)?shù)為10的171次方耻讽,這個數(shù)字接近無窮大察纯。
AlphaGo對戰(zhàn)李世石
根據(jù)美國Wired網(wǎng)站長期跟蹤谷歌的記者Cade Metz的報道,AlphaGo前期通過一個已知職業(yè)棋手的3000萬步數(shù)據(jù)庫進(jìn)行訓(xùn)練针肥,在獲得相當(dāng)?shù)氖炀毝群蟊牵珹lphaGo開始用增強(qiáng)學(xué)習(xí)算法與另一個AlphaGo程序相互博弈,探索未知的但與取勝有關(guān)的棋局祖驱,用以培養(yǎng)自己的“智能”握恳。圍棋對于人工智能來說,相當(dāng)于是求解一個開放式的問題捺僻。
機(jī)器學(xué)習(xí)算法大致可以分為3種:監(jiān)督學(xué)習(xí)(如回歸乡洼、分類)、非監(jiān)督學(xué)習(xí)(如聚類匕坯、降維)和增強(qiáng)學(xué)習(xí)束昵。人工智能前60年,主要通過有監(jiān)督的深度學(xué)習(xí)算法葛峻,解決語音識別锹雏、圖像識別、自然語言理解等總樣本量有上限的相對“有窮大”問題术奖。
增強(qiáng)學(xué)習(xí)算法主要從任意初始狀態(tài)開始礁遵,機(jī)器與外部環(huán)境持續(xù)交互,通過不斷試錯和累積回報來“學(xué)習(xí)”最佳策略采记,在這個過程中外界不給予直接指導(dǎo)(監(jiān)督)佣耐,只給予間接的或是遠(yuǎn)距離的回報(Reward)。舉例來說唧龄,訓(xùn)練室內(nèi)機(jī)器人完成某個任務(wù)兼砖,在這個過程中人類并不干涉,只有當(dāng)機(jī)器人接近完成任務(wù)時才給予正反饋。
換句話說讽挟,增強(qiáng)學(xué)習(xí)算法更接近生物學(xué)習(xí)的行為特征懒叛,具有探索未知世界的能力。AlphaGo對增強(qiáng)學(xué)習(xí)算法的探索耽梅,打開了“無窮大”的大門薛窥。
語音識別走下神壇
微軟是人工智能領(lǐng)域的另一巨頭。微軟人工智能首席科學(xué)家褐墅、美國IEEE電氣和電子工程師協(xié)會院士鄧力長期投身于語音識別研究拆檬,在自動語音與說話者識別、口語識別與理解妥凳、語音-語音翻譯竟贯、機(jī)器翻譯、圖像和多模態(tài)信息處理等領(lǐng)域做出了重大貢獻(xiàn)逝钥,憑借在深度學(xué)習(xí)與自動語音識別方向的杰出貢獻(xiàn)屑那,獲得了2015年度IEEE信號處理技術(shù)成就獎。
微軟人工智能首席科學(xué)家鄧力
鄧力表示艘款,有監(jiān)督的深度神經(jīng)網(wǎng)絡(luò)已歷經(jīng)了研究與確認(rèn)持际,被認(rèn)為是能夠解決語音和圖像識別的最有效的工具』┡兀基本上到2012年的時候蜘欲,有監(jiān)督深度神經(jīng)網(wǎng)絡(luò)用于語音識別就已經(jīng)成功取得突破。當(dāng)時晌柬,微軟研究院全球院長Rick Rashid在天津成功演示了一個全自動同聲翻譯系統(tǒng)姥份,實(shí)時把英文演講翻譯成中文并以中文語音輸出。
Rick Rashid演示中的語音識別部分采用了有監(jiān)督學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)工具年碘,最先由鄧力和他的微軟同事于2009~2010間與多倫多大學(xué)的Geoffrey Hinton 教授合作開發(fā)澈歉。如今,微軟的語音識別技術(shù)已經(jīng)工程化并廣泛用于微軟的多個產(chǎn)品中屿衅。
作為中國的國家隊埃难,科大訊飛在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在語音合成涤久、語音識別涡尘、口語評測、自然語言處理等多項技術(shù)上有著國際領(lǐng)先的成果响迂。2008年6月悟衩,科大訊飛參加NIST(美國標(biāo)準(zhǔn)技術(shù)研究院)舉辦的說話人識別SRE大賽,就在3項關(guān)鍵指標(biāo)中栓拜,獲得兩項第一、一項第三、綜合評比第一的好成績幕与。
科大訊飛是中國唯一以語音技術(shù)為產(chǎn)業(yè)化方向的“國家863計劃成果產(chǎn)業(yè)化基地”挑势、“國家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)”、“國家高技術(shù)產(chǎn)業(yè)化示范工程”啦鸣,并被原信息產(chǎn)業(yè)部確定為中文語音交互技術(shù)標(biāo)準(zhǔn)工作組組長單位潮饱,牽頭制定中文語音技術(shù)標(biāo)準(zhǔn)。
基于自主知識產(chǎn)權(quán)的智能語音技術(shù)诫给,科大訊飛已推出從大型電信級應(yīng)用到小型嵌入式應(yīng)用香拉,從電信、金融等行業(yè)到企業(yè)和消費(fèi)者用戶中狂,從手機(jī)到車載凫碌、從家電到玩具等不同應(yīng)用場景的多種產(chǎn)品,還發(fā)布了“訊飛語音云”平臺胃榕。目前盛险,科大訊飛已占有中文語音技術(shù)市場70%以上市場份額,開發(fā)伙伴超過5000家勋又,以訊飛為核心的中文語音產(chǎn)業(yè)鏈已初具規(guī)模苦掘。
計算機(jī)視覺逼近拐點(diǎn)
視覺識別是人工智能的一個重要研究領(lǐng)域,沒有視覺識別能力的機(jī)器人無法真正與外界交互楔壤。2015年鹤啡,在微軟等大公司的推動下,計算機(jī)視覺已經(jīng)逼近全面突破的拐點(diǎn)蹲嚣。
ImageNet是全球頂級的計算機(jī)視覺挑戰(zhàn)賽递瑰,挑戰(zhàn)賽項目之一是對1000 類、120萬張互聯(lián)網(wǎng)圖片進(jìn)行分類端铛,每張圖片人工標(biāo)注5個相關(guān)類別泣矛,計算機(jī)識別的結(jié)果只要有一個和人工標(biāo)注類別相同就算對。對于該圖片集禾蚕,人眼辨識錯誤率大概為5.1%您朽,目前只有谷歌和微軟等個別參賽團(tuán)隊的算法能夠達(dá)到低于5%的結(jié)果。
2015年12月10日换淆,微軟亞洲研究院視覺計算組在ImageNet計算機(jī)識別挑戰(zhàn)賽中再次打破紀(jì)錄哗总,獲得圖像分類、圖像定位以及圖像檢測全部三個主要項目的冠軍倍试,將系統(tǒng)錯誤率降低至3.57%讯屈。在計算機(jī)視覺識別領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)(即為有監(jiān)督的深度學(xué)習(xí))是主要的算法县习。微軟亞洲研究院視覺計算組首席研究員孫劍介紹說涮母,他所帶領(lǐng)的研究團(tuán)隊使用了高達(dá)152層的深層卷積神經(jīng)網(wǎng)絡(luò)算法谆趾,比以往任何成功的算法層數(shù)多達(dá)5倍以上。
而在另一方面叛本,微軟亞洲研究院硬件計算組與清華大學(xué)電子工程系一直在硬件加速領(lǐng)域合作了沪蓬,從2013年開始雙方一起研究怎樣把深層卷積神經(jīng)網(wǎng)絡(luò)與智能硬件結(jié)合起來,其成果就是基于FPGA(可編程芯片)技術(shù)的A-Eye視覺芯片来候。微軟的研究表明跷叉,高端GPU的圖像處理能力是FPGA的2到3倍,但FPGA的功耗約是高端GPU的1/10营搅,多個FPGA結(jié)合能以低功耗達(dá)到GPU的處理能力云挟。
據(jù)微軟亞洲研究院硬件計算組主管研究員徐寧儀介紹,A-Eye視覺芯片包括了一個基于軟件的壓縮算法和基于FPGA芯片的硬件實(shí)現(xiàn)转质,其本質(zhì)上是通過軟件壓縮和定制的硬件加速园欣,讓計算機(jī)視覺識別算法適用于普通的智能終端∏途校基于A-Eye技術(shù)的高性能智能視覺芯片俊庇,可以廣泛用于智能安防、嬰兒和老人看護(hù)鸡挠、無人汽車和無人機(jī)等各種需要計算機(jī)視覺的領(lǐng)域辉饱。
目前卷積神經(jīng)網(wǎng)絡(luò)的圖像識別能力有賴于輸入的原始數(shù)據(jù)集,例如用花卉圖像集訓(xùn)練出來的算法就只能識別花卉拣展∨碚樱基于Bing搜索引擎的大數(shù)據(jù),接下來微軟正在探索通用型視覺識別算法和工程化實(shí)現(xiàn)备埃。一旦工程化實(shí)現(xiàn)了通用型視覺識別技術(shù)姓惑,智能機(jī)器張眼看世界的那一天就不遠(yuǎn)了。
開始探索情感算法
整個人工智能研究的起源按脚,在于一個基本的假設(shè)于毙,即能夠用機(jī)械的方式模仿人類的思維。人工智能前60年辅搬,就在這個方向上不斷地探索唯沮。但是,能否用機(jī)械的方式模仿人類的感情呢堪遂?
情感的表達(dá)遠(yuǎn)非“0”或“1”那么簡單介蛉,就像人類的愛情絕非對與錯那樣絕對。如何讓機(jī)器理解人類的情感溶褪,又如何把情感與知識進(jìn)一步結(jié)合币旧,發(fā)展出全新的計算架構(gòu)?情感計算前進(jìn)之路更加艱難猿妈,直到微軟“小冰”的出現(xiàn)吹菱。
微軟小冰有可能成為有史以來首個情感算法機(jī)器人
最開始作為一個聊天機(jī)器人巍虫,微軟小冰由微軟亞洲互聯(lián)網(wǎng)工程院開發(fā),2014年5月29日毁葱,一代小冰開始了微信公測垫言,在3天內(nèi)贏得了超過150萬個微信群、逾千萬用戶的喜歡倾剿。2015年8月20日,第三代微軟小冰正式發(fā)布蚌成。2015年11月小冰發(fā)布了計算視覺功能前痘,從此,小冰還能根據(jù)圖片和視頻與用戶聊天担忧。
然而芹缔,微軟小冰的意義絕不僅僅是聊天機(jī)器人。微軟全球執(zhí)行副總裁沈向洋說瓶盛,希望小冰成為一個慢慢融入人類社會的機(jī)器人最欠、每一個用戶的個人助手,而且是一個真正通過情感計算惩猫,理解用戶芝硬、能夠交流、能夠溝通的人工智能機(jī)器人轧房。在更深層上拌阴,微軟小冰正在成為整個微軟的人工智能基礎(chǔ)設(shè)施,小冰的研究成果正擴(kuò)散到微軟產(chǎn)品與服務(wù)的方方面面奶镶。
初步統(tǒng)計迟赃,僅在微軟亞洲研究院就有將近15個研究團(tuán)隊與負(fù)責(zé)小冰的算法研究,而包括以色列厂镇、紐約纤壁、休斯頓總部的微軟研究院也正為小冰提供技術(shù)支持,涉及包括大數(shù)據(jù)捺信、自然語言互動酌媒、計算機(jī)視覺、SR(語音識別)残黑、TTS(文字到語音轉(zhuǎn)換)馍佑、IoT等十幾個領(lǐng)域。
想象一下梨水,未來的家庭里將出現(xiàn)智能手表拭荤、智能音箱、智能電視機(jī)疫诽、智能冰箱舅世、智能燃?xì)獗淼┪⒅悄芡婢叩榷喾N智能設(shè)備,人們無法再通過一個個APP與這些智能設(shè)備溝通雏亚,就必須出現(xiàn)一個超級APP來管控所有的智能設(shè)備缨硝,微軟小冰就有望成為這樣的超級人機(jī)交互界面。
從底層芯片突破人工智能
2016年3月24日罢低,在ARM公司與重慶市的戰(zhàn)略合作簽約儀式上查辩,重慶市長黃奇帆在致辭中表示“一切人工智能的源頭,集中在芯片上”网持。
黃奇帆市長可能沒有意識到宜岛,這個論斷也是未來60年人工智能發(fā)展的重要主題之一。在人工智能前60年的發(fā)展中功舀,馮·諾依曼架構(gòu)的瓶頸已經(jīng)成為共識萍倡,在接下來的60年里,如何打破馮·諾依曼架構(gòu)的瓶頸辟汰,已經(jīng)成為各大公司和各國政府戰(zhàn)略級的研究項目列敲。
IBM TrueNorth神經(jīng)元芯片
2014年8月,IBM研究院在《科學(xué)》雜志上介紹了一款名為“TrueNorth”神經(jīng)元芯片帖汞,它從底層模仿了人腦結(jié)構(gòu)而且用普通半導(dǎo)體材料就能制造出來戴而。TrueNorth表面上看起來和普通處理器沒有太大區(qū)別,它的核心區(qū)域內(nèi)擠滿了4096個處理核心涨冀,用來模擬超過百萬個人腦神經(jīng)元和2.56億個神經(jīng)突觸填硕。
2008年初,IBM TrueNorth研究項目獲得了美國五角大樓高級計劃研究局(DARPA)的5300萬美元資助鹿鳖,DARPA認(rèn)為這項研究有助于突破馮·諾伊曼計算機(jī)體系扁眯。TrueNorth由三星代工生產(chǎn),具備量產(chǎn)的基礎(chǔ)翅帜∫鎏矗基于TrueNorth芯片,IBM已經(jīng)研發(fā)出了神經(jīng)元計算機(jī)原型機(jī)涝滴,能夠以低功耗實(shí)現(xiàn)更高準(zhǔn)確率的圖像識別绣版、視頻處理等人工智能關(guān)鍵性功能。
2015年4月歼疮,IBM研究院Mark Ritter在他的一篇博客中杂抽,介紹了IBM在量子計算機(jī)方面的研究突破。IBM的T.J.沃森研究實(shí)驗室的一組科學(xué)家和工程師韩脏,正處于開發(fā)首臺真正量子計算機(jī)的前沿缩麸。2015年4月,這個團(tuán)隊在科學(xué)雜志《Nature Communications》(《自然通訊》)上發(fā)布了一篇重要的論文赡矢,介紹了在實(shí)現(xiàn)可行性量子計算機(jī)中的兩個關(guān)鍵性進(jìn)展杭朱。
1981年在MIT召開的首屆量子計算會議上阅仔,諾貝爾獎獲得者Feynman挑戰(zhàn)科學(xué)家們研究量子計算機(jī)。與現(xiàn)代計算科學(xué)的方式方法截然不同弧械,在量子計算前提下八酒,整個計算基礎(chǔ)設(shè)施必須被重新想象與重構(gòu)。除了IBM外刃唐,谷歌與微軟也集合了科學(xué)家與高校的力量投入量子計算的研究羞迷。Mark Ritter認(rèn)為,IBM有望首先實(shí)現(xiàn)量子計算機(jī)画饥,而當(dāng)前正在進(jìn)入量子計算研究的黃金時代闭树。
除了遠(yuǎn)期的神經(jīng)元芯片和量子計算機(jī)外,NVIDIA荒澡、Intel、ARM等公司通過改進(jìn)現(xiàn)有的芯片設(shè)計与殃,把人工智能推進(jìn)到底層芯片中单山。NVIDIA的GPU被用于數(shù)據(jù)中心的大規(guī)模分布式機(jī)器學(xué)習(xí)環(huán)境,區(qū)別于傳統(tǒng)CPU的Intel Xeon Phi更強(qiáng)調(diào)與CPU協(xié)同工作的GPU技術(shù)幅疼,而在移動互聯(lián)網(wǎng)時代遙遙領(lǐng)先的ARM則在智能汽車米奸、可穿戴設(shè)備、智能家電爽篷、物聯(lián)網(wǎng)悴晰、工業(yè)裝置等領(lǐng)域圍繞未來人工智能場景來思考一代又一代的芯片設(shè)計。
ARM全球CEO Simon Segars在接受采訪時表示逐工,必須以更具成本效益的方式實(shí)現(xiàn)人工智能應(yīng)用铡溪,只有當(dāng)AI的成本和價格是普通人都能夠承擔(dān)時,AI才是真正達(dá)到了人們期望的目標(biāo)泪喊。2016年3月棕硫,ARM宣布與臺積電合作展開7nm芯片的研究,能以更高性價比廣泛應(yīng)用于智能終端和數(shù)據(jù)中心袒啼,預(yù)計在2017~2019年量產(chǎn)哈扮。目前,其它芯片公司還停留在10nm芯片的競爭蚓再。此外滑肉,ARM還加入了由Facebook發(fā)起的開源硬件項目OCP,該項目邀請開源硬件社區(qū)共同設(shè)計下一代數(shù)據(jù)中心的硬件設(shè)備摘仅,ARM就在與Paypal聯(lián)合開發(fā)低功耗的定制化芯片靶庙。
創(chuàng)業(yè)者把AI擴(kuò)散到社會的每一個角落
隨著AlphaGo在全社會引起了巨大的反響,新一輪人工智能創(chuàng)業(yè)潮正在醞釀中实檀。2016年3月26日惶洲,科大汛飛與專注天使輪投資的阿爾法公社宣布了AI領(lǐng)域聯(lián)合天使投資計劃按声,未來將在AI領(lǐng)域展開批量投資√衤溃科大訊飛高級副總裁江濤表示签则,在未來社會里AI將成為水和電一樣的基礎(chǔ)性資源,創(chuàng)業(yè)者們將把AI擴(kuò)散到社會的方方面面铐料。
阿爾法公社與科大訊飛聯(lián)合宣布批量支持AI創(chuàng)業(yè)
為什么說AI將成為基礎(chǔ)性社會資源渐裂?原因很簡單,今天的互聯(lián)網(wǎng)已經(jīng)成為了基礎(chǔ)性的社會資源钠惩。而在萬物互聯(lián)網(wǎng)時代柒凉,物聯(lián)網(wǎng)的規(guī)模遠(yuǎn)遠(yuǎn)大于今天的互聯(lián)網(wǎng)。除了接入現(xiàn)有的互聯(lián)網(wǎng)設(shè)備外篓跛,未來的物聯(lián)網(wǎng)還將接入大量機(jī)器對機(jī)器(M2M)網(wǎng)絡(luò)膝捞。在一個更為復(fù)雜和龐大的物聯(lián)網(wǎng)前提下,人工智能就必須成為整個物聯(lián)網(wǎng)的關(guān)鍵組成部分愧沟,進(jìn)而成為基礎(chǔ)性資源稚叹。
如果說過去的人工智能創(chuàng)業(yè)必須要在基礎(chǔ)科研層面有所突破祠肥,如今這個壁壘已經(jīng)被打破。谷歌、微軟鞭光、Facebook等大公司以及卡耐基·梅隆大學(xué)拆又、NYU等高校紛紛開源核心的機(jī)器學(xué)習(xí)算法第献,谷歌的TensorFlow囊拜、微軟的DMTK、Facebook的Torch究孕、卡耐基·梅隆大學(xué)的Petuum啥酱、加州伯克利分校的Caffe等,都提供了成熟的人工智能和深度學(xué)習(xí)算法模塊蚊俺。而IBM Watson認(rèn)知計算云服務(wù)懈涛,本身就是以低價格向全社會大規(guī)模輸出人工智能的能力。
值得注意的是泳猬,大公司開源出來的機(jī)器學(xué)習(xí)算法并不是簡單的宣傳“噱頭”批钠,而是貨真價實(shí)的“干貨”。微軟開源版DMTK包含了目前世界上最大規(guī)模的主題模型和分布式詞向量模型得封,DMTK還是分布式機(jī)器學(xué)習(xí)工具埋心,讓創(chuàng)業(yè)者很簡單就在多機(jī)環(huán)境甚至是集群系統(tǒng)中部署大規(guī)模機(jī)器學(xué)習(xí)算法,大幅降低了機(jī)器學(xué)習(xí)創(chuàng)業(yè)的門檻忙上。為什么這么多大公司都紛紛開源自己的核心機(jī)器學(xué)習(xí)算法呢拷呆?原因很簡單:爭奪下一個生態(tài)。
當(dāng)然,也有人擔(dān)心大公司將壟斷未來的人工智能社會茬斧。2015年12月12日腰懂,特斯拉CEO Elon Musk在Twitter上宣布正式啟動非盈利人工智能項目OpenAI。OpenAI是一個非營利性的人工智能研究公司项秉,目標(biāo)是“推動數(shù)字智能的發(fā)展绣溜,同時不被財務(wù)回報所限制,從而造福整個人類”娄蔼。OpenAI籌措了10億美元作為經(jīng)費(fèi)怖喻,從谷歌等公司挖來了人工智能專家,專門研究人工智能技術(shù)并答應(yīng)無償公開岁诉。顯然锚沸,OpenAI是人工智能創(chuàng)業(yè)的又一劑強(qiáng)心針。
另一方面涕癣,人工智能創(chuàng)業(yè)迎來黃金期哗蜈,還有另一個時代背景。微軟亞洲研究院人工智能研究組首席研究員坠韩、卡耐基·梅隆大學(xué)博士生導(dǎo)師劉鐵巖告訴記者恬叹,近年來全球機(jī)器學(xué)習(xí)領(lǐng)域的三大趨勢包括更大規(guī)模的機(jī)器學(xué)習(xí)、更深度的機(jī)器學(xué)習(xí)以及更強(qiáng)交互性的機(jī)器學(xué)習(xí)同眯,這些都是基于大數(shù)據(jù)與云計算的興起。正是因為廉價的云計算和大數(shù)據(jù)技術(shù)唯鸭,人工智能才有可能擴(kuò)散到社會的每一個角落须蜗。