人工智能時代枚赡,我們能做什么谷誓?

姓名:李濤

學(xué)號:17021211100

轉(zhuǎn)載自http://mp.weixin.qq.com/s/tGMppO0KXOP_5nWVr5suZA有修改

【嵌牛導(dǎo)讀】:微軟亞洲研究院常務(wù)副院長芮勇在《新智元:機器+人類=超智能時代》書中暢想人工智能發(fā)展6大階段迫横,詳細(xì)介紹微軟語音識別鸦难、圖像識別、牛津計劃等多項人工智能項目员淫。芮勇指出,越來越多的科技公司都在開放或開源核心的人工智能技術(shù)击敌。微軟已經(jīng)開放了很多人工智能技術(shù)介返,包括我在上文中提到的牛津計劃,還包括Azure Machine Learning,以及不久前亞洲研究院開源的分布式機器學(xué)習(xí)工具包DMTK圣蝎。我們不僅僅是開源某一個具體的算法刃宵,我們其實開源了一整套的分布式訓(xùn)練框架,使得任何別的機器學(xué)習(xí)的算法能在一個更大規(guī)模的分布式的系統(tǒng)上更加便利地進(jìn)行計算徘公。人工智能時代不能只憑個人牲证,研究者、企業(yè)关面、機構(gòu)要溝通合作坦袍,實現(xiàn)技術(shù)的指數(shù)爆炸。

【嵌牛鼻子】:人工智能

【嵌牛提問】:人工智能對于生活的影響等太?

【嵌牛正文】:

C新智元推薦

來源:《新智元:機器+人類=超智能時代

【新智元導(dǎo)讀】

芮勇博士現(xiàn)任微軟亞洲研究院常務(wù)副院長捂齐。在此之前,芮勇博士在美國微軟總部工作了7年缩抡,先后擔(dān)任微軟亞太研發(fā)集團(tuán)首任戰(zhàn)略總監(jiān)奠宜、研發(fā)總監(jiān),以及微軟亞洲工程院副院長及微軟亞太研發(fā)集團(tuán)中國創(chuàng)新孵化部總經(jīng)理瞻想。芮勇在微軟的17年涵蓋了企業(yè)研發(fā)的四大支柱:戰(zhàn)略制定压真、基礎(chǔ)科研、創(chuàng)新孵化及產(chǎn)品開發(fā)蘑险。芮勇是國際電氣電子工程學(xué)會會士(IEEE Fellow)滴肿、國際模式識別學(xué)會會士(IAPR Fellow)、國際光學(xué)工程學(xué)會會士(SPIE Fellow)和國際計算機協(xié)會杰出科學(xué)家(ACM Distinguished Scientist)漠其。芮勇?lián)螄H多媒體權(quán)威學(xué)刊IEEE Multimedia Magazine主編嘴高,他還是許多一流國際會議的組織委員會和程序委員會主席。

微軟亞洲研究院的人工智能2015

人工智能的春天又回來了和屎。

近幾年拴驮,大數(shù)據(jù)、機器學(xué)習(xí)和云計算等新興技術(shù)的發(fā)展讓人工智能的影響力日益壯大柴信,業(yè)界關(guān)于人工智能的討論和嘗試也非常多樣套啤。身為在計算機領(lǐng)域探索多年的研究人員,我認(rèn)為這一現(xiàn)象非常鼓舞人心随常,我們誠然生活在一個“技術(shù)的黃金時代”潜沦。

人工智能的英文是Artificial Intelligence,簡稱AI绪氛。1956年唆鸡,在達(dá)特茅斯學(xué)院舉行的一次會議上正式確立了人工智能(Artificial Intelligence)的名稱,以及研究領(lǐng)域和任務(wù)枣察。這次會議影響深遠(yuǎn)争占,該會議的組織者包括馬文·明斯基(Marvin Minsky)和約翰·麥卡錫(John McCarthy)等人燃逻,他們和這次會議的其他與會者們一起成為了人工智能最早的一批研究先驅(qū)。

今年是2016年臂痕,距離達(dá)特茅斯會議已經(jīng)過去了整整60年伯襟。中國古代紀(jì)年法中,用十天干和十二地支相組合握童,60年便是一個輪回姆怪,稱為六十甲子。人工智能在誕生之后經(jīng)歷了黃金年代澡绩,經(jīng)歷了20世紀(jì)70年代中后期的低谷稽揭,經(jīng)歷了短暫的繁榮,也經(jīng)歷了人工智能的寒冬英古。如今淀衣,人工智能再次回春,六十甲子一輪回召调,因此對于我們來說搞监,2016年更是人工智能技術(shù)的一個新的開端桶雀,我最大的心愿便是在2016年這個新輪回開始的第一年达舒,能看到劃時代的研究進(jìn)展和突破灿渴。

如今,人工智能已經(jīng)不是一個僅屬于研究機構(gòu)和學(xué)者們的概念艺沼,而是逐步進(jìn)入我們的生活册舞,這些技術(shù)大多數(shù)時候默默地站在幕后,悄無聲息地改善著人們的計算體驗障般。過去的2015年调鲸,在微軟眾多對外發(fā)布的產(chǎn)品和服務(wù)中,我們都能找到人工智能的影子挽荡,這也離不開微軟亞洲研究院在計算機基礎(chǔ)研究領(lǐng)域日復(fù)一日的耕耘藐石,用一次又一次的研究突破,用開放的心態(tài)積極與社會各界展開合作定拟,一起共同推動整個計算機行業(yè)的技術(shù)進(jìn)步與革新于微。

人機交互的第一入口:語音識別

人工智能都可以幫助人做些什么呢?長久以來青自,語言一直都是人與人之間交流的障礙株依,那么能否讓人工智能充當(dāng)人與人之間的翻譯呢?微軟推出的Skype Translator 實時語音翻譯系統(tǒng)就成功滿足了這一類需求延窜。

早在2012年10月25日恋腕,在由微軟亞洲研究院主辦的第十四屆“二十一世紀(jì)的計算大會”現(xiàn)場,我們首次公開演示了微軟實時語音翻譯技術(shù)逆瑞。時任微軟研究院全球負(fù)責(zé)人的Rick Rashid在用英語演講時吗坚,現(xiàn)場的國內(nèi)觀眾們卻借助了神奇的實時語音翻譯工具祈远,聽到了用Rashid的原音講述的漢語普通話。當(dāng)時的語音識別系統(tǒng)在演示中實現(xiàn)了小于7%的誤差率商源,幾乎與真人做字對字筆錄時的水平相當(dāng)。

這次展示很明確地預(yù)示了深層神經(jīng)網(wǎng)絡(luò)語音識別和實時語音翻譯時代的到來谋减。隨后牡彻,這一技術(shù)原型便迅速被轉(zhuǎn)化成產(chǎn)品,成功應(yīng)用到了Skype Translator中出爹。在微軟亞洲研究院的團(tuán)隊和美國的同事們的密切合作下庄吼,2015年4月,Skype Translator 實時語音翻譯的中文預(yù)覽版登錄中國严就,讓英文和中文普通話之間的實時語音對話變?yōu)楝F(xiàn)實总寻。

在Skype Translator上我們可以看到深度學(xué)習(xí)技術(shù)對語音識別準(zhǔn)確度毋庸置疑地提升。如今在較為理想的環(huán)境中梢为,語音識別的準(zhǔn)確度已經(jīng)在95%以上渐行,與人類的識別能力相差無幾。但對于語音識別領(lǐng)域的研究來說铸董,仍有一些亟待解決的問題祟印。當(dāng)計算機處于較為嘈雜的環(huán)境,或是麥克風(fēng)收音效果較弱的情況下粟害,識別準(zhǔn)確度便大大降低蕴忆。

一個被稱為“雞尾酒會效應(yīng)”的問題能夠很好地描述這種情況。如果我們正在參加一場雞尾酒會悲幅,和七八個人同時交談套鹅,那么如果我們想主要聽某一個人的發(fā)言時,我們?nèi)祟惥湍茏詣舆^濾其他人的發(fā)言汰具,讓我們的注意力集中在這個人的發(fā)言內(nèi)容上卓鹿。可是當(dāng)計算機處于這種環(huán)境下時郁副,面對多個聲音交織的情況减牺,想要辨別出特定某人的聲音并識別出來還是十分困難的。

其實存谎,語音識別只是一個開始拔疚。計算機把人類的語音識別出來,將音頻信號轉(zhuǎn)化成文字信號的這個過程必然意義重大既荚,但這并不代表計算機真正理解了這句話的意思稚失。因此語音識別的下一步便是對語義的理解。我所提到的這個語義理解可能比我們通常所說的自然語言理解層次更高一些恰聘、難度更大一些句各。因為面對同一句話吸占,如“我想靜靜”或者“他要請我吃飯”,不同的語調(diào)凿宾、語氣矾屯、重音都會帶來不一樣的理解。因此我說的語言理解是包括從語音到語義初厚,直至理解句子的言外之意這一整套過程的件蚕,這在技術(shù)實現(xiàn)上還有一條很長的路要走。

說起語音識別产禾,其實不僅是微軟排作,行業(yè)內(nèi)各大公司都會把它放在一個首要的基礎(chǔ)位置上。如果說實現(xiàn)人工智能是我們的最終目標(biāo)亚情,那么語音識別技術(shù)很可能就是人工智能的一個關(guān)鍵入口妄痪。為什么我會這么說呢?對于技術(shù)公司來說楞件,成為平臺型公司一直是努力的目標(biāo)衫生。例如,操作系統(tǒng)就是一個很好的平臺履因。時下我們也能看到一些很好的平臺障簿,如電商平臺、搜索平臺栅迄,還有人與人之間交流的平臺等站故,與之對應(yīng)的國內(nèi)有BAT,國外的微軟毅舆、谷歌西篓、Facebook、亞馬遜憋活,都擁有自己的核心平臺岂津。那么下一個平臺會是什么呢?

我認(rèn)為悦即,人工智能時代吮成,一個人工智能助手將會成為一個很好的平臺,就像《星球大戰(zhàn)》中的BB-8辜梳,或者鋼鐵俠中的賈維斯(Jarvis)粱甫。人們與人工智能助手最常見的交互方式就包括語言的交互。那么想要做好人工智能助手作瞄,語音識別和自然語言處理可能就會成為這個平臺入口的核心茶宵。

借一雙慧眼:計算機視覺

近年來,深層神經(jīng)網(wǎng)絡(luò)的復(fù)興為計算機帶來的革命突破不僅是語音識別宗挥,還有計算機視覺乌庶。人類所獲取的外部信息70%都來自于視覺种蝶,人類與周圍世界的溝通和交互極其依賴圖像。當(dāng)計算機也能“睜開雙眼”看懂世界瞒大,計算機離智能也就更近了一步螃征。

那么,目前計算機視覺系統(tǒng)有多精確呢糠赦?2015年1月会傲,微軟亞洲研究院的一個四人計算視覺小組成員在ImageNet計算視覺識別挑戰(zhàn)賽中便實現(xiàn)里程碑式突破,計算機識別物體的能力首次超過人眼拙泽,系統(tǒng)錯誤率已經(jīng)低至4.94%。而在此前同樣的實驗中裸燎,人眼辨識的錯誤率大概為5.1%顾瞻。

ImageNet計算機視覺挑戰(zhàn)賽由來自全球頂尖高校和公司的研究員組織舉辦,近年來已經(jīng)成為計算機視覺領(lǐng)域的標(biāo)桿德绿,其比賽結(jié)果總能十分直觀地反映出計算機視覺這一熱門領(lǐng)域中各研究機構(gòu)的研究進(jìn)展和突破荷荤。在ImageNet比賽中成功登頂并超越人類,在計算機視覺研究上意義重大移稳。

當(dāng)然研究員們并不僅以超越人類的識別能力為目標(biāo)蕴纳。到了2015年12月,在微軟亞洲研究院首席研究員孫劍的帶領(lǐng)下个粱,這個四人研究小組再次做出突破古毛,以絕對優(yōu)勢獲得圖像分類、圖像定位及圖像檢測全部三個主要項目的冠軍都许,該系統(tǒng)識別錯誤率已經(jīng)低至3.57%稻薇。同一時刻,他們在另一項圖像識別挑戰(zhàn)賽MS COCO(Microsoft Common Objects in Context胶征,常見物體圖像識別)中同樣成功登頂塞椎,在圖像檢測和圖像分割項目上擊敗了來自學(xué)界、企業(yè)和研究機構(gòu)的眾多參賽者睛低。

這兩個挑戰(zhàn)賽的側(cè)重點各有不同:ImageNet 傾向于評測識別圖像中顯著物體的能力案狠,而MS COCO傾向于評測識別復(fù)雜場景中各類物體的能力。能同時在兩個世界級的比賽中獲得冠軍钱雷,足以說明研究組的技術(shù)突破是通用的骂铁,那么是何種技術(shù)讓他們在計算機視覺領(lǐng)域中的研究屢獲突破呢?

答案是研究員們構(gòu)建了一個152層的深層殘差網(wǎng)絡(luò)(Deep Residual Networks)急波,他們還使用了一個全新的“殘差學(xué)習(xí)”原則來指導(dǎo)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計从铲。殘差學(xué)習(xí)最重要的突破在于重構(gòu)了學(xué)習(xí)的過程,并重新定向了深層神經(jīng)網(wǎng)絡(luò)中的信息流澄暮。殘差學(xué)習(xí)很好地解決了此前深層神經(jīng)網(wǎng)絡(luò)層級與準(zhǔn)確度之間的矛盾名段。這個深層殘差網(wǎng)絡(luò)顯示出了非常強的通用性阱扬,藉由此次的突破,相信會有更多的研究人員們能夠從中汲取靈感伸辟。

聚沙成塔:牛津計劃麻惶,開放的人工智能技術(shù)平臺

假設(shè)我們現(xiàn)在有一位開發(fā)人員,他想開發(fā)出一個健身類的應(yīng)用信夫,他有很多新奇的想法窃蹋,想要開發(fā)出很多有趣的功能放進(jìn)自己的應(yīng)用中,如從照片中識別出用戶静稻,或者理解鍛煉者的語音指令警没。但是這些多樣的功能都只能通過復(fù)雜先進(jìn)的機器學(xué)習(xí)來實現(xiàn),而這位開發(fā)人員卻沒有實現(xiàn)它們所需的時間或資源振湾。在這個時候杀迹,如果有一個這樣的智能平臺把這些技術(shù)開放出來就會非常高效。

微軟在人工智能押搪、語音識別树酪、計算機視覺上投入巨大,并已經(jīng)在相關(guān)領(lǐng)域取得了很多優(yōu)秀的研究成果大州,我們也非常想把一些核心技術(shù)放在這樣一個智能平臺上续语,使得第三方的開發(fā)者更容易站在巨人的肩膀上,而不再是從零開始厦画,他們可以更專注于他們想開發(fā)的應(yīng)用疮茄,而人工智能的核心技術(shù)就直接從我們的平臺上使用就可以了。現(xiàn)在我們開放出了這樣的一個平臺苛白,我們稱為Project Oxford娃豹,牛津計劃。

微軟牛津計劃是由一系列基于云的機器學(xué)習(xí)相關(guān)的API购裙、SDK和相關(guān)服務(wù)等組成懂版,自2015年4月推出以來,這個平臺目前已經(jīng)涵蓋了很多人工智能的方向躏率,包括視覺躯畴、語音和語言等。在視覺方面薇芝,我們有對圖形的理解蓬抄、分析和處理。有對人臉的識別夯到、檢測嚷缭、驗證等,甚至包括人臉面部情緒的分析。此外還有視頻中的人臉追蹤阅爽、運動檢測等路幸。在語音方面,有語音識別付翁、聲紋識別简肴。在語言方面,有拼寫檢查百侧、語言理解等功能砰识。

2015年,有一個火爆全球的“顏齡”測試應(yīng)用叫“How-old.net”佣渴,它會基于你上傳的照片辫狼,利用人臉定位技術(shù)檢測照片中人臉的特征點,根據(jù)特征點猜測人的顏齡辛润。這個應(yīng)用其實就是微軟的兩位工程師利用牛津計劃中人臉識別API開發(fā)的予借,整套解決方案也就花了幾個小時的時間,代碼也才不到20行频蛔,搭建起來十分迅速。于是在網(wǎng)站建成后的幾小時時間里秦叛,成千上萬的用戶瘋狂傳播晦溪,席卷全球,它的受歡迎程度也完全超乎我們的想象挣跋。牛津計劃中的面部表情分析也十分有用三圆,它能讓計算機學(xué)會“察言觀色”,觀察出你面部表情的變化來計算出你情緒的變化避咆,開發(fā)人員就可以基于此輕松開發(fā)出許多有趣的應(yīng)用了舟肉。

微軟牛津計劃自2015年的Build開發(fā)者大會首次推出以來經(jīng)歷了多次更新,更多的功能被逐步添加進(jìn)來查库,這其中也少不了包括微軟亞洲研究院在內(nèi)多個技術(shù)團(tuán)隊的支持路媚。2016年3月在Build開發(fā)者大會上,也推出了更多的功能更新樊销。

聚合的智能:微軟AI姐妹花小冰小娜

1991年整慎,微軟研究院創(chuàng)立時,比爾·蓋茨希望研究院能夠致力于讓未來的計算機能夠看围苫、聽裤园、學(xué),能用自然語言與人類進(jìn)行交流剂府。這是一個與AI研究關(guān)聯(lián)緊密的夢想拧揽。二十多年來,我們時刻在為之努力。當(dāng)計算機對人類多種感官的模擬不斷完善聚合淤袜,一個聚合智能的人工智能助手就這樣誕生了痒谴。

在微軟,有一對人工智能姐妹花叫小冰和小娜饮怯。小冰是微軟(亞洲)互聯(lián)網(wǎng)工程院開發(fā)闰歪,集合了微軟亞洲研究院眾多研究成果的一款人工智能聊天機器人。微軟小娜則是微軟(亞洲)互聯(lián)網(wǎng)工程院基于Cortana蓖墅,深度本地化再創(chuàng)新的一款人工智能個人助理库倘,扮演的是知書達(dá)理的女秘書形象,幫助用戶做好日常的行程計劃安排论矾。

小冰和小娜可謂是集大成的人工智能機器人教翩,她們將看、聽贪壳、說等類似于感官所獲得的信息融為一體饱亿,共同形成接近于人的感知和一定程度的認(rèn)知。而對于這種集大成的智能闰靴,我們稱為聚合的智能彪笼。你可能覺的這些技能看著很簡單,其實在她的背后融合了計算機圖像識別蚂且、語音識別配猫、自然語言處理、文本轉(zhuǎn)語音杏死、機器學(xué)習(xí)泵肄、社交網(wǎng)絡(luò)情感計算等不同方向的人工智能技術(shù)多年來的累積和沉淀。而這些能力的組合淑翼,便是人工智能的智力集合腐巢。微軟亞洲研究院的技術(shù)更像是幕后的隱形人,你雖然看不見他們的運作流程玄括,但在和小冰對話的過程中卻能潛移默化地感受到技術(shù)的神奇冯丙。

以圖片識別為例,小冰就采用了微軟亞洲研究院視覺計算組開發(fā)的基于深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)的計算機視覺算法系統(tǒng)惠豺,將我們在ImageNet挑戰(zhàn)賽中的成功經(jīng)驗用于其中银还。在語義分析環(huán)節(jié),小冰通過深層神經(jīng)網(wǎng)絡(luò)等的機器學(xué)習(xí)算法洁墙,不斷學(xué)習(xí)過去的歷史信息蛹疯,建立相應(yīng)的數(shù)學(xué)模型。通過機器學(xué)習(xí)互聯(lián)網(wǎng)和社交平臺等文本內(nèi)容热监,進(jìn)行數(shù)據(jù)挖掘得出相關(guān)的主題捺弦,這是機器學(xué)習(xí)和文本理解的基礎(chǔ)。在決策環(huán)節(jié),小冰采用了多種聯(lián)合決策機制列吼,以實現(xiàn)帶有情感的高效機器決策幽崩。這其中采用了分布式詞向量訓(xùn)練模型算法,更好地計算兩個詞之間的“情感距離”寞钥,以關(guān)系的“遠(yuǎn)近”幫助小冰更好地決策慌申。在輸出環(huán)節(jié),小冰大量學(xué)習(xí)人類的表達(dá)方式理郑,從中識別出帶有不同情感色彩的表達(dá)方式蹄溉,再結(jié)合不同對話的上下文語境,以個性化的語言方式表達(dá)出來您炉。

正是大數(shù)據(jù)柒爵、深度神經(jīng)網(wǎng)絡(luò)等技術(shù)的發(fā)展與突破,讓小冰兼具“有趣”與“有用”赚爵,實現(xiàn)了超越簡單人機對話的自然交互棉胀,并以此與用戶建立了強烈的情感紐帶。現(xiàn)在微軟小冰從最初不到100萬的使用人數(shù)到現(xiàn)在的4000萬人冀膝,而人類用戶與小冰的平均每次對話輪數(shù)也高達(dá)23輪唁奢。而此前最領(lǐng)先的同類人工智能機器人,平均對話輪數(shù)僅有1.5~2輪窝剖。你可以設(shè)想一下驮瞧,在平時,大部分情況下人與人的溝通回合也未必能達(dá)到23次枯芬,但跟小冰這個機器人竟能聊這么久,可見用戶和小冰之間有著非常強烈的情感聯(lián)系采郎。

目前微軟小冰和小娜已經(jīng)登錄了多個平臺千所,也包括?iOS 和?Android 平臺。所以目前小冰和小娜是支持跨平臺蒜埋、跨設(shè)備的淫痰,你在一臺設(shè)備下設(shè)定任務(wù),另外一個設(shè)備能夠同步為你服務(wù)整份。今天微軟可能是唯一一家有跨設(shè)備待错、跨平臺助手的公司。

那么未來像小冰和小娜這樣的人工智能助理應(yīng)該如何發(fā)展呢烈评?對于人工智能助理又應(yīng)該有哪些衡量標(biāo)準(zhǔn)呢火俄?我認(rèn)為這其中有三個“度”,分別是廣度讲冠、深度和溫度瓜客。

第一是有廣度,它的知識面越來越寬了,可能上到天文地理谱仪,下到日常生活玻熙,無論是什么話題,她都能和你聊起來疯攒。第二是深度嗦随,它不僅什么東西都知道,在一些專門的領(lǐng)域還能做得特別深入敬尺,就像我們?nèi)祟愐粯用赌帷H祟惗加凶约翰煌膶iL,幾年之后人工智能助手也能像人一樣“有所長”筷转,如能夠擔(dān)任你的工作助理姑原,或是醫(yī)療助理、語言學(xué)習(xí)助理等呜舒。第三個度是溫度锭汛,人工智能助手和你能有情感層面的交流,它知道在你生日的時候為你準(zhǔn)備驚喜袭蝗,也知道如果你之前睡眠質(zhì)量不好或睡太晚唤殴,今天會提醒你早點休息,或是給一些助眠建議到腥。

當(dāng)人工智能助理有了廣度朵逝、深度和溫度,我們理想的人工智能便離我們不遠(yuǎn)了乡范。

2016年配名,人工智能的新紀(jì)元

人工智能的春天再次來臨,關(guān)于人工智能的過論也越來越多晋辆。對于大眾來說渠脉,對人工智能技術(shù)的發(fā)展現(xiàn)狀還是一知半解的。人工智能威脅論瓶佳,比如他們會取代人類的很多工作芋膘,如好萊塢電影中常見的人工智能最后反過來控制人類等,大家對人工智能有種陌生的敬畏感霸饲。但反過來人們也是非常期待人工智能的为朋,因此在接觸到現(xiàn)實生活中的人工智能產(chǎn)品時,又往往會產(chǎn)生落差感厚脉。

為了方便大家理解人工智能發(fā)展到了什么程度习寸,有人提議以人的年齡作為評判依據(jù),試圖找到現(xiàn)在人工智能的智力水平究竟相當(dāng)于人類多少歲的智力水平傻工。事實上這個問題是無法回答的融涣,因為目前的人工智能可以戰(zhàn)勝50多歲的國際象棋特級大師童番,但人工智能目前的學(xué)習(xí)能力與正在每天吸收新知識的5歲入學(xué)兒童是完全無法相提并論的。那么我們究竟應(yīng)該認(rèn)為人工智能現(xiàn)在是50歲呢威鹿,還是5歲都不到呢剃斧?

我們從上面這個問題可以看到,人工智能發(fā)展目前所面臨的挑戰(zhàn)和障礙巨大忽你,實現(xiàn)人工智能道阻且長幼东,但歸根結(jié)底制約人工智能研究的有3個主要因素

實現(xiàn)人工智能科雳,道阻且長

首先是理論框架的制約根蟹,目前在理論和算法上我們還有很大的提升空間。例如糟秘,以今天最成功的深度學(xué)習(xí)為例简逮,它的理論框架也存在一定的問題。例如尿赚,深度學(xué)習(xí)今天都用的是BP算法散庶,它的網(wǎng)絡(luò)結(jié)構(gòu)都是往前連接的,目標(biāo)函數(shù)也都只有一個凌净。但機器學(xué)習(xí)中有很多別的理論不是這樣的結(jié)構(gòu)悲龟,它們的目標(biāo)函數(shù)也是不一樣的,它的梯度下降算法也是不一樣的冰寻。為什么深度學(xué)習(xí)就始終保持著一個結(jié)構(gòu)须教、一個目標(biāo)函數(shù)來做呢?這里面其實有更多的理論值得我們研究斩芭。

其次是運算能力的制約轻腺。雖然我們已經(jīng)有GPU的Farm,但想訓(xùn)練一個大的網(wǎng)絡(luò)其實還是會耗費大量的時間划乖,此次ImageNet比賽中我們就在很多GPU上跑了很長的時間约计。開發(fā)一個新算法需要調(diào)試很多不同的參數(shù)結(jié)構(gòu)等,如果我們能一分鐘的時間內(nèi)測試一個算法的話迁筛,我們就會有機會嘗試各種不同的算法,也許我們在有限的時間內(nèi)耕挨,在ImageNet挑戰(zhàn)賽中能夠取得更好的成績细卧。

最后是數(shù)據(jù)量的制約。我們目前還沒有開發(fā)出像人類一樣擁有自主學(xué)習(xí)能力的算法筒占,目前的機器學(xué)習(xí)還需要大量的訓(xùn)練樣本來支撐贪庙。機器學(xué)習(xí)中的參數(shù)越多,我們需要的訓(xùn)練樣本就越多翰苫,最終的算法才會越精確止邮。擴大訓(xùn)練數(shù)據(jù)的樣本量有沒有好的解決辦法呢这橙?可以從兩個方面來考慮:一個方面是行業(yè)和行業(yè)之間建立一個協(xié)議標(biāo)準(zhǔn),通過一個接口讓不同行業(yè)之間的數(shù)據(jù)可以共享导披。另外一個方面就是智能設(shè)備和不同的傳感器之間數(shù)據(jù)的輸出和機器學(xué)習(xí)算法的輸入也應(yīng)該有個協(xié)議屈扎。有了這兩方面的協(xié)助,機器學(xué)習(xí)的數(shù)據(jù)量就會迅速擴大撩匕,最終訓(xùn)練模型也會更為準(zhǔn)確鹰晨。

把握人工智能的脈搏:規(guī)劃產(chǎn)業(yè)布局

如今人工智能的春天再次回歸,這對整個的技術(shù)產(chǎn)業(yè)也提出了新的要求止毕。我認(rèn)為未來人工智能的產(chǎn)業(yè)布局將大致會分為6個環(huán)節(jié)模蜡,其中人工智能的應(yīng)用將會發(fā)展為針對普通用戶的交互和用于工業(yè)界使用的兩大分支。

首先是最底層的模擬人腦的芯片的開發(fā)環(huán)節(jié)扁凛。今天的計算機芯片基本上還是基于馮諾依曼架構(gòu)忍疾,這種架構(gòu)對于一般的邏輯計算和存儲都十分實用,但想實現(xiàn)人工智能谨朝,這樣的架構(gòu)可能就不那么理想了卤妒。目前有不少公司正在嘗試能否開發(fā)出像人腦一樣的芯片。

那么從底層往上走的第二個環(huán)節(jié)是介于硬件芯片和上層開發(fā)之間的類腦計算的結(jié)構(gòu)和模塊叠必。有了模擬人腦的芯片硬件之后荚孵,研究人員就能夠基于這類芯片開發(fā)出一些模擬人腦及思維方式的一些算法或者模塊。目前無論是語音識別還是計算機視覺纬朝,都是在GPU上模擬神經(jīng)元收叶,模擬出很多層,但由于芯片的限制共苛,層與層之間的反饋基本上是往前單向反饋的判没。今天的芯片需要大量的服務(wù)器和GPU才能模擬出人腦很容易就能做到的事情,這是遠(yuǎn)遠(yuǎn)不夠的隅茎。

再往上一個環(huán)節(jié)是開發(fā)出分布式的澄峰、大規(guī)模的、雙向前后反饋的機器學(xué)習(xí)的算法辟犀。微軟亞洲研究院不久前開源的分布式機器學(xué)習(xí)工具包DMTK就屬于這一類俏竞。

之后一個環(huán)節(jié)就是基于這些大規(guī)模的分布式算法,對人的看堂竟、聽魂毁、說等各種感官的模擬,如計算機視覺出嘹、語音識別席楚、語音合成,甚至人的一些思維等∷凹冢現(xiàn)在做智能家居烦秩、可穿戴設(shè)備等公司的技術(shù)創(chuàng)新也主要集中在這個環(huán)節(jié)進(jìn)行創(chuàng)新垮斯。

如果再往上,第五個環(huán)節(jié)是什么呢只祠?我們的人工智能在這個時候已經(jīng)能完成一些基本的任務(wù)兜蠕,有了在某種程度上的智能(IQ),接下來就要去完善EQ铆农,進(jìn)行情感計算牺氨。例如,你的人工智能助手知道什么時候應(yīng)該說真話墩剖,什么時候說“善意的謊言”猴凹。

人工智能最頂端,也就是第六個環(huán)節(jié)岭皂,我會稱為增強智能(Augmented Intelligence)郊霎。計算機擅長的是記憶存儲、邏輯推理爷绘、演算分析等目前可編程的工作书劝,這與人類負(fù)責(zé)邏輯思考的“左腦”十分相似,其實人工智能就像是一個負(fù)責(zé)推理演算的“左腦”土至,它與人類的右腦相配合购对,便能夠充分利用人類才有的創(chuàng)造力,延伸出無限可能陶因,進(jìn)而實現(xiàn)增強的智能骡苞。【相關(guān)閱讀:從人工智能到增強智能

人工智能時代楷扬,我們能做什么

人工智能是一個特別復(fù)雜的概念解幽,他擁有非常多層的維度,如果只憑一些單獨的個體烘苹,是沒法把這件事情做成的躲株。因此對于企業(yè)來說,非常重要的一點便是合作镣衡。大家都在期待人工智能實現(xiàn)技術(shù)的指數(shù)爆炸霜定,實現(xiàn)這個一定是有一大批的研究者、企業(yè)和機構(gòu)之間的相互溝通和相互合作廊鸥。

我們非常高興地看到望浩,越來越多的科技公司都在開放或開源核心的人工智能技術(shù)。微軟已經(jīng)開放了很多人工智能技術(shù)黍图,包括我在上文中提到的牛津計劃,還包括Azure Machine Learning奴烙,以及不久前亞洲研究院開源的分布式機器學(xué)習(xí)工具包DMTK助被。我們不僅僅是開源某一個具體的算法剖张,我們其實開源了一整套的分布式訓(xùn)練框架,使得任何別的機器學(xué)習(xí)的算法能在一個更大規(guī)模的分布式的系統(tǒng)上更加便利地進(jìn)行計算揩环。我們也相信搔弄,開放會是未來的趨勢,因為只有大家相互合作丰滑,最后人工智能技術(shù)才可能整體地顾犹、穩(wěn)健地向前邁進(jìn)。

對于個人來說褒墨,在人工智能時代我們也有很多參與其中的方法炫刷。毫無疑問,人工智能一定是今后整個IT產(chǎn)業(yè)幾個大的發(fā)展趨勢中至關(guān)重要的一個郁妈。對于信息領(lǐng)域的在校學(xué)生來說浑玛,需要通過學(xué)習(xí)一些基礎(chǔ)理論課程打好堅實的基礎(chǔ)。對于目前的從業(yè)人員們來說噩咪,則需要保持好終生學(xué)習(xí)的習(xí)慣顾彰,IT產(chǎn)業(yè)日新月異,需要時刻包括整個產(chǎn)業(yè)的大趨勢胃碾。

把握產(chǎn)業(yè)大趨勢的方式有很多涨享,如了解國家的發(fā)展方向和戰(zhàn)略方向,和整個產(chǎn)業(yè)的發(fā)展方向相結(jié)合仆百,從而找到自己的方向厕隧。其次是多參加一些產(chǎn)業(yè)界最前沿的會議,這是一種很好的吸取營養(yǎng)的方式儒旬。最后就是經(jīng)常接觸一些初創(chuàng)企業(yè)栏账,如美國的硅谷、中國的中關(guān)村和一些產(chǎn)業(yè)園區(qū)和孵化器等栈源,因為這些地方經(jīng)常是一些最前沿想法發(fā)生的地方挡爵。

因此對于個人來說,把握好這四點至關(guān)重要:產(chǎn)業(yè)的發(fā)展趨勢甚垦、國家政策的發(fā)展趨勢茶鹃、最前沿的一流學(xué)術(shù)會議,以及多接觸初創(chuàng)企業(yè)艰亮。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末闭翩,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子迄埃,更是在濱河造成了極大的恐慌疗韵,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件侄非,死亡現(xiàn)場離奇詭異蕉汪,居然都是意外死亡流译,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進(jìn)店門者疤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來福澡,“玉大人,你說我怎么就攤上這事驹马「镌遥” “怎么了?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵糯累,是天一觀的道長算利。 經(jīng)常有香客問我,道長寇蚊,這世上最難降的妖魔是什么笔时? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮仗岸,結(jié)果婚禮上允耿,老公的妹妹穿的比我還像新娘。我一直安慰自己扒怖,他們只是感情好较锡,可當(dāng)我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著盗痒,像睡著了一般蚂蕴。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上俯邓,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天骡楼,我揣著相機與錄音,去河邊找鬼稽鞭。 笑死鸟整,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的朦蕴。 我是一名探鬼主播篮条,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼吩抓!你這毒婦竟也來了涉茧?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤疹娶,失蹤者是張志新(化名)和其女友劉穎伴栓,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡钳垮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年除师,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扔枫。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖锹安,靈堂內(nèi)的尸體忽然破棺而出短荐,到底是詐尸還是另有隱情,我是刑警寧澤叹哭,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布忍宋,位于F島的核電站,受9級特大地震影響风罩,放射性物質(zhì)發(fā)生泄漏糠排。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一超升、第九天 我趴在偏房一處隱蔽的房頂上張望入宦。 院中可真熱鬧饥脑,春花似錦策菜、人聲如沸收班。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽迹淌。三九已至屡江,卻和暖如春沟优,著一層夾襖步出監(jiān)牢的瞬間巢钓,已是汗流浹背病苗。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留症汹,地道東北人硫朦。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像烈菌,于是被迫代替她去往敵國和親阵幸。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內(nèi)容