想必大家都看過電影《鋼鐵俠》谋币,小編還是死忠粉呢仗扬!電影中除了非常有魅力的小羅伯特.唐尼外,印象最深的就是鋼鐵俠的人工智能管家Jarvis了蕾额。電影里的Jarvis可以幫助鋼鐵俠處理各種事務(wù)早芭,而現(xiàn)實(shí)版的Jarvis也許有望實(shí)現(xiàn)逼友。小編做夢都想擁有一個這樣的人工智能管家秤涩,想想都有點(diǎn)小激動呢筐眷。哪位大牛開發(fā)出了Jarvis,混跡科技圈多年的小編發(fā)現(xiàn)原來這位大咖是Facebook創(chuàng)始人小扎。熱愛學(xué)習(xí)的小扎每年都會給自己定一些小目標(biāo)资溃,比如讀書烈炭,跑步等。2016年他給自己定下的小目標(biāo)可不是賺它一個億趴捅,而是借助Facebook工具親自動手為自己打造一個人工智能系統(tǒng)拱绑,事實(shí)上小扎也實(shí)現(xiàn)了并取名為Jarvis猎拨。
Jarvis在技術(shù)上的實(shí)現(xiàn)
這個Jarvis能夠做點(diǎn)什么呢红省?小扎可以在手機(jī)和電腦上與之交談吧恃,它可以調(diào)控小扎家的燈光蛉加,室內(nèi)溫度针饥,家用電器丁眼,可以播放音樂,實(shí)施安全保護(hù)苞七,學(xué)習(xí)語言知識蹂风,甚至可以逗Max(小扎的女兒)玩兒惠啄。要實(shí)現(xiàn)這些,Jarvis可是使用了好幾種人工智能技術(shù)融柬,包括自然語言處理粒氧,語音識別外盯,面部識別和用Python, PHP and Objective C編寫的強(qiáng)化學(xué)習(xí)。究竟是怎么做到的掷空,下面就隨小編來看一看吧坦弟!
建立Jarvis的第一步:從家開始官地。據(jù)小扎稱驱入,在某些方面莺褒,建立Jarvis要比之前預(yù)想的簡單得多遵岩。例如巡通,小扎2016年的另一個目標(biāo)是跑365英里(一英里約合1609米),反而是這個目標(biāo)占用了更多時間誊锭。不過炉旷,一開始小扎以為只是將自家的系統(tǒng)連接起來窘行,實(shí)際上更復(fù)雜但绕。在小扎建立Jarvis之前捏顺,首先,小扎要編寫代碼來連接這些系統(tǒng)本今,而這些系統(tǒng)都使用不同的語言和協(xié)議挪凑。用Crestron系統(tǒng)來連接燈,恒溫器和門等散怖,而用Sonos系統(tǒng)來連接Spotify和三星電視等咬最。
自然語言處理
據(jù)小扎說丹诀,最初也是需要寫代碼。剛開始只能使用短信進(jìn)行通信,后來添加了語音功能啼肩,并將語音轉(zhuǎn)換為文本祈坠。一開始很簡單赦拘。例如阁猜,對Jarvis發(fā)出指令剃袍,我要打開臥室的燈民效,然后Jarvis會通過搜索關(guān)鍵詞如臥室,燈和打開來執(zhí)行指令棵红。這還不夠逆甜,Jarvis還需要學(xué)習(xí)同義詞。例如素征,在小扎家御毅,起居室(family room)和客廳(living room)指的是同一個空間端蛆,而Jarvis需要理解新單詞和新概念今豆。理解上下文對任何一個人工智能系統(tǒng)來說都很重要呆躲。例如插掂,在沒有特指一個房間的情況下對Jarvis發(fā)出播放音樂的指令箩祥,很可能就會在Max要睡覺的時候播放了一首刺耳的音樂,那可就太糟糕了谢揪。
對自然語言處理來說凳鬓,音樂是一個更有趣缩举,更復(fù)雜的領(lǐng)域,因?yàn)樾枰幚砩婕八囆g(shù)家,歌曲和專輯的關(guān)鍵詞溅蛉。例如船侧,發(fā)出指令如"播放someone like you這首歌(play someone like you)勺爱,播放類似Adele歌手的歌(play someone like adele)和播放Adele的歌(play some adele)琐鲁,雖然關(guān)鍵詞(英文)很相似。通過正反饋系統(tǒng),人工智能系統(tǒng)可以學(xué)習(xí)這些差異涝桅。上下文越多冯遂,人工智能系統(tǒng)對開放式指令就能執(zhí)行得更好蛤肌。
視覺和人臉識別
人類大腦工作精力的三分之一都是與視覺有關(guān),因此人工智能系統(tǒng)需要知道在圖片和視頻上發(fā)生了什么。例如爪膊,跟蹤(Max醒了并在嬰兒床里晃動)僵芹,對象識別(寵物Beast和地毯)和人臉識別(誰在門口)。人臉識別是對象識別里特別難的一部分,因?yàn)榕c分清兩個隨機(jī)對象比較茧彤,很多人看起來很相似曾掂。例如三明治和房子溜歪,人工智能系統(tǒng)很容易分清。Facebook在人臉識別上已經(jīng)做得非常好了,能快速地識別出照片里哪些是你熟悉的朋友米酬。當(dāng)有人站在門口,人工智能系統(tǒng)需要識別來決定是否開門琼懊。 人工智能系統(tǒng)目前不能從頭部的后面識別人爬早,所以需要從多個角度觀察來確保我們看到人的臉。鑒于以上情況筛严,小扎安裝了多個攝像頭并建立了一個簡單的服務(wù)器來連續(xù)觀察攝像機(jī)。這里有兩個步驟:首先车胡,它要進(jìn)行面部檢測來查看是否有人進(jìn)入視野照瘾,其次,如果面部檢測通過析命,還要進(jìn)行人臉識別來確定是誰。一旦它識別了那個人簇搅,它還需要檢查那個人是否是你的朋友软吐,一旦確定了就會開門瘩将。
語音識別
小扎認(rèn)為借助人工智能系統(tǒng)的短信通信比人們預(yù)想的重要得多,而語音通信的作用也不可忽視熊经。語音通信最大的亮點(diǎn)就是快天试。你都不用拿出手機(jī)枫笛,打開app然后打字,直接說就搞定了恭理。為了實(shí)現(xiàn)語音通信功能拍嵌,小扎建立了一個Jarvis的應(yīng)用程序茄猫。小扎可以將安裝了Jarvis應(yīng)用程序的手機(jī)放在桌子上靖避,它只負(fù)責(zé)聽篡九。也可以在家中放多個安裝了Jarvis應(yīng)用程序的手機(jī)以便可以在任何地方和Jarvis對話沛善。
萬物互聯(lián)的局限性
在建立Jarvis的過程中,小扎提出了目前人工智能家居系統(tǒng)的局限性和自己的一些設(shè)想。局限性主要有兩點(diǎn):一是大多數(shù)電器甚至沒有連接到互聯(lián)網(wǎng);二是沒有通用的API和標(biāo)準(zhǔn)使設(shè)備“互聯(lián)互通”搂抒。從Messenger和WhatsApp總體上可以看出,與語音通信相比吝秕,人們更偏好短信通信约郁,因?yàn)槿虻亩绦磐ㄐ趴偭勘日Z音通信總量增長得更快。而且,小扎是在電腦上編程的Jarvis赤拒。要想隨時隨地與Jarvis通信崔涂,就意味著實(shí)現(xiàn)與Jarvis通信的功能就必須通過手機(jī)而不是家里放置的電腦蝙茶。這表明吮廉,未來的人工智能產(chǎn)品不僅僅專注于語音调卑,并且還需要私人訊息接口丑搔。 啟用私人訊息功能后,使用像Messenger這樣的平臺比從頭開始建立新應(yīng)用程式更好,因此小扎想建立一個Messenger Bot與Jarvis溝通辙诞。 Messenger有一個簡單的框架用于構(gòu)建bot,它會自動處理很多事情 - 在iOS和Android上工作缰趋,支持文本,圖像和音頻內(nèi)容旬薯,可靠地提供推送通知蚂会,管理不同人的身份和權(quán)限等等。
小扎的看法
語音識別系統(tǒng)已經(jīng)改進(jìn)余指,但是還沒有哪一個人工智能系統(tǒng)好到可以理解對話。語音識別不僅聽你的說話還要預(yù)測你接下來會說什么。所以框架化的對話仍然比非框架化的對話更容易理解蜡吧。
語音識別系統(tǒng)有一個限制,在機(jī)器學(xué)習(xí)系統(tǒng)上更為普遍洛姑。而這個限制有趣的是两入,為解決特定問題滥酥,那些系統(tǒng)可以不斷優(yōu)化恨狈。例如呛讲,理解人與電腦對話和理解人與人對話是不同的返奉。例如吗氏,如果你用從Google處采集人與搜索引擎對話的數(shù)據(jù)來訓(xùn)練一個機(jī)器學(xué)習(xí)系統(tǒng),那這套系統(tǒng)應(yīng)用在Facebook上來理解人與人對話的表現(xiàn)就會相對較差弦讽,理解人們與真實(shí)的人說話。近距離對話來訓(xùn)練Jarvis也不同于在房間的不同位置來訓(xùn)練Amazon Echo被碗。以上情況意味著語音識別系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng)比我們想象的要更特定化仿村。小扎表示, 人工智能技術(shù)是基礎(chǔ)蔼囊,未來只會越來越好。小扎構(gòu)建的第一個版本是iOS版的Jarvis應(yīng)用程序酱酬,計(jì)劃很快構(gòu)建出Android版本云矫。
人工智能雖然很有前景,但仍要去突破很多技術(shù)性的障礙贵少。小扎的Jarvis只是Facebook人工智能項(xiàng)目里的一小步堆缘,卻是整個人類為實(shí)現(xiàn)人工智能的一大步普碎。