原文鏈接:淺談人工智能:現(xiàn)狀滑蚯、任務、構(gòu)架與統(tǒng)一
讀完四萬字不光是對朱教授眼中當前人工智能的各種情況會有一個全面的了解抵栈,而且也會被他作為一個科學研究者卻同時具有的深厚的文史知識所深深折服告材。
摘要
本文首先在引言中提到弃酌,目前的人工智能領域并沒有被大多數(shù)人全面的認識髓堪,所以有此文棍苹。
前三小節(jié)绊诲,起題,講了人工智能的現(xiàn)在過去與未來婴梧。
第四節(jié),提出觀點“小數(shù)據(jù)大任務”,反駁當前“大數(shù)據(jù)小任務”的模型胰舆。
第五節(jié)到第十節(jié),從六個領域圍繞任務蹬挤、認知等等來討論什么缚窿,如何才能得到上面這種“小數(shù)據(jù)大任務的”模型。
最后一節(jié)焰扳,給出總結(jié)與展望倦零,人工智能應當成為智能科學,給予達爾文與牛頓體系的統(tǒng)一吨悍。
引言
人工智能沉寂了許久后突然火了起來扫茅,政府媒體都對其進行大力追捧,但是追捧的同時卻又是一種不理智的體現(xiàn)育瓜,在沒有對人工智能有全面認識而下的片面的判斷葫隙。
然而,難以全面認識當前的人工智能領域也是有原因的躏仇。
- 人工智能是個非常大的領域恋脚。可以歸納為計算機視覺、自然語言處理焰手、認知推理糟描、機器人學、博弈和倫理书妻、機器學習船响。 然而實際上這幾個領域也會互相交叉。深度學習只是其中的很小一部分,各個研究人員們無異于盲人摸象灿意。
- 人工智能發(fā)展的斷代現(xiàn)象估灿。 跟人工智能發(fā)展歷史有關。
1. 現(xiàn)狀
人工智能的研究缤剧,簡單來說馅袁,就是要通過智能的機器,延伸和增強(augment)人類在改造自然荒辕、治理社會的各項任務中的能力和效率汗销,最終實現(xiàn)一個人與機器和諧共生共存的社會。
智能機器應當是有自主感知抵窒、認知弛针、決策、學習李皇、執(zhí)行和社會協(xié)作能力削茁,符合人類感情、倫理和道德理念的掉房。
雖然目前大家看到很多機器人還有智能系統(tǒng)的展示茧跋,如日本的機器人、波士頓動力卓囚、聊天機器人等等瘾杭。但是這些系統(tǒng)往往都只能在一個設定好的環(huán)境下運行,而且在現(xiàn)實應用中有很多缺陷哪亿。
最主要的問題是缺乏物理和社會的常識粥烁。 而常識就是我們在這個世界生存的最基本的知識。
2. 未來目標:烏鴉的啟示
鸚鵡和烏鴉的比較蝇棉。
鸚鵡往往只能進行學舌讨阻,卻并不理解自己在說什么,就像是我們現(xiàn)在進行數(shù)據(jù)驅(qū)動的聊天機器人一樣银萍,不能把說的話對應到物理世界和社會中的物體变勇、場景、人物上去贴唇,不合邏輯搀绣。
而烏鴉呢,這里有一個來自日本的烏鴉的故事戳气,通過觀察链患,學會利用汽車開堅果,并且會看紅綠燈瓶您。這個烏鴉帶來了三點啟示麻捻。
- 它是一個完全自主的智能纲仍。可以感知贸毕、認知郑叠、推理、學習明棍、和執(zhí)行乡革。
- 它不需要大數(shù)據(jù)訓練,通過少量數(shù)據(jù)就能弄明白摊腋。
- 烏鴉的腦只有人的1%大沸版,功耗0.1-0.2瓦,就實現(xiàn)了功能兴蒸。
這一切都向我們昭示著视粮,這里還有很大的機會在里面,我們?nèi)绾尾拍苡每茖W手段實現(xiàn)這個烏鴉的解呢橙凳。
3. 歷史:“春秋五霸”到“戰(zhàn)國六雄”
這里用中國歷史來類比人工智能六十年的幾起幾落蕾殴。
第一階段:前三十年以數(shù)理邏輯的表達與推理為主。相當于最初的有著各種成套體系的周朝岛啸,雖然相對松散区宇。
第二階段:后三十年以概率統(tǒng)計的建模、學習和計算為主值戳。第一階段之后,主要分為五大領域:計算機視覺炉爆、自然語言理解堕虹、認知科學、機器學習芬首、機器人學赴捞。也就是春秋五霸。都有著各自的圈子郁稍。這一階段主要代表人物赦政。
現(xiàn)在:隨著“五霸”不斷擴張,在一個平臺進行交互耀怜。這幾個學科之間已經(jīng)開始出現(xiàn)融合了恢着,與戰(zhàn)國時期情況比較像,加上從人工智能分出來的博弈倫理财破,剛好可以湊出“戰(zhàn)國六雄掰派。”
以上就是AI的過去現(xiàn)在與未來左痢。之后進入下一個主題靡羡,既然我們進入這樣一個大融合時代系洛,那么用一個什么樣的構(gòu)架把這些領域和問題統(tǒng)一起來呢。
4. AI研究的認知構(gòu)架:小數(shù)據(jù)略步,多任務
智能系統(tǒng)的兩個基本前提條件:
- 物理環(huán)境客觀的現(xiàn)實與因果鏈條描扯。
- 智能物種與生俱來的任務與價值鏈條。
所以在有了以上兩個前提條件之后趟薄,我們在定義好智能系統(tǒng)基本行動功能后绽诚,在定義好模型的空間(包括價值函數(shù)),只能系統(tǒng)就應該能夠自主生存下來竟趾,學會認識世界憔购、利用世界、改造世界岔帽。
那么又是什么驅(qū)動了模型的學習過程呢玫鸟?
第一,外來的數(shù)據(jù)犀勒;
第二屎飘,內(nèi)在的任務。把智能體都看成一個模型的話贾费,任何模型都將由數(shù)據(jù)與任務來共同塑造钦购。
當前的大多數(shù)深度學習方法,都屬于“大數(shù)據(jù)褂萧、小任務范式”押桃。用大量數(shù)據(jù)來訓練特定的模型,造成結(jié)果是模型不能泛化和解釋导犹。
而朱教授提倡的是一個相反的思路唱凯,“小數(shù)據(jù)、大任務范式”谎痢,用大量的任務來塑造智能磕昼。(其實這些讓我想到了,最近一些Meta-learning(元學習)方面的研究节猿,嘗試讓智能體學會怎么解決很多任務票从,以任務為驅(qū)動。)
那么又該如何定義這個大量任務呢滨嘱?人感興趣的任務又有哪些峰鄙,是什么樣的空間結(jié)構(gòu)?這個問題太雨,現(xiàn)在還一直說不清楚先馆,是人工智能發(fā)展的一個巨大挑戰(zhàn)。
有了以上前提知識躺彬,下面就是對六大領域的介紹煤墙,看能否從中找到共性梅惯、統(tǒng)一的框架和表達模型。
5. 計算機視覺:從深到暗
首先列舉了幾個被主流忽視的一些問題仿野。
-
幾何嘗試推理與三維場景構(gòu)建铣减。人們根據(jù)常識對一張圖片就能推理出三維空間,而現(xiàn)在CV是通過多視角特征來推斷脚作。這里提出了一個概念葫哗,時空因果的解釋圖(Spatial,Temporal and Causal Parse Graph)球涛,即STC-PG劣针。
img 場景識別的本質(zhì)是功能推理。當人們看到一個三維空間時亿扁,會想象這里可以用來干什么捺典,通過想象出來的動作,來理解場景从祝。
物理穩(wěn)定性與關系的推理襟己。
意向、注意和預測牍陌。
任務驅(qū)動的因果推理與學習擎浴。
那么什么是任務,任務就是改變場景中某些物體的狀態(tài)毒涧,稱為流態(tài)贮预。圖像中的場景和人的動作,其實就是因果關系的推理契讲,所謂因果就是:人的動作導致了某種流態(tài)的改變萌狂。所以理解圖片,就是這些這些反應流態(tài)改變的蛛絲馬跡怀泊,而要注意到這些是需要大量來源于圖像之外的知識的。
感知的圖像往往只占5%误趴,提供一些蛛絲馬跡霹琼;而后面的95%,包括功能凉当、物理枣申、因果、動機等等是要靠人的想象和推理過程來完成的看杭。
而對于感知圖片的理解可以表達為一個STC-PG忠藤,幾點要注意的是。
- 這個STC-PG是想象出來的楼雹。
- 大量的運算屬于“top-down”自頂向下的計算過程模孩,這是深度學習中沒有的尖阔。
- 這樣學習任務只需要極少的例子。
基于以上榨咐,視覺研究的未來介却,將在于如何發(fā)掘那些隱藏的95%的知識,這也就是為什么標題從深到暗块茁。
6.認知推理:走進內(nèi)心世界
上面說到的暗物質(zhì)齿坷,就要涉及到感知與認知了,進入內(nèi)心世界数焊。內(nèi)心世界反映外部世界永淌,同時受動機任務的影響和扭曲。要讓只能提理解下面這些概念佩耳。
- Ta看到什么了遂蛀?知道什么了?什么時候知道的蚕愤?這其實是對視覺的歷史時間求積分答恶。
- Ta現(xiàn)在在關注什么?這是當前的正在執(zhí)行的任務萍诱。
- Ta的意圖是什么悬嗓?后面想干什么?預判未來的目的和動機裕坊。
-
Ta喜歡什么包竹?有什么價值函數(shù)?
而要達到這些籍凝,其中一個很重要的就是如何達成共識周瞎,也就是分析共通的知識,價值觀饵蒂。這樣才能通過這些共識推斷出上面所提到的四個問題声诸。
怎么達成共識?那么語言就是形成共識的重壓工具了退盯。
7. 語言通訊:溝通的認知基礎
語言產(chǎn)生基礎是人要尋求合作彼乌。但是同時如果沒有上面提到的認知基礎,那么語言就只是空洞的符號渊迁,對話不可能發(fā)生慰照。
在人與人之間交流時,往往是需要假設一些前提琉朽,比如說我知道的東西毒租、你知道的東西、我知道你知道的東西箱叁、你知道我知道的東西墅垮、我們共同知道的東西惕医。
語言也可以用STC-PG來表達。
8. 博弈倫理:獲取噩斟、共享人類的價值觀
這里提到機器人若是要與人交流曹锨,那么就必須懂得人類價值觀,了解人類的價值函數(shù)剃允。這樣才能推斷出沛简,人接下來要干什么。
而有了價值函數(shù)后斥废,在多人環(huán)境下椒楣,各個價值函數(shù)形成競爭與合作,最后達成準平衡態(tài)牡肉。
9. 機器人學:構(gòu)建大任務平臺
之前提到“小數(shù)據(jù)捧灰,大任務”,那么機器人就將是一個大任務的科研平臺统锤。
人和機器人要執(zhí)行任務毛俏,就要把人物分解成一連串動作,每個動作改變環(huán)境中的流態(tài)饲窿。機器人重構(gòu)環(huán)境煌寇,然后用任務的視角來看待場景,將場景根據(jù)單個任務分成單任務地圖逾雄。之后通過這些單任務地圖阀溶,來組合規(guī)劃成復雜的任務,也可以利用STC-PG鸦泳。
這里舉了一個他們實驗室的例子银锻。
10. 機器學習: 學習的極限和“停機問題”
這里想要探討,在什么條件下做鹰,學習過程會終止击纬,之后系統(tǒng)也就達到極限。
首先钾麸,到底什么是學習更振?
比如現(xiàn)在的機器學習主要分三步:
- 定義一個損失函數(shù),代表一個小任務喂走,比如人臉識別;
- 選擇一個模型谋作,比如一個10層神經(jīng)網(wǎng)絡芋肠,需要數(shù)據(jù)來擬合;
- 拿到大量標注數(shù)據(jù)遵蚜,然后就可以擬合參數(shù)了帖池。
但是這種學習奈惑,沒有因果,沒有行動睡汹,只是純粹的肴甸、被動的統(tǒng)計學習。
而真正的學習囚巴,是一個交互的過程原在。學生和老師之間有互動,這種學習過程建立在6節(jié)講的構(gòu)架中彤叉,這里講這種學習過程稱為通訊學習庶柿。
通訊學習的構(gòu)架中包含大量的學習模式,包括以下七種學習模式:
- 被動統(tǒng)計學習:用大數(shù)據(jù)擬合模型
- 主動學習:學生主動問老師要數(shù)據(jù)
- 算法教學:老師跟蹤學生進展和能力秽浇,來設計例子來幫助學習
- 演示學習:廣泛應用機器人學浮庐,手把手教機器人做動作
- 感知因果學習:通過觀察別人行為的因果,而不用做實驗驗證柬焕,學出的因果模型
- 因果學習:動手實驗审残,控制其他變量,得到可靠因果模型
- 增強學習:學習決策函數(shù)與價值函數(shù)的一種方法
從以上可以看出斑举,現(xiàn)在如火如荼的深度學習其實只是廣義學習框架中的很小一部分搅轿,而學習有時AI中的一部分,所以現(xiàn)在這種將深度學習等同AI懂昂,無疑坐井觀天介时。
其次,學習的極限是什么凌彬?
影響學習極限的因素有很多沸柔,如教學的動機,教學的方法铲敛,能力問題褐澎,還有價值函數(shù)...
而學習的極限,也就是停機問題伐蒋,就是在考慮這些因素的情況下工三,學習的動態(tài)過程達到的各種平衡態(tài)。
11. 總結(jié):智能科學--牛頓與達爾文體系的統(tǒng)一
首先物理學的發(fā)展史就是一部追求物理世界統(tǒng)一的歷史先鱼,第一次大統(tǒng)一就是牛頓的經(jīng)典力學俭正。
然而物理學將生物的意志排除在研究以外,這正好是智能科學要研究的對象焙畔。智能科學研究的是一個物理與生物混合的復雜系統(tǒng)掸读。
智能作為一種現(xiàn)象,就表現(xiàn)在個體與自然、社會群體的相互作用和行為過程中儿惫。朱教授相信這些行為和現(xiàn)象必然有統(tǒng)一的力澡罚、相互作用、基本元素來描述肾请。
然而和物理學不同的是留搔,同時智能科學也會更加復雜,在于:
- 物理學面對的是一個客觀的世界铛铁,而智能科學研究的是隔显,物理世界映射到每個人的腦中而形成的主觀與客觀融合的世界,也就是每個人腦中的模型避归。
- 物理學可以將各種現(xiàn)象隔離出來研究荣月,而智能科學可能一張圖片就包含了大量的模型,人的一個簡單動作就包含了很復雜的心理活動梳毙,很難隔離哺窄。
回到之前的烏鴉的例子,智能科學研究的物理與生物系統(tǒng)有兩個基本前提:
- 智能物種與生俱來的任務與價值鏈條账锹。
- 物理環(huán)境客觀的現(xiàn)實與因果鏈條萌业。
智能科學必須要考慮的就是這兩個基本前提,而人工智能要變?yōu)橹悄芸茖W奸柬,本質(zhì)也必將是達爾文與牛頓這兩個理論體系的統(tǒng)一生年。