自從去年 AlphaGo 完虐李世乭蒂破,深度學(xué)習(xí)火了馏谨。但似乎沒人說得清它的原理,只是把它當(dāng)作一個黑箱來使附迷。有人說惧互,深度學(xué)習(xí)就是一個非線性分類器[1]?有人說喇伯,深度學(xué)習(xí)是對人腦的模擬[2]……但我覺得都沒有捅透那層窗戶紙喊儡。
當(dāng)讀完 Jeff Hawkins 的《論智能》[3],「就是它了稻据!」艾猜。而我驚奇地發(fā)現(xiàn),原書竟是 2004 年出版的攀甚!我怕自己讀了本假書箩朴,或是某個美國民科的著作,特意到豆瓣秋度、知乎上查了下,發(fā)現(xiàn)幾乎每個看過這本書的人都對其理論嘖嘖稱贊钱床。但奇怪的是荚斯,似乎沒人肯替它站臺,這套理論的影響止步于此查牌,好像大家都在刻意掩飾自己看過這本秘笈事期。它明明已經(jīng)完整解釋了人腦智能的運作機制了啊纸颜!注意是 Real Intelligence 兽泣,而不僅僅是 Artificial Intelligence !P菜铩唠倦!
三個洞見
比起絕大多數(shù)腦科學(xué)論文称鳞,作者的洞見簡單得多,也深刻得多:
長久以來稠鼻,由于我們沒有能力從內(nèi)部去觀察思維冈止,所以人們總是把「智能」等同為「表現(xiàn)出智能的行為」。但當(dāng)我們看書時候齿,在外人看來并沒有任何變化熙暴,而我們自己知道,這期間產(chǎn)生了無數(shù)的聯(lián)想慌盯、頓悟周霉、回憶。所以亚皂,「理解」是無法通過外部行為來測量的诗眨,它是一個內(nèi)在度量的指標(biāo)。
從草履蟲到人類孕讳,大自然會為每一種生物分別設(shè)計一套智能機制匠楚,還是沿用一套機制,亦或是從某一代開始出現(xiàn)某種全新的智能機制厂财,并沿用至今(那么芋簿,最先產(chǎn)生這套智能機制的又是什么物種呢?)璃饱?我們所說的智能与斤,是人類所獨有,還是生物的普遍特征(只是多寡之別)荚恶?而作者相信撩穿,智能不可能是上帝專為人類而設(shè)計的,它一定來自大自然的某種慣用伎倆谒撼。
大腦皮層食寡,不管是結(jié)構(gòu)上還是功能上,都有著相同的構(gòu)造/機理(嚴(yán)格來說廓潜,這不算作者的洞見抵皱,而是早在 1978 年由 Vernon Mountcastle 發(fā)現(xiàn)的)。
由這三個洞見出發(fā)辩蛋,自然而然地導(dǎo)向了以下疑問:
如果智能不是由行為定義的呻畸,那該如何定義它?
向前看悼院,智能是如何演化而來的伤为?
向內(nèi)看,大腦皮層的結(jié)構(gòu)是如何捕捉這個世界的結(jié)構(gòu)的据途?
簡單地說绞愚,作者的結(jié)論是:
智能并沒有人們想象的那么玄乎叙甸,它不過是一種「預(yù)測未來的能力」罷了。
這些預(yù)測的實質(zhì)爽醋,不過是「生物的應(yīng)激性」在「生物自平衡機制」&「環(huán)境壓力」下產(chǎn)生的副產(chǎn)品蚁署。
智能的核心是某種「穩(wěn)定不變的東西」。而這得益于大腦皮層同質(zhì)的層級結(jié)構(gòu)蚂四。
下面光戈,我們就來看看作者是怎么從那三個簡單的洞見一步步推測出智能的本質(zhì)的。
生命的秋千
小到人體遂赠,大到經(jīng)濟系統(tǒng)久妆,復(fù)雜系統(tǒng)內(nèi)都有著一種消減沖擊、使系統(tǒng)回歸穩(wěn)態(tài)的類似機制跷睦。血糖濃度低了筷弦,胰高血糖素分泌會增加,拉高血糖抑诸;而血糖高了烂琴,胰島素分泌會增加,拉低血糖蜕乡。通過調(diào)節(jié)這對激素奸绷,系統(tǒng)竭力讓血糖維持在某一范圍內(nèi)。這種自穩(wěn)態(tài)機制出現(xiàn)在生命的各個角落层玲,保持著生命的自我平衡[4]号醉。
這就像一只「看不見的手」,總是想推開擠壓辛块,同時把「逃兵」抓回來畔派。這只「看不見的手」在我們大腦中編織了無數(shù)「正確的位置」(用腦科學(xué)家的黑話說就是「恒定表征」)。一旦偏離润绵,我們就開始警覺起來线椰,并調(diào)動多個系統(tǒng)聯(lián)合應(yīng)對。舉個書中的例子授药,一個球飛過來士嚎,我們并不是去計算它的彈道、落點悔叽,而是指揮肢體相應(yīng)調(diào)整,直到抓住來球爵嗅。這套調(diào)整算法就是「預(yù)測」娇澎。從這個事例看,人們在接球這件事上表現(xiàn)出的智能睹晒,和草履蟲向著食物劃動所展現(xiàn)的應(yīng)激性趟庄,又有什么本質(zhì)的分別呢括细?
為什么說「預(yù)測」是智能的基礎(chǔ)?
平常戚啥,人們理解的「預(yù)測」步子邁得太大了奋单,就好比從一發(fā)球就要精準(zhǔn)地算出其落點,而人腦的「預(yù)測」更像是「應(yīng)激」猫十,球動我動览濒,一點點微調(diào)。現(xiàn)代社會發(fā)展得太快拖云,讓我們看不清概念的歷史面貌贷笛,因而更容易被表象的迷霧困惑。當(dāng)我們走回歷史的起點宙项,迷霧自然散去乏苦。智能,于我們最大的益處是什么尤筐?并非創(chuàng)造什么汇荐,而是生存下去。人類無時無刻不在「生存」還是「發(fā)展」之間糾結(jié)盆繁。但很少有人看到:發(fā)展掀淘,不過是為了應(yīng)對未知的生存挑戰(zhàn)。
我們應(yīng)該怎么去定義智能呢改基?也許演化的歷史能告訴我們更多繁疤。智能,是幫助人類生存下去的一種能力:是讓我們可以在溪流中叉到游動的魚兒的能力秕狰,是讓我們可以只靠一幅模糊的圖像就判斷出是朋友還是猛獸……我們應(yīng)該去研究那些「如何保持平衡」之類的問題稠腊,而不是什么彈道求解問題,那不是大自然的進化目標(biāo)鸣哀,自然也得不到什么大腦的機制架忌。
所有生存問題都可以歸結(jié)為一個元問題:如何識別出這個問題中的那些個恒定不變的東西。比如:溪流中的魚我衬、回家的方向……如果說智能中還存在別的成分叹放,比如:想象、創(chuàng)造工具挠羔、解決問題井仰,都可以規(guī)約到某種抽象手段上。歸根結(jié)底破加,人類解決一切問題的方法只有一個——運用抽象俱恶,在更高維度上調(diào)和矛盾。
一切繞不開「恒定表征」(invariant representations)。
抽象的本質(zhì)
就如同人們在認(rèn)可了「負(fù)數(shù)」這一概念之后合是,終于能將「加法」&「減法」這兩種表象上完全不同(一個增加了罪,一個減少)的運算,統(tǒng)一為「整數(shù)域上的加法」聪全。從更高的維度調(diào)和矛盾泊藕,這正是大腦皮層的構(gòu)造方式,也是其工作原理难礼。不斷在現(xiàn)象中找到共同點娃圆,提取出來,取個名字鹤竭;這些名字又成為了上一層抽象的基石(或者叫「詞匯」)踊餐。這樣一層一層,直至得到那個智能的圣杯——恒定表征臀稚。
舉個例子吝岭,我們是如何識別邊緣[5]的呢?
我們先來考察一小塊 3×3 的視網(wǎng)膜吧寺,分別標(biāo)記為 #1~#9 (如下圖所示)窜管。當(dāng)一條豎線出現(xiàn)時(#1, #4, #7 均被激活),電信號傳遞到第二層稚机。第二層的每一個神經(jīng)元幕帆,分別響應(yīng)視網(wǎng)膜上一組細(xì)胞被激活的情況。比如:第二層最左邊的那片神經(jīng)元赖条,響應(yīng)的是單個視網(wǎng)膜細(xì)胞被激活的情況失乾。再比如:第二層左二那片神經(jīng)元,響應(yīng)的是任意兩個視網(wǎng)膜細(xì)胞被激活的情況纬乍。以此類推……
如果我們把時間的因素考慮進去,假設(shè)信號并不會馬上消失茧泪,而是隨著時間衰減蜓氨,那么只要時間夠短,輸入 (#1, #4, #7)队伟、(#2, #5, #8)穴吹、(#3, #6, #9) 這三組刺激,就會在第三層激活某個神經(jīng)元嗜侮,代表「發(fā)現(xiàn)一條豎線」刀荒。
看代嗤,其實每一個神經(jīng)元都是一個「單詞」(或是「概念」/「抽象」/「特征」)棘钞。只不過低層神經(jīng)元描述的「單詞」抽象程度更低缠借。比如:第二層那個 #(1, 4, 7) 神經(jīng)元代表的是「在視網(wǎng)膜的最左邊出現(xiàn)一條豎線」,而其上層那個則沒有「在視網(wǎng)膜的最左邊」這一約束宜猜。
記憶的角色
神經(jīng)元可以在 5 毫秒內(nèi)完成信息的收集-整合-輸出泼返,相當(dāng)于運算速度為每秒 200 次。人類可以在半秒內(nèi)(相當(dāng)于 100 步)識別圖像姨拥、作出選擇…… 100 步绅喉,機器可做不到。在人類已知的算法里面叫乌,也許只有「打表」(把答案事先存儲在記憶中柴罐,用時并不作計算,而只是提群┘椤)可以做到革屠。所以,整個大腦皮層就是一個記憶系統(tǒng)排宰,而非什么計算機似芝。
深度學(xué)習(xí)做對了什么?
多層網(wǎng)絡(luò)板甘,提供了逐層抽象的通道党瓮。如今,圖像識別系統(tǒng)正是這么做的:底層識別邊緣盐类,而后識別特定形狀寞奸,再高層識別某種特征……
卷積,提供了獲得「恒定表征」的手段在跳。
還有什么我們不知道枪萄?
當(dāng)我們想要提取某段記憶時,往往只需要只言片語就行了硬毕。也就是說呻引,記憶似乎是以一種全息的形式存儲的。任何片段都包含了全部吐咳。
還有逻悠,我們依然不知道大腦是怎么在 100 步內(nèi)完成決策的。我們也不知道為什么會有那么多反饋連接韭脊?軸突 v.s. 樹突在功能上有什么分別童谒?……
現(xiàn)在讓我們回過頭來看作者的三個洞見,用黑話再講一遍就是:
理解沪羔,是對「大腦如何形成記憶饥伊,并利用這些記憶作出預(yù)測」的一個內(nèi)部度量象浑。
預(yù)測,是某種自我調(diào)節(jié)機制的副產(chǎn)品琅豆。
大腦皮層在外表 & 結(jié)構(gòu)上存在著驚人的同質(zhì)性愉豺。也就是說,大腦皮層使用相同的計算方式來完成它的一切功能茫因。人類展現(xiàn)出來的所有智能(視覺蚪拦、聽覺、肢體運動……)都是基于一套統(tǒng)一的算法冻押。
人類正在慢慢接近世界的本質(zhì)——物質(zhì)只是承載信息模式的載體驰贷。人腦之外的器官都只是保障這一使命的給養(yǎng)艦隊。
-
詳見:吳軍老師寫的《數(shù)學(xué)之美》(第二版)第三十章洛巢。 ?
-
原書名為《On Intelligence》。中國華僑出版社的翻譯是《智能時代》稿茉。雖然內(nèi)容的翻譯還是很到位的锹锰,但這個書名譯得卻有噱頭的嫌疑。 ?
-
如果要追溯這種自穩(wěn)態(tài)思想的數(shù)學(xué)基礎(chǔ)狈邑,那得追溯到發(fā)現(xiàn)控制論之初的年代了城须。這段歷史參看 Thomas Rid 的《機器崛起——遺失的控制論歷史》第二章。 ?
-
這里需要特別說明的是:現(xiàn)實中米苹,人眼識別物體邊緣并不是按下述原理實現(xiàn)的糕伐,而是一種很巧妙、卻也很簡單的機制蘸嘶。Feynman 的《物理學(xué)講義》(第一卷)第 36 章中有提到良瞧。 ?