人工智障 2:你所看到的AI和智能無關(guān)(中)

Part 3

人類對(duì)話的本質(zhì):思維


??對(duì)話的最終目的是為了同步思維?

你是一位30出頭的職場(chǎng)人士凉逛,每天上午9點(diǎn)半,都要過辦公樓的旋轉(zhuǎn)門群井,進(jìn)大堂的状飞,然后刷工牌進(jìn)電梯,去到28樓书斜,你的辦公室诬辈。今天是1月6日,平淡無奇的一天荐吉。你剛進(jìn)電梯焙糟,電梯里只有你一個(gè)人,正要關(guān)門的時(shí)候样屠,有一個(gè)人匆忙擠進(jìn)來穿撮。

進(jìn)來的快遞小哥,他進(jìn)電梯時(shí)看到只有你們兩人痪欲,就說了一聲“你好”悦穿,然后又低頭找樓層按鈕了。

你很自然的回復(fù):“你好”勤揩,然后目光轉(zhuǎn)向一邊咧党。

兩邊都沒什么話好講——實(shí)際上,是對(duì)話雙方認(rèn)為彼此沒有什么情況需要同步的陨亡。

人們用語言來對(duì)話傍衡,其最終的目的是為了讓雙方對(duì)當(dāng)前場(chǎng)景模型(Situation model)保持同步深员。(大家先了解到這個(gè)概念就夠了。更感興趣的蛙埂,詳情請(qǐng)見?Toward a neural basis of interactive alignment in conversation)倦畅。

The interactive-alignment model (based on Pickering and Garrod,?2004)

上圖中,A和B兩人之間發(fā)展出來所有對(duì)話绣的,都是為了讓紅框中的兩個(gè)“Situation model” 保持同步叠赐。Situation model 在這里可以簡(jiǎn)單理解為對(duì)事件的各方面的理解,包括Context屡江。

不少做對(duì)話系統(tǒng)的朋友會(huì)認(rèn)為Context是僅指“對(duì)話中的上下文”芭概,我想要指出的是,除此以外惩嘉,Context還應(yīng)該包含了對(duì)話發(fā)生時(shí)人們所處的場(chǎng)景罢洲。這個(gè)場(chǎng)景模型涵蓋了對(duì)話那一刻,除了明文以外的所有已被感知的信息文黎。 比如對(duì)話發(fā)生時(shí)的天氣情況惹苗,只要被人感知到了,也會(huì)被放入Context中耸峭,并影響對(duì)話內(nèi)容的發(fā)展桩蓉。

A: “你對(duì)這個(gè)事情怎么看?”?

B: “這天看著要下雨了劳闹,咱們進(jìn)去說吧”——盡管本來對(duì)話內(nèi)容并沒有涉及到天氣院究。

對(duì)同一件事情,不同的人在腦海里構(gòu)建的場(chǎng)景模型是不一樣的玷或。 (想要了解更多儡首,可以看?Situation models in language comprehension and memory. Zwaan, R. A., & Radvansky, G. A. (1998).?)

所以,如果匆忙進(jìn)電梯來的是你的項(xiàng)目老板偏友,而且假設(shè)他和你(多半都是他啦)都很關(guān)注最近的新項(xiàng)目進(jìn)展蔬胯,那么你們要開展的對(duì)話就很多了。

在電梯里位他,你跟他打招呼:“張總氛濒,早!”鹅髓, 他會(huì)回你 “早啊舞竿,對(duì)了昨天那個(gè)…”

不待他問完,優(yōu)秀如你就能猜到“張總” 大概后面要聊的內(nèi)容是關(guān)于新項(xiàng)目的窿冯,這是因?yàn)槟阏J(rèn)為張總對(duì)這個(gè)“新項(xiàng)目”的理解和你不同骗奖,有同步的必要。甚至,你可以通過昨天他不在辦公室执桌,大概漏掉了這個(gè)項(xiàng)目的哪些部分鄙皇,來推理你這個(gè)時(shí)候應(yīng)該回復(fù)他關(guān)于這個(gè)項(xiàng)目的具體什么方面的問題。

“昨天你不在仰挣,別擔(dān)心伴逸,客戶那邊都處理好了。打款的事情也溝通好了膘壶,30天之內(nèi)搞定错蝴。” ——你看颓芭,不待張總問完垂攘,你都能很棒的回答上哈打。這多虧了你對(duì)他的模型的判斷是正確的匹耕。

一旦你對(duì)對(duì)方的情景模型判斷失誤吉拳,那么可能完全“沒打中點(diǎn)上”萎战。

“我知道材部,昨天晚上我回了趟公司照皆,小李跟我說過了伤疙。我是要說昨天晚上我回來辦公室的時(shí)候悼吱,你怎么沒有在加班呀慎框?小王,你這樣下去可不行啊…”

所以后添,人們?cè)谶M(jìn)行對(duì)話的過程中笨枯,并不是僅靠對(duì)方上一句話說了什么(對(duì)話中明文所包含的信息)就來決定回復(fù)什么。而這和當(dāng)前的對(duì)話系統(tǒng)的回復(fù)機(jī)制非常不同遇西。

?對(duì)話是思想從高維度向低維的投影?

我們假設(shè)馅精,在另一個(gè)平行宇宙里,還是你到了辦公樓粱檀。

今天還是1月6日洲敢,但2年前的今天,你與交往了5年的女友分手了茄蚯,之后一直對(duì)她念念不忘压彭,也沒有交往新人。

你和往日一樣渗常,進(jìn)電梯的壮不,剛要關(guān)門的時(shí)候,匆忙進(jìn)來的一個(gè)人皱碘,要關(guān)的門又打開了询一。就是你2年前分手的那位前女友。她進(jìn)門時(shí)看到只有你們兩,她抬頭看了一下你健蕊,然后又低頭找樓層電梯了菱阵,這時(shí)她說:“你好”。

請(qǐng)問你這時(shí)腦袋里是不是有很多信息洶涌而過绊诲?這時(shí)該回答什么送粱?是不是類似“一時(shí)不知道該如何開口”的感覺?

這個(gè)感覺來自(你認(rèn)為)你和她之間的情景模型有太多的不同(分手2年了)掂之,甚至你都無法判斷缺少哪些信息抗俄。有太多的信息想要同步了,卻被貧瘠的語言困住了世舰。

在信息豐富的程度上动雹,語言是貧瘠的,而思想則要豐富很多?“Language is sketchy, thought is rich” (New perspectives on language and thought跟压,Lila Gleitman,?The Oxford Handbook of Thinking and Reasoning胰蝠;更多相關(guān)討論請(qǐng)看, Fisher & Gleitman, 2002; Papafragou, 2007)

有人做了一個(gè)比喻:語言和思維的豐富程度相比,是冰山的一角震蒋。我認(rèn)為遠(yuǎn)遠(yuǎn)不止如此:對(duì)話是思想在低維的投影茸塞。

如果是冰山,你還可以從水面上露出來的部分反推水下大概還有多大查剖。屬于維度相同钾虐,但是量不同。但是語言的問題在笋庄,只用聽到文字信息效扫,來反推講話的人的思想,失真的情況會(huì)非常嚴(yán)重直砂。


為了方便理解這個(gè)維度差異菌仁,在這兒用3D和2D來舉例:思維是高維度(立體3D的形狀),對(duì)話是低維度(2D的平面上的陰影)静暂。如果咱們要從平面上的陰影的形狀济丘,來反推,上面懸著的是什么物體籍嘹,就很困難了闪盔。兩個(gè)陰影的形狀一模一樣,但是上面的3D物體辱士,可能完全不同泪掀。

對(duì)于語言而言,陰影就像是兩個(gè) “你好”在字面上是一模一樣的颂碘,但是思想里的內(nèi)容卻完全不同异赫。在見面的那一瞬間椅挣,這個(gè)差異是非常大的:

你在想(圓柱):一年多不見了,她還好么塔拳?

前女友在想(球):這個(gè)人好眼熟鼠证,好像認(rèn)識(shí)…


?挑戰(zhàn):用低維表達(dá)高維?

要用語言來描述思維有多困難?這就好比靠抑,當(dāng)你試圖給另一位不在現(xiàn)場(chǎng)的朋友量九,解釋一件剛剛發(fā)生過的事情的時(shí)候,你可以做到哪種程度的還原呢颂碧?

試試用語言來描述你今天的早晨是怎么過的荠列。

當(dāng)你用文字完整描述后,我一定能找到一個(gè)事物或者某個(gè)具體的細(xì)節(jié)载城,它在你文字描述以外肌似,但是卻確實(shí)存在在你今天早晨那個(gè)時(shí)空里。


Source:The Challenger


比如诉瓦,你可能會(huì)跟朋友提到川队,早飯吃了一碗面;但你一定不會(huì)具體去描述面里一共有哪些調(diào)料睬澡。傳遞信息時(shí)固额,缺少了這些細(xì)節(jié)(信息),會(huì)讓聽眾聽到那碗面時(shí)煞聪,在腦海里呈現(xiàn)的一定不是你早上吃的“那碗面”的樣子对雪。

這就好比讓你用平面上(2D)陰影的樣子,來反推3D的形狀米绕。你能做的,只是盡可能的增加描述的視角馋艺,盡可能給聽眾提供不同的2D的素材栅干,來盡量還原3D的效果。

為了解釋腦中“語言”和“思想”之間的關(guān)系(與讀者的情景模型進(jìn)行同步)捐祠,我畫了上面那張對(duì)比圖碱鳞,來幫助傳遞信息。如果要直接用文字來精確描述踱蛀,還要盡量保全信息不丟失窿给,那么我不得不用多得多的文字來描述細(xì)節(jié)。(比如上面的描述中率拒,尚未提及陰影的面積的具體大小崩泡、顏色等等細(xì)節(jié))。

這還只是對(duì)客觀事物的描述猬膨。當(dāng)人在試圖描述更情緒化的主觀感受時(shí)角撞,則更難用具體的文字來表達(dá)。?

比如,當(dāng)你看到Angelina Jordan這樣的小女生谒所,卻能唱出I put a spell on you這樣的歌的時(shí)候热康,請(qǐng)嘗試用語言精確描述你的主觀感受。是不是很難劣领?能講出來話姐军,都是類似“鵝妹子嚶”這類的?這些文字能代表你腦中的感受的多少部分尖淘?1%奕锌?

希望此時(shí),你能更理解所謂 “語言是貧瘠的德澈,而思維則要豐富很多”歇攻。

那么,既然語言在傳遞信息時(shí)丟失了那么多信息梆造,人們?yōu)槭裁蠢斫馄饋斫墒兀孟駴]有遇到太大的問題?

?為什么人們的對(duì)話是輕松的镇辉?

假設(shè)有一種方式屡穗,可以把此刻你腦中的感受,以完全不失真的效果傳遞給另一個(gè)人忽肛。這種信息的傳遞和上面用文字進(jìn)行描述相比村砂,豐富程度會(huì)有多大差異?

可惜屹逛,我們沒有這種工具础废。我們最主要的交流工具,就是語言罕模,靠著對(duì)話评腺,來試圖讓對(duì)方了解自己的處境。

那么淑掌,既然語言這么不精準(zhǔn)蒿讥,又充滿邏輯上的漏洞,信息量又不夠抛腕,那么人怎么能理解芋绸,還以此為基礎(chǔ),建立起來了整個(gè)文明担敌?

比如摔敛,在一個(gè)餐廳里,當(dāng)服務(wù)員說 “火腿三明治要買單了”全封,我們都能知道這和“20號(hào)桌要買單了”指代的是同樣的事情 (Nuberg,1978)舷夺。是什么讓字面上那么大差異的表達(dá)苦酱,也能有效傳遞信息?

人能通過對(duì)話给猾,有效理解語言疫萤,靠的是解讀能力——更具體的點(diǎn),靠的是對(duì)話雙方的共識(shí)和基于共識(shí)的推理能力敢伸。

當(dāng)人接收到低維的語言之后扯饶,會(huì)結(jié)合引用常識(shí)、自身的世界模型(后詳)池颈,來重新構(gòu)建一個(gè)思維中的模型尾序,對(duì)應(yīng)這個(gè)語言所代表的含義。這并不是什么新觀點(diǎn)躯砰,大家熟悉的開復(fù)老師每币,在1991年在蘋果搞語音識(shí)別的時(shí)候,就在采訪里科普琢歇,“人類利用常識(shí)來幫助理解語音”兰怠。

當(dāng)對(duì)話的雙方認(rèn)為對(duì)一件事情的理解是一樣的,或者非常接近的時(shí)候李茫,他們就不用再講揭保。需要溝通的,是那些(彼此認(rèn)為)不一樣的部分魄宏。

當(dāng)你聽到“蘋果”兩個(gè)字的時(shí)候秸侣,你過去建立過的蘋果這個(gè)模型的各個(gè)維度,就被引用出來宠互,包括可能是綠或紅色的味榛、味道的甜、大概拳頭大小等等予跌。如果你聽到對(duì)方說“藍(lán)色的蘋果”時(shí)励负,這和你過去建立的關(guān)于蘋果的模型不同(顏色)。思維就會(huì)產(chǎn)生一個(gè)提醒匕得,促使你想要去同步或者更新這個(gè)模型,“蘋果為什么是藍(lán)色的巾表?”

還記得汁掠,在Part 2 里我們提到的那個(gè)測(cè)試指代關(guān)系的Winograd Schema Challenge么?這個(gè)測(cè)試的名字是根據(jù)Terry Winograd的一個(gè)例子而來的集币。

“議員們拒絕給抗議者頒發(fā)許可證考阱,因?yàn)樗麄?[害怕/提倡] 暴力【瞎叮”

當(dāng) [害怕] 出現(xiàn)在句子當(dāng)中的時(shí)候乞榨,“他們”指的應(yīng)該是議員們秽之;當(dāng)[提倡]出現(xiàn)在句子當(dāng)中的時(shí)候,“他們”則指的是“抗議者”吃既。

1. 人們能夠根據(jù)具體情況考榨,作出判斷,是因?yàn)楦鶕?jù)常識(shí)做出了推理鹦倚,“議員害怕暴力河质;抗議者提倡暴力≌鹦穑”

2. 說這句話的人掀鹅,認(rèn)為這個(gè)常識(shí)對(duì)于聽眾應(yīng)該是共識(shí),就直接把它省略掉了媒楼。

同理乐尊,之前(Part 2)我們舉例時(shí)提到的那個(gè)常識(shí) (“四川火鍋是辣的;日料不是辣的”)划址,也在表達(dá)中被省略掉了扔嵌。常識(shí)(往往也是大多數(shù)人的共識(shí))的總量是不計(jì)其數(shù),而且總體上還會(huì)隨著人類社會(huì)發(fā)展的演進(jìn)而不斷新增猴鲫。

例子1对人,如果你的世界模型里已經(jīng)包含了“華農(nóng)兄弟” (你看過并了解他們的故事),你會(huì)發(fā)現(xiàn)我在Part 2最開始的例子拂共,藏了一個(gè)梗(做成叫花雞)牺弄。但因?yàn)椤叭A農(nóng)兄弟”并不是大多數(shù)人都知道的常識(shí),而是我與特定人群的共識(shí)宜狐,所以你看到這句話時(shí)势告,獲得的信息就比其人多。而不了解這個(gè)梗的人抚恒,看到那里時(shí)就不會(huì)接收到這個(gè)額外的信息咱台,反而會(huì)覺得這個(gè)表達(dá)好像有點(diǎn)點(diǎn)奇怪。

例子2俭驮,創(chuàng)投圈的朋友應(yīng)該都有聽說過 Elevator pitch回溺,就是30秒,把你要做什么事情講清楚混萝。通常的案例諸如:“我們是餐飲界的Uber”遗遵,或者說“我們是辦公室版的Airbnb”。這個(gè)典型結(jié)構(gòu)是“XX版的YY”逸嘀,要讓這句話起到效果车要,前提條件是XX和YY兩個(gè)概念在發(fā)生對(duì)話之前,已經(jīng)納入到聽眾的模型里面去了崭倘。如果我給別人說翼岁,我是“對(duì)話智能行業(yè)的麥肯錫”类垫,要能讓對(duì)方理解,對(duì)方就得既了解對(duì)話智能是什么琅坡,又了解麥肯錫是什么悉患。

基于世界模型的推理?

場(chǎng)景模型是基于某一次對(duì)話的,對(duì)話不同脑蠕,場(chǎng)景模型也不同购撼;而世界模型則是基于一個(gè)人的,相對(duì)而言長(zhǎng)期不變谴仙。

對(duì)世界的感知迂求,包括聲音、視覺晃跺、嗅覺揩局、觸覺等感官反饋,有助于人們對(duì)世界建立起一個(gè)物理上的認(rèn)識(shí)掀虎。對(duì)常識(shí)的理解凌盯,包括各種現(xiàn)象和規(guī)律的感知,在幫助人們生成一個(gè)更完整的模型:世界模型烹玉。

無論精準(zhǔn)驰怎、或者對(duì)錯(cuò),每一個(gè)人的世界模型都不完全一樣二打,有可能是觀察到的信息不同县忌,也有可能是推理能力不一樣。世界模型影響的是人的思維本身继效,繼而影響思維在低維的投影:對(duì)話症杏。

讓我們從一個(gè)例子開始:假設(shè)現(xiàn)在咱們一起來做一個(gè)不那么智障的助理。我們希望這個(gè)助理能夠推薦餐廳酒吧什么的瑞信,來應(yīng)付下面這樣的需求:


當(dāng)用戶說:“我想喝點(diǎn)東西”的時(shí)候厉颤,系統(tǒng)該怎么回答這句話?經(jīng)過Part 2凡简,我相信大家都了解逼友,我們可以把它訓(xùn)練成為一個(gè)意圖“找喝東西的店”,然后把周圍的店檢索出來秤涩,然后回復(fù)這句話給他:“在你附近找到這些選擇”帜乞。

恭喜,咱們已經(jīng)達(dá)到Siri的水平啦溉仑!

但是,剛剛我們開頭就說了状植,要做不那么智障的助理浊竟。這個(gè)“喝東西的店”是奶茶點(diǎn)還是咖啡店怨喘?還是全部都給他?

嗯振定,這就涉及到了推理必怜。我們來手動(dòng)模擬一個(gè)。假設(shè)我們有用戶的Profile數(shù)據(jù)后频,把這個(gè)用上:如果他的偏好中最愛的飲品是咖啡梳庆,就給他推薦咖啡店。?

這樣一來卑惜,我們就可以更“個(gè)性化”的給他回復(fù)了:“在你附近找到這些咖啡店”膏执。

這個(gè)時(shí)候,咱們的AI已經(jīng)達(dá)到了不少“智能系統(tǒng)”最喜歡鼓吹的個(gè)性化概念——“千人千面”啦露久!

然后我們來看這個(gè)概念有多蠢更米。

一個(gè)人喜歡喝咖啡,那么他一輩子的任意時(shí)候就都要喝咖啡么毫痕?人是怎么處理這個(gè)問題的呢征峦?如果用戶是在下午1點(diǎn)這么問,這么回他還好消请;如果是在晚上11點(diǎn)呢栏笆?我們還要給他推薦咖啡店么?還是應(yīng)該給他推薦一個(gè)酒吧臊泰?

或者蛉加,除此之外,如果今天是他的生日因宇,那么我們是不是該給他點(diǎn)不同的東西七婴?或者,今天是圣誕節(jié)察滑,該不該給他推薦熱巧克力打厘?

你看,時(shí)間是一個(gè)維度贺辰,在這個(gè)維度上的不同值都在影響給用戶回復(fù)什么不同的話户盯。?

時(shí)間和用戶的Profile不同的是:

1. 時(shí)間這個(gè)維度上的值有無限多;

2. 每個(gè)刻度還都不一樣饲化。比如雖然生日是同一個(gè)日期莽鸭,但是過生日的次數(shù)卻不重復(fù);


除了時(shí)間這個(gè)維度以外吃靠,還有空間硫眨。

于是我們把空間這個(gè)維度疊加(到時(shí)間)上去。你會(huì)發(fā)現(xiàn)巢块,如果用戶在周末的家里問這個(gè)問題(可能想叫奶茶外賣到家礁阁?)巧号,和他在上班時(shí)間的辦公室里問這個(gè)問題(可能想出去走走換換思路),咱們給他的回復(fù)也應(yīng)該不同姥闭。

光是時(shí)空這兩個(gè)維度丹鸿,就有無窮多的組合,用"if then"的邏輯也沒法全部手動(dòng)寫完棚品。我們?cè)鞕C(jī)器人的工具靠欢,到這個(gè)需求,就開始捉襟見肘了铜跑。

何況時(shí)間和空間门怪,只是世界模型當(dāng)中最顯而易見的兩個(gè)維度。還有更多的疼进,更抽象的維度存在薪缆,并且直接影響與用戶的對(duì)話。比如伞广,人物之間的關(guān)系拣帽;人物的經(jīng)歷;天氣的變化嚼锄;人和地理位置的關(guān)系(是經(jīng)常來出差减拭、是當(dāng)?shù)赝林⑹堑谝淮蝸砺糜危┑鹊鹊鹊惹蟆T蹅兞牡竭@里拧粪,感覺還在聊對(duì)話系統(tǒng)么?是不是感覺有點(diǎn)像在聊推薦系統(tǒng)沧侥?

要想效果更好可霎,這些維度的因素都要疊加在一起進(jìn)行因果推理,然后把結(jié)果給用戶宴杀。

至此癣朗,影響人們對(duì)話的,光是信息(還不含推理)至少就有這三部分:明文(含上下文)+ 場(chǎng)景模型(Context)+ 世界模型旺罢。

普通人都能毫不費(fèi)力地完成這個(gè)工作旷余。但是深度學(xué)習(xí)只能處理基于明文的信息。對(duì)于場(chǎng)景模型和世界模型的感知扁达、生成正卧、基于模型的推理,深度學(xué)習(xí)統(tǒng)統(tǒng)無能為力跪解。

這就是為什么現(xiàn)在炙手可熱的深度學(xué)習(xí)無法實(shí)現(xiàn)真正的智能(AGI)的本質(zhì)原因:不能進(jìn)行因果推理炉旷。

根據(jù)世界模型進(jìn)行推理的效果,不僅僅體現(xiàn)上在對(duì)話上,還能應(yīng)用在所有現(xiàn)在成為AI的項(xiàng)目上窘行,比如自動(dòng)駕駛骏啰。

經(jīng)過大量訓(xùn)練的自動(dòng)駕駛汽車,在遇到偶發(fā)狀況時(shí)抽高,就沒有足夠的訓(xùn)練素材了。比如透绩,突然出現(xiàn)在路上的嬰兒車和突然滾到路上的垃圾桶翘骂,都會(huì)被視為障礙物,但是剎不住車的情況下帚豪,一定要撞一個(gè)的時(shí)候碳竟,撞哪一個(gè)?

又比如狸臣,對(duì)侯世達(dá)(Douglas Hofstardler )而言莹桅,“駕駛”意味著當(dāng)要趕著去一個(gè)地方的時(shí)候,要選擇超速還是不超速烛亦;要從堵車的高速下來诈泼,還是在高速上慢慢跟著車流走...這些決策都是駕駛的一部分。他說:“世界上各方面的事情都在影響著“駕駛”這件事的本質(zhì)?”煤禽。

?人腦有兩套系統(tǒng):系統(tǒng)1?系統(tǒng)2?

關(guān)于 “系統(tǒng)1和系統(tǒng)2”的詳情铐达,請(qǐng)閱讀 Thinking, Fast and Slow, by Daniel Kahneman,一本非常好的書檬果,對(duì)人的認(rèn)知工作是如何展開的進(jìn)行了深入的分析瓮孙。在這兒,我給還不了解的朋友介紹一下选脊,以輔助本文前后的觀點(diǎn)杭抠。

心理學(xué)家認(rèn)為,人思考和認(rèn)知工作分成了兩個(gè)系統(tǒng)來處理:

系統(tǒng)1是快思考:無意識(shí)恳啥、快速偏灿、不怎么費(fèi)腦力、無需推理

系統(tǒng)2是慢思考:需要調(diào)動(dòng)注意力角寸、過程更慢菩混、費(fèi)腦力、需要推理

系統(tǒng)1先上扁藕,遇到搞不定的事情沮峡,系統(tǒng)2會(huì)出面解決。

系統(tǒng)1做的事情包括: 判斷兩個(gè)物體的遠(yuǎn)近亿柑、追溯聲音的來源邢疙、完形填空 ( "我愛北京天安? ? ?" )等等。

順帶一提,下象棋的時(shí)候疟游,一眼看出這是一步好棋呼畸,這個(gè)行為也是系統(tǒng)1實(shí)現(xiàn)的——前提是你是一位優(yōu)秀的玩家。

對(duì)于中國(guó)學(xué)生而言颁虐,你突然問他:“7乘以7”蛮原,他會(huì)不假思索的說:“49!”這是系統(tǒng)1在工作另绩,因?yàn)槲覀冊(cè)谛W(xué)都會(huì)背99乘法表儒陨。這個(gè)49并非來自計(jì)算結(jié)果,而是背下來的(反復(fù)重復(fù))笋籽。

相應(yīng)的蹦漠,如果你問:“3287 x 2234等于多少?”车海,這個(gè)時(shí)候人就需要調(diào)用世界模型中的乘法規(guī)則笛园,加以應(yīng)用(計(jì)算)。這就是系統(tǒng)2的工作侍芝。

另外研铆,在系統(tǒng)1所設(shè)定的世界里,貓不會(huì)像狗一樣汪汪叫州叠。若事物違反了系統(tǒng)1所設(shè)定的世界模型蚜印,系統(tǒng)2也會(huì)被激活。


在語言方面留量,Yoshua Bengio 認(rèn)為系統(tǒng)1不做與語言有關(guān)的工作窄赋;系統(tǒng)2才負(fù)責(zé)語言工作。對(duì)于深度學(xué)習(xí)而言楼熄,它更適合去完成系統(tǒng)1的工作忆绰,實(shí)際上它根本沒有系統(tǒng)2的功能

關(guān)于這兩個(gè)系統(tǒng)可岂,值得一提的是错敢,人是可以通過訓(xùn)練,把部分系統(tǒng)2才能做的事情缕粹,變成系統(tǒng)1來完成的稚茅。比如中國(guó)學(xué)生得經(jīng)過“痛苦的記憶過程”才能熟練掌握99乘法表,而不是隨著出生到長(zhǎng)大的自然經(jīng)驗(yàn)平斩,慢慢學(xué)會(huì)的亚享。

但是這里有2個(gè)有意思的特征:

1. 變成系統(tǒng)1來處理問題的時(shí)候,可以節(jié)約能量绘面。人們偏向相信自己的經(jīng)驗(yàn)欺税,是因?yàn)槟X力對(duì)能量的消耗很大侈沪,這是一個(gè)節(jié)能的做法。

2. 變成系統(tǒng)1的時(shí)候晚凿,會(huì)犧牲辯證能力亭罪,因?yàn)橄到y(tǒng)1對(duì)于邏輯相關(guān)的問題一無所知〖呋啵“我做這個(gè)事情已經(jīng)幾十年了”這種經(jīng)驗(yàn)主義思維就是典型案例应役。

想想自己長(zhǎng)期積累的案例是如何在影響自己做判斷的?

?單靠深度學(xué)習(xí)搞不定語言燥筷,現(xiàn)在不行扛吞,將來也不行?

在人工智能行業(yè)里,你經(jīng)常會(huì)聽到有人這么說 “盡管當(dāng)前技術(shù)還實(shí)現(xiàn)不了理想中的人工智能荆责,但是技術(shù)是會(huì)不斷演進(jìn)的,隨著數(shù)據(jù)積累的越來越多亚脆,終將會(huì)實(shí)現(xiàn)讓人滿意的人工智能做院。”

如果這個(gè)說法濒持,是指寄希望于僅靠深度學(xué)習(xí)键耕,不斷積累數(shù)據(jù)量,就能翻盤——那就大錯(cuò)特錯(cuò)了柑营。

無論你怎么優(yōu)化“馬車”的核心技術(shù)(比如更壯屈雄、更多的馬),都無法以此造出汽車(下圖右)官套。?

對(duì)于大眾而言酒奶,技術(shù)的可演進(jìn)性,是以宏觀的視角看人類和技術(shù)的關(guān)系奶赔。但是發(fā)動(dòng)機(jī)的演化和馬車的關(guān)鍵技術(shù)沒有半點(diǎn)關(guān)系惋嚎。

深度學(xué)習(xí)領(lǐng)域的3大牛,都認(rèn)為單靠深度學(xué)習(xí)這條路(不能最終通向AGI)站刑。感興趣的朋友可以沿著這個(gè)方向去研究:?

Geoffrey Hinton的懷疑:“我的觀點(diǎn)是都扔掉重來吧”

Yoshua Bengio的觀點(diǎn):“如果你對(duì)于這個(gè)每天都在接觸的世界另伍,有一個(gè)好的因果模型,你甚至可以對(duì)不熟悉的情況進(jìn)行抽象绞旅。這很關(guān)鍵......機(jī)器不能摆尝,因?yàn)闄C(jī)器沒有這些因果模型。我們可以手工制作這些模型因悲,但是這遠(yuǎn)不足夠堕汞。我們需要能發(fā)現(xiàn)因果模型的機(jī)器』瘟眨”

Yann LeCun的觀點(diǎn):“A learning predictive world model is what we’re missing today, and in my opinion is the biggest obstacle to significant progress in AI.”

至于深度學(xué)習(xí)在將來真正的智能上扮演的角色臼朗,在這兒我引用Gary Marcus的說法:“I don’t think that deep learning won’t play a role in natural understanding, only that deep learning can’t succeed on its own.”


?解釋人工智障產(chǎn)品?

現(xiàn)在邻寿,我們了解了人們對(duì)話的本質(zhì)是思維的交換,而遠(yuǎn)不只是明文上的識(shí)別和基于識(shí)別的回復(fù)视哑。而當(dāng)前的人工智能產(chǎn)品則完全無法實(shí)現(xiàn)這個(gè)效果绣否。那么當(dāng)用戶帶著人類的世界模型和推理能力來跟機(jī)器,用自然語言交互時(shí)挡毅,就很容易看到破綻蒜撮。

Sophia是一個(gè)技術(shù)上的騙局(凡是鼓吹Sophia是真AI的,要么是不懂跪呈,要么是忽悠)段磨;

現(xiàn)在的AI,都不會(huì)有真正的智能(推理能力什么的不存在的耗绿,包括Alpha go在內(nèi))苹支;

只要是深度學(xué)習(xí)還是主流,就不用擔(dān)心AI統(tǒng)治人類误阻;

對(duì)話產(chǎn)品感覺用起來智障债蜜,都是因?yàn)橄胩^思維,直接模擬對(duì)話(而現(xiàn)在也只能這樣)究反;

“用的越多寻定,數(shù)據(jù)越多,智能會(huì)越強(qiáng)精耐,產(chǎn)品就會(huì)越好狼速,使用就會(huì)越多”——對(duì)于任務(wù)類對(duì)話產(chǎn)品,這是一個(gè)看上去很酷卦停,實(shí)際上不靠譜的觀點(diǎn)向胡;

一個(gè)AI agent,能對(duì)話多少輪惊完,毫無意義捷枯;

to C的助理產(chǎn)品做不好,是因?yàn)榻鉀Q不了“如何獲得用戶的世界模型數(shù)據(jù)专执,并加以利用”這個(gè)問題淮捆;

to B的對(duì)話智能公司為何很難規(guī)模化本股?(因?yàn)閳?chǎng)景模型是手動(dòng)生成的)

先有智能攀痊,后有語言:要做到真正意義上的自然語言對(duì)話,至少要實(shí)現(xiàn)基于常識(shí)和世界模型的推理能力拄显。而這一點(diǎn)如果能實(shí)現(xiàn)苟径,那么我們作為人類,就可能真的需要開始擔(dān)心前文提到的智能了躬审。

不要用NLP評(píng)價(jià)一個(gè)對(duì)話智能產(chǎn)品:年底了棘街,有些媒體開始出各種AI公司榜單蟆盐,其中有不少把做對(duì)話的公司分在NLP下面。這就好比遭殉,不要用觸摸屏來衡量一款智能手機(jī)石挂。在這兒我不是說觸摸屏或者NLP不重要(Essential),反而因?yàn)樘匾讼瘴郏@個(gè)環(huán)節(jié)成為了每一家的標(biāo)配痹愚,以至于在這方面基本已經(jīng)做到頭了,差異不過1%蛔糯。

對(duì)于一個(gè)對(duì)話類產(chǎn)品而言拯腮,NLU盡管重要,但只應(yīng)占個(gè)整體配件的5-10%左右蚁飒。更進(jìn)一步來說动壤,甚至意圖識(shí)別和實(shí)體提取的部分用大廠的,產(chǎn)品間差異也遠(yuǎn)小于對(duì)話管理部分的差距淮逻。真正決定產(chǎn)品的是剩下的90%的系統(tǒng)琼懊。

到此,是不是有一種絕望的感覺弦蹂?這些學(xué)界和行業(yè)的大牛都沒有解決方案,或者說連有把握的思路都沒有强窖。是不是做對(duì)話智能這類的產(chǎn)品就沒戲了凸椿?上限就是這樣了么?

不是翅溺。對(duì)于一項(xiàng)技術(shù)而言脑漫,可能確實(shí)觸底了;但是對(duì)于應(yīng)用和產(chǎn)品設(shè)計(jì)而言咙崎,并不是由一個(gè)技術(shù)決定的优幸,而是很多技術(shù)的結(jié)合,這里還有很大的空間褪猛。

作為產(chǎn)品經(jīng)理网杆,讓我來換一個(gè)角度。我們來研究一下伊滋,既然手中的工具是這些碳却,我們能用他們來做點(diǎn)什么?



關(guān)于作者

作者M(jìn)ingke笑旺,正在從事對(duì)話智能方面的創(chuàng)業(yè)昼浦,為世界一百強(qiáng)企業(yè)提供對(duì)話智能應(yīng)用的咨詢和解決方案。上次《為什么現(xiàn)在的人工智能助理都像人工智障》一文發(fā)出來之后筒主,認(rèn)識(shí)結(jié)交了不少行業(yè)內(nèi)的朋友关噪。希望這次鸟蟹,把過去一段時(shí)間的思考與大家分享,能給行業(yè)內(nèi)的新老朋友們一些啟發(fā)使兔,有興趣溝通和碰撞的也歡迎與我聯(lián)系建钥。

歡迎行業(yè)里的新老朋友勾搭吐槽,微信:mingke27 (請(qǐng)注明稱呼+所在機(jī)構(gòu))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末火诸,一起剝皮案震驚了整個(gè)濱河市锦针,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖割以,帶你破解...
    沈念sama閱讀 221,576評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件墩崩,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡馋吗,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門秋秤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來宏粤,“玉大人,你說我怎么就攤上這事灼卢∩馨ィ” “怎么了?”我有些...
    開封第一講書人閱讀 168,017評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵鞋真,是天一觀的道長(zhǎng)崇堰。 經(jīng)常有香客問我,道長(zhǎng)涩咖,這世上最難降的妖魔是什么海诲? 我笑而不...
    開封第一講書人閱讀 59,626評(píng)論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮檩互,結(jié)果婚禮上特幔,老公的妹妹穿的比我還像新娘。我一直安慰自己闸昨,他們只是感情好蚯斯,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,625評(píng)論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著饵较,像睡著了一般溉跃。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上告抄,一...
    開封第一講書人閱讀 52,255評(píng)論 1 308
  • 那天撰茎,我揣著相機(jī)與錄音,去河邊找鬼打洼。 笑死龄糊,一個(gè)胖子當(dāng)著我的面吹牛逆粹,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播炫惩,決...
    沈念sama閱讀 40,825評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼僻弹,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了他嚷?” 一聲冷哼從身側(cè)響起蹋绽,我...
    開封第一講書人閱讀 39,729評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎筋蓖,沒想到半個(gè)月后卸耘,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,271評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡粘咖,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,363評(píng)論 3 340
  • 正文 我和宋清朗相戀三年蚣抗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓮下。...
    茶點(diǎn)故事閱讀 40,498評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡翰铡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出讽坏,到底是詐尸還是另有隱情锭魔,我是刑警寧澤,帶...
    沈念sama閱讀 36,183評(píng)論 5 350
  • 正文 年R本政府宣布路呜,位于F島的核電站迷捧,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏拣宰。R本人自食惡果不足惜党涕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,867評(píng)論 3 333
  • 文/蒙蒙 一烦感、第九天 我趴在偏房一處隱蔽的房頂上張望巡社。 院中可真熱鬧,春花似錦手趣、人聲如沸晌该。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽朝群。三九已至,卻和暖如春中符,著一層夾襖步出監(jiān)牢的瞬間姜胖,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工淀散, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留右莱,地道東北人蚜锨。 一個(gè)月前我還...
    沈念sama閱讀 48,906評(píng)論 3 376
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像慢蜓,于是被迫代替她去往敵國(guó)和親亚再。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,507評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容