人工智障 2:你所看到的AI和智能無關(guān)(上)

“?Artificial-Intelligently Challenged?”

前言

大家好霞丧,我又出來懟人了蕴轨。

兩年前请敦,寫了一篇文章《為什么現(xiàn)在的人工智能助理都像人工智障》秃嗜,當(dāng)時(shí)主要是懟“智能助理們”。這次呢則是表達(dá)?“我不是針對(duì)誰澎羞,只是現(xiàn)在所有的深度學(xué)習(xí)都搞不定對(duì)話AI”髓绽,以及“你看都這樣了,那該怎么做AI產(chǎn)品”妆绞。


閱讀門檻?

時(shí)間:這篇真的太長了(近3萬字)根據(jù)預(yù)覽同學(xué)們的反饋顺呕,通常第一次閱讀到Part 3時(shí),會(huì)消耗很多精力括饶,但讀完P(guān)art 3才發(fā)現(xiàn)是精華(同時(shí)也是最燒腦的部分)株茶。請(qǐng)大家酌情安排閱讀時(shí)間。

可讀性:我會(huì)在內(nèi)容里邀請(qǐng)你一起思考(無需專業(yè)知識(shí))图焰,所以可能不適合通勤時(shí)間閱讀启盛。你的閱讀收益取決于在過程中思考的參與程度。

適合人群:對(duì)話智能行業(yè)從業(yè)者楞泼、AIPM驰徊、關(guān)注AI的投資人、對(duì)AI有強(qiáng)烈興趣的朋友堕阔、關(guān)心自己的工作會(huì)不會(huì)被AI代替的朋友棍厂;

關(guān)于鏈接:閱讀本文時(shí),無需閱讀每個(gè)鏈接里的內(nèi)容超陆,這并不會(huì)影響對(duì)本文的理解牺弹。


關(guān)于人工智障四個(gè)字

上一片文章發(fā)出后,有朋友跟我說时呀,標(biāo)題里的“人工智障”這個(gè)詞貌似有點(diǎn)offensive张漂。作為學(xué)語言出身的,我來解釋一下這個(gè)原因:

最開始呢谨娜,我是在跟一位企業(yè)咨詢顧問聊人工智能這個(gè)賽道的現(xiàn)狀航攒。因?yàn)閷?duì)話是用英語展開的施禾,當(dāng)時(shí)為了表達(dá)我的看法? “現(xiàn)在的智能助理行業(yè)正處在一種難以逾越的困境當(dāng)中”创淡,我就跟她說“Currently all the digital assistants are Artificial-Intelligently challenged”。

她聽了之后哈哈一笑⊥谖福“intelligently challenged”同時(shí)也是英文中對(duì)智障的委婉表達(dá)辽剧。 假設(shè)不了解這個(gè)常識(shí)族淮,她就可能忽略掉這個(gè)梗椭迎,盡管能明白核心意思,只是不會(huì)覺得有什么好笑的瘾敢。那么信息在傳遞中就有損失拍冠。

寫文章時(shí),我把這個(gè)信息翻譯成中文簇抵,就成了“人工智障”庆杜。但是因?yàn)橹形恼Z法的特性,有些信息就lost in translation了正压。比如實(shí)際表達(dá)的是“一種困境的狀態(tài)”而不是“一件事”欣福。

(順便說一下,中文的智障焦履,實(shí)際上是政治正確的稱呼,詳見特殊奧運(yùn)會(huì)的用詞方法雏逾。)

為什么要寫那么多字來解釋這個(gè)措辭嘉裤?因?yàn)?b>不同的人,看見相同的字栖博,也會(huì)得到不同的理解屑宠。這也是我們要討論的重點(diǎn)之一。

那么仇让,我們開始吧典奉。


Part 1?

對(duì)話智能的表現(xiàn):智障

Sophia in?AI for Good Global Summit 2017.Source:??ITU

2017年10月,上圖這個(gè)叫Sophia的機(jī)器人丧叽,被沙特阿拉伯授予了正式的公民身份卫玖。公民身份,這個(gè)評(píng)價(jià)比圖靈測試還要牛踊淳。何況還是在沙特假瞬,他們才剛剛允許女性開車不久(2017年9月頒布的法令)。

Sophia經(jīng)常參加各種會(huì)迂尝、“發(fā)表演講”脱茉、“接受采訪”,比如去聯(lián)合國對(duì)話垄开,表現(xiàn)出來非常類似人類的言談琴许;去和Will Smith拍MV;接受Good morning Britain之類的主流媒體的采訪溉躲;甚至公司創(chuàng)始人參加Jim Fallon的訪談時(shí)一本正經(jīng)的說Sophia是“basically alive”榜田。


Basically alive. 要知道寸认,西方的吃瓜群眾都是看著《終結(jié)者》長大的,前段時(shí)間還看了《西部世界》串慰。在他們的世界模型里偏塞,“機(jī)器智能會(huì)覺醒” 這個(gè)設(shè)定是遲早都會(huì)發(fā)生的。

普通大眾開始嚇得瑟瑟發(fā)抖邦鲫。不僅開始擔(dān)心自己的工作是不是會(huì)被替代灸叼,還有很多人開始擔(dān)心AI會(huì)不會(huì)統(tǒng)治人類,這樣的話題展開庆捺」沤瘢“未來已來”,很多人都以為真正的人工智能已經(jīng)近在咫尺了滔以。

只是捉腥,有些人可能會(huì)注意到有些不合理的地方:“等等,人工智能都要威脅人類了你画,為啥我的Siri還那么蠢抵碟?”


Source:?Dumb And Dumber: Comparing Alexa, Siri, Cortana And The Google Assistant, Forbes, May 2018

我們來看看到2018年末在對(duì)話智能領(lǐng)域,各方面究竟發(fā)展的如何了坏匪。


?“?不要日本菜?

我在2016年底做過一個(gè)測試拟逮,對(duì)幾個(gè)智能助理提一個(gè)看似簡單的需求:“推薦餐廳,不要日本菜”适滓。只是各家的AI助理都會(huì)給出一堆餐廳推薦敦迄,全是日本菜。

2年過去了凭迹,在這個(gè)問題的處理上有進(jìn)展么罚屋?我們又做了一次測試:?

結(jié)果是依然沒有解決⌒岢瘢“不要”兩個(gè)字被所有助理一致忽略了脾猛。

為什么要關(guān)注“不要”兩個(gè)字?之前我去到一家某非常有名的智能語音創(chuàng)業(yè)公司朽砰,聊到這個(gè)問題時(shí)尖滚,他家的PM顯出疑惑:“這個(gè)邏輯處理有什么用?我們后臺(tái)上看到用戶很少提出這類表達(dá)啊瞧柔∑崤”

聽到這樣的評(píng)論,基本可以確定:這家公司還沒有深入到專業(yè)服務(wù)對(duì)話領(lǐng)域造锅。

場景方面撼唾,一旦深入進(jìn)服務(wù)領(lǐng)域里的多輪對(duì)話,很容易會(huì)遇到類似這樣的表達(dá) :“我不要這個(gè)哥蔚,有更便宜的么倒谷?”蛛蒙。后臺(tái)沒有遇到,只能說用戶還沒開始服務(wù)就結(jié)束了渤愁。場景方面與AI公司的domain選擇有關(guān)牵祟。

但是在技術(shù)方面,則是非常重要的抖格。因?yàn)檫@正是真正智能的核心特點(diǎn)诺苹。我們將在part 2&3詳細(xì)聊聊這個(gè)問題。現(xiàn)在先拋個(gè)結(jié)論:這個(gè)問題解決不了雹拄,智能助理會(huì)一直智障下去的收奔。


“??To C 團(tuán)隊(duì)轉(zhuǎn) To B

自從2015年幾個(gè)重要的深度學(xué)習(xí)在開發(fā)者當(dāng)中火了起來,大小公司都想做“Her”這樣面對(duì)個(gè)人消費(fèi)者的通用型智能助理(To C類產(chǎn)品的終極目標(biāo))滓玖。一波熱錢投給最有希望的種子隊(duì)伍(擁有Fancy背景)之后坪哄,全滅。目前為止势篡,在2C這方面的所有商用產(chǎn)品翩肌,無論是巨頭還是創(chuàng)業(yè)公司,全部達(dá)不到用戶預(yù)期殊霞。

在人們的直覺里摧阅,會(huì)認(rèn)為“智能助理”,處理的是一些日常任務(wù)绷蹲,不涉及專業(yè)的需求,應(yīng)該比“智能專家”好做顾孽。這是延續(xù)“人”的思路祝钢。推薦餐廳、安排行程是人人都會(huì)做的事情若厚;卻只有少數(shù)受過專業(yè)訓(xùn)練的人能夠處理金融拦英、醫(yī)療問診這類專業(yè)問題。

而對(duì)于現(xiàn)在的AI测秸,情況正好相反“坦溃現(xiàn)在能造出在圍棋上打敗柯潔的AI,但是卻造不出來能給柯潔管理日常生活的AI霎冯。

隨著to C助理賽道的崩盤铃拇,To B or not to B已經(jīng)不再是問題,因?yàn)橐呀?jīng)沒得選了沈撞,只能To B慷荔。這不是商業(yè)模式上的選擇,而是技術(shù)的限制缠俺。目前To B显晶,特別是限定領(lǐng)域的產(chǎn)品贷岸,相對(duì)To C類產(chǎn)品更可行:一個(gè)原因是領(lǐng)域比較封閉,用戶從思想到語言磷雇,不容易發(fā)揮跑題偿警;另一方面則是數(shù)據(jù)充分。

只是To B的公司都很容易被當(dāng)成是做“外包”的唯笙。因?yàn)榭蛻羰且粋€(gè)個(gè)談下來的螟蒸,項(xiàng)目是一個(gè)個(gè)交付的,這意味著增長慢睁本,靠人堆尿庐,沒有復(fù)利帶來的指數(shù)級(jí)增長。大家紛紛表示不開心呢堰。

這個(gè)“幫人造機(jī)器人”的業(yè)務(wù)有點(diǎn)像“在網(wǎng)頁時(shí)代幫人建站”抄瑟。轉(zhuǎn)成To B的團(tuán)隊(duì)經(jīng)常受到資本的質(zhì)疑: “你這個(gè)屬于做項(xiàng)目,怎么規(guī)耐魈郏化呢皮假?”

要知道,國內(nèi)的很多投資機(jī)構(gòu)和里面的投資經(jīng)理入行的時(shí)間骂维,是在國內(nèi)的移動(dòng)互聯(lián)起來的那一波惹资。“Scalability”或者“高速增長”是體系里最重要的指標(biāo)航闺,沒有之一褪测。而做項(xiàng)目這件事,就是Case by case潦刃,要增長就要堆人侮措,也就很難出現(xiàn)指數(shù)級(jí)增長。這就有點(diǎn)尷尬了乖杠。

“你放心分扎,我有SaaS!哦不胧洒,是AIaaS畏吓。我可以打造一個(gè)平臺(tái),上面有一系列工具卫漫,可以讓客戶們自己組裝機(jī)器人菲饼。”?

然而汛兜,這些想做技能平臺(tái)的創(chuàng)業(yè)公司巴粪,也沒有一個(gè)成功的。短期也不可能成功。


Yann LeCun對(duì)AIaas的看法

主要的邏輯是這樣的:你給客戶提供工具肛根,但他需要的是雕像——這中間還差了一個(gè)雕塑家辫塌。佐證就是那些各家試圖開放“對(duì)話框架”給更小的開發(fā)者,甚至是服務(wù)提供者派哲,幫助他們“3分鐘開發(fā)出自己的AI機(jī)器人”臼氨,具體就不點(diǎn)名了。自己都開發(fā)不出來一個(gè)讓人滿意的產(chǎn)品芭届,還想抽象一個(gè)范式出來讓別人沿用你的(不work的)框架储矩?

不過,我認(rèn)為MLaaS在長期的成功是有可能的褂乍,但還需要行業(yè)發(fā)展更為成熟的時(shí)候持隧,現(xiàn)在為時(shí)尚早。具體分析我們?cè)诤竺鍼art 5會(huì)談到逃片。


“?音箱的成功和智能的失敗 ”

對(duì)話這個(gè)領(lǐng)域屡拨,另一個(gè)比較火的賽道是智能音箱。

各大主要科技公司都出了自己的智能音箱褥实,騰訊叮當(dāng)呀狼、阿里的天貓精靈、小米音箱损离、國外的Alexa哥艇、Google的音箱等等。作為一個(gè)硬件品類僻澎,這其實(shí)是個(gè)還不錯(cuò)的生意貌踏,基本屬于制造業(yè)。

不僅出貨不差窟勃,還被寄予期望哩俭,能夠成為一個(gè)生態(tài)的生意——核心邏輯看上去也是充滿想象力的:

超級(jí)終端:在后移動(dòng)時(shí)代,每家都想像iphone一樣搶用戶的入口拳恋。只要用戶習(xí)慣使用語音來獲得咨詢或者服務(wù),甚至可以像Xbox/ps一樣砸捏,硬件賠錢賣谬运,軟件來掙錢;

用語音做OS:開發(fā)者打造各類語音的技能垦藏,然后通過大量“離不開的技能” 反哺這個(gè)OS的市場占有梆暖;

提供開發(fā)者平臺(tái):像Xcode一樣,給開發(fā)者提供應(yīng)用開發(fā)的工具和分發(fā)平臺(tái)掂骏、提供使用服務(wù)的流量轰驳。

可是,這些技能使用的實(shí)際情況是這樣的:?

Source:?Statista

萬眾期待的killer app并沒有出現(xiàn);

基本沒有商業(yè)服務(wù)型的應(yīng)用级解;

技能開發(fā)者都沒賺到錢冒黑,也不知道怎么賺錢;

大部分高頻使用的技能都沒有商業(yè)價(jià)值——用戶用的最多的就是“查天氣”

沒有差異性:智能的差異嘛基本都沒有的事兒勤哗。


?皇帝的新人工智能?

回過頭來抡爹,我們?cè)賮砜磩倓偰俏簧程匕⒗墓瘢琒ophia芒划。既然剛剛提到的那么多公司投入了那么多錢和科學(xué)家冬竟,都搞成這樣,憑什么這個(gè)Sophia能一鳴驚人民逼?

因?yàn)镾ophia的“智能” 是個(gè)騙局泵殴。

可以直接引用Yann LeCun對(duì)此的評(píng)價(jià), “這完全是鬼扯”拼苍。?

簡單來說笑诅,Sophia是一個(gè)帶喇叭的木偶——在各種大會(huì)上的發(fā)言和采訪的內(nèi)容都是人工撰寫,然后用人人都有的語音合成做輸出映屋。卻被宣傳成為是其“人工智能”的自主意識(shí)言論苟鸯。

這還能拿“公民身份”,可能是人類公民被黑的最慘的一次棚点。這感覺早处,好像是我家的橘貓被一所985大學(xué)授予了土木工程學(xué)士學(xué)位。

其實(shí)對(duì)話系統(tǒng)里瘫析,用人工來撰寫內(nèi)容砌梆,或者使用模版回復(fù),這本來就是現(xiàn)在技術(shù)的現(xiàn)狀(在后面我們會(huì)展開)贬循。

但刻意把“非智能”的產(chǎn)物說成是“智能”的表現(xiàn)咸包,這就不對(duì)了。

考慮到大部分吃瓜群眾是通過媒體渠道來了解當(dāng)前技術(shù)發(fā)展的杖虾,跟著炒作的媒體(比如被點(diǎn)名的Tech Insider)都是這場騙局的共犯烂瘫。這些不知道是無知還是無良的文科生,真的沒有做好新聞工作者份內(nèi)的調(diào)查工作奇适。

最近這股妖風(fēng)也吹到了國內(nèi)的韭菜園里坟比。?

Sophia出現(xiàn)在了王力宏的一首講AI的MV里;然后又2018年11月跑去給大企業(yè)站臺(tái)嚷往。

真的葛账,行業(yè)內(nèi)認(rèn)真做事兒的小伙伴,都應(yīng)該站出來皮仁,讓大家更清晰的知道現(xiàn)在AI——或者說機(jī)器學(xué)習(xí)的邊界在哪兒籍琳。不然甲方爸爸們信以為真了菲宴,突然指著sophia跟你說,“ 別人都能這么自然趋急,你也給我整一個(gè)喝峦。”

你怕不得裝個(gè)真人進(jìn)去宣谈?

對(duì)了愈犹,說到這兒,確實(shí)現(xiàn)在也有:用人——來偽裝成人工智能——來模擬人闻丑,為用戶服務(wù)漩怎。

Source:?The?Guardian

國內(nèi)的案例典型的就是銀行用的大堂機(jī)器人,其實(shí)是真人在遠(yuǎn)程語音(所謂Tele presence)嗦嗡。美國有X.ai勋锤,做基于Email的日程管理的。只是這個(gè)AI到了下午5點(diǎn)就要下班侥祭。

當(dāng)然叁执,假如我是這些騙局背后開發(fā)者,被質(zhì)疑的時(shí)候矮冬,我還可以強(qiáng)行拉回人工智能上:“這么做是為了積累真正的對(duì)話數(shù)據(jù)谈宛,以后用來做真的AI對(duì)話系統(tǒng)識(shí)別的訓(xùn)練√ナ穑”

這么說對(duì)外行可能是毫無破綻的吆录。但是真正行業(yè)內(nèi)干正經(jīng)事的人,都應(yīng)該像傅盛那樣站出來琼牧,指明這些做法是騙人:“全世界沒有一家能做出來......做不到恢筝,一定做不到”

人家沙特是把AI當(dāng)成人巨坊,這些套路是把人當(dāng)成AI撬槽。然后大眾就開始分不清楚究竟什么是AI了。


?人工智能究竟(tmd)指的是什么趾撵?

另一方面侄柔,既然AI現(xiàn)在的那么蠢,為什么馬一龍 (Elon Musk) 卻說“AI很有可能毀滅人類”占调;霍金甚至直接說?“AI可能是人類文明里最糟糕的事件”勋拟。

而在另一邊,F(xiàn)acebook和Google的首席科學(xué)家卻在說妈候,現(xiàn)在的AI都是渣渣,根本不需要擔(dān)心挂滓,甚至應(yīng)該推翻重做苦银。

大家該相信誰的?一邊是要去火星的男人,和說不定已經(jīng)去了火星的男人幔虏;另一邊是當(dāng)前兩家科技巨頭的領(lǐng)軍人物纺念。

其實(shí)他們說的都對(duì),因?yàn)檫@里說到的“人工智能”是兩碼事想括。

馬一龍和霍金擔(dān)心的人工智能陷谱,是由人造出來的真正的智能,即通用人工智能(AGI, Artificial General Intelligence)甚至是超級(jí)智能(Super Intelligence)瑟蜈。

而Yann LeCun 和Hinton指的人工智能則是指的當(dāng)前用來實(shí)現(xiàn)“人工智能效果”的技術(shù)(基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí))烟逊。這兩位的觀點(diǎn)是“用這種方式來實(shí)現(xiàn)人工智能是行不通的”。

兩者本質(zhì)是完全不同的铺根,一個(gè)指的是結(jié)果宪躯,一個(gè)指的是(現(xiàn)在的)過程。

那么當(dāng)我們?cè)谟懻撊斯ぶ悄艿臅r(shí)候位迂,究竟在說什么访雪?

John McCathy


John McCathy在1956年和Marvin Minsky,Nathaniel Rochester 以及Claude Shannon在達(dá)特貌似研討會(huì)上打造了AI這個(gè)詞掂林,但是到目前為止臣缀,學(xué)界工業(yè)界并沒有一個(gè)統(tǒng)一的理解。

最根本的問題是目前人類對(duì)“智能”的定義還不夠清楚泻帮。何況人類本身是否是智能的最佳體現(xiàn)精置,還不一定呢。想想每天打交道的一些人:)

一方面刑顺,在大眾眼中氯窍,人工智能是 “人造出來的,像人的智能”蹲堂,比如Siri狼讨。同時(shí),一個(gè)AI的水平高低柒竞,則取決于它有多像人政供。所以當(dāng)Sophia出現(xiàn)在公眾眼中的時(shí)候,普通人會(huì)很容易被蒙蔽(甚至能通過圖靈測試)朽基。?

Oracle對(duì)AI的定義也是 “只要是能讓計(jì)算機(jī)可以模擬人類行為的技術(shù)布隔,都算!”

而另一方面稼虎,從字面上來看“Artificial Intelligence”衅檀,只要是人造的智能產(chǎn)品,理論上都算作人工智能霎俩。?

也就是說哀军,一個(gè)手持計(jì)算器沉眶,盡管不像人,也應(yīng)算是人工智能產(chǎn)品杉适。但我相信大多數(shù)人都不會(huì)把計(jì)算器當(dāng)成是他們所理解的人工智能谎倔。

這些在認(rèn)識(shí)上不同的解讀,導(dǎo)致當(dāng)前大家對(duì)AI應(yīng)用的期望和評(píng)估都有很多差異猿推。

再加上還有“深度學(xué)習(xí)片习、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)” 這些概念紛紛跟著人工智能一起出現(xiàn)蹬叭。但是各自意味著什么藕咏,之間是什么關(guān)系,普通大眾都不甚了解具垫。

“ 沒關(guān)系侈离,韭菜不用懂◇莶希” 但是想要割韭菜的人卦碾,最好能搞清楚吧。連有些投資人自己也分不清起宽,你說怎么做判斷洲胖,如何投項(xiàng)目?當(dāng)然是投胸大的坯沪。

以上绿映,就是到2018年末,在對(duì)話領(lǐng)域的人工智能的現(xiàn)狀:智能助理依然智障腐晾;大部分To B的給人造機(jī)器人的都無法規(guī)牟嫦遥化;對(duì)話方面沒有像AlphaZero在圍棋領(lǐng)域那樣的讓人震驚的產(chǎn)品藻糖;沒有商業(yè)上大規(guī)模崛起的跡象淹冰;有的是一團(tuán)渾水,和渾水摸魚的人巨柒。

為什么會(huì)這樣樱拴?為什么人工智能在圖像識(shí)別,人臉識(shí)別洋满,下圍棋這些方面都那么快的進(jìn)展晶乔,而在對(duì)話智能這個(gè)領(lǐng)域卻是如此混亂?

既然你都看到這里了牺勾,我相信你是一個(gè)愿意探究本質(zhì)的好同志正罢。那么我們來了解,對(duì)話的本質(zhì)是什么驻民;以及現(xiàn)在的對(duì)話系統(tǒng)的本質(zhì)又是什么腺怯。


Part 2

當(dāng)前對(duì)話系統(tǒng)的本質(zhì):填表


?AI thinks, man laughs?

Source:The Globe and Mail

有一群小雞出生在一個(gè)農(nóng)場袱饭,無憂無慮安心地生活。

雞群中出現(xiàn)了一位科學(xué)家呛占,它注意到了一個(gè)現(xiàn)象:每天早上,食槽里會(huì)自動(dòng)出現(xiàn)糧食懦趋。

作為一名優(yōu)秀的歸納法信徒(Inductivist)晾虑,這只科學(xué)雞并不急于給出結(jié)論。它開始全面觀察并做好記錄仅叫,試圖發(fā)現(xiàn)這個(gè)現(xiàn)象是否在不同的條件下都成立帜篇。

“星期一是這樣,星期二是這樣诫咱;樹葉變綠時(shí)是這樣笙隙,樹葉變黃也是這樣;天氣冷是這樣坎缭,天氣熱也是這樣竟痰;下雨是這樣,出太陽也是這樣掏呼!”?

每天的觀察坏快,讓它越來越興奮,在心中憎夷,它離真相越來越接近莽鸿。直到有一天,這只科學(xué)雞再也沒有觀察到新的環(huán)境變化拾给,而到了當(dāng)天早上祥得,雞舍的門一打開,它跑到食槽那里一看蒋得,依然有吃的级及!

科學(xué)雞,對(duì)他的小伙伴窄锅,志在必得地宣布:“我預(yù)測创千,每天早上,槽里會(huì)自動(dòng)出現(xiàn)食物入偷。明天早上也會(huì)有追驴!以后都會(huì)有!我們不用擔(dān)心餓死了疏之!”

經(jīng)過好幾天殿雪,小伙伴們都驗(yàn)證了這個(gè)預(yù)言,科學(xué)雞驕傲的并興奮的把它歸納成“早起的小雞有食吃定理”锋爪。

正好丙曙,農(nóng)場的農(nóng)夫路過爸业,看到一只興奮的雞不停的咯咯叫,他笑了:“這只雞很可愛哦亏镰,不如把它做成叫花雞好了” 扯旷。

科學(xué)雞,卒于午飯時(shí)間索抓。

在這個(gè)例子里钧忽,這只羅素雞(Bertrand Russell’s chicken)只對(duì)現(xiàn)象進(jìn)行統(tǒng)計(jì)和歸納,不對(duì)原因進(jìn)行推理逼肯。

而主流的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)耸黑,也是通過大量的案例,靠對(duì)文本的特征進(jìn)行歸類篮幢,來實(shí)現(xiàn)對(duì)識(shí)別語義的效果大刊。這個(gè)做法,就是羅素雞三椿。

目前缺菌,這是對(duì)話式人工智能的主流技術(shù)基礎(chǔ)。其主要應(yīng)用方向赋续,就是對(duì)話系統(tǒng)敲霍,或稱為Agent罐农。之前提到的智能助理Siri凭语,Cortana掀亥,Google Assistant以及行業(yè)里面的智能客服這些都算是對(duì)話智能的應(yīng)用。


?對(duì)話智能的黑箱?

這些產(chǎn)品的交互方式鸦列,是人類的自然語言租冠,而不是圖像化界面。

圖形化界面(GUI)的產(chǎn)品薯嗤,比如網(wǎng)頁或者APP的產(chǎn)品設(shè)計(jì)顽爹,是所見即所得、界面即功能骆姐。

對(duì)話智能的交互(CUI, Conversational UI)是個(gè)黑箱:終端用戶能感知到自己說出的話(輸入)和機(jī)器人的回答(輸出)——但是這個(gè)處理的過程是感覺不到的镜粤。就好像跟人說話,你并不知道他是怎么想的玻褪。

每一個(gè)對(duì)話系統(tǒng)的黑箱里肉渴,都是開發(fā)者自由發(fā)揮的天地。

雖說每家的黑箱里面都不同带射,但是最底層的思路同规,都萬變不離其宗,核心就是兩點(diǎn):聽人話(識(shí)別)+?講人話(對(duì)話管理)

如果你是從業(yè)人員券勺,那么請(qǐng)回答一個(gè)問題:你們家的對(duì)話管理是不是填槽绪钥?若是,你可以跳過這一節(jié)(主要科普填槽是怎么回事)关炼,請(qǐng)直接到本章的第五節(jié)“當(dāng)前對(duì)話系統(tǒng)的局限” 程腹。


?AI如何聽懂人話 ?

對(duì)話系統(tǒng)這個(gè)事情在2015年開始突然火起來了儒拂,主要是因?yàn)橐粋€(gè)技術(shù)的普及:機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)帶來的語音識(shí)別和NLU(自然語言理解)——主要解決的是識(shí)別人講的話跪楞。

這個(gè)技術(shù)的普及讓很多團(tuán)隊(duì)都掌握了一組關(guān)鍵技能:意圖識(shí)別和實(shí)體提取。這意味著什么侣灶?我們來看一個(gè)例子。

在生活中缕碎,如果想要訂機(jī)票褥影,人們會(huì)有很多種自然的表達(dá):

“訂機(jī)票”;

“有去上海的航班么咏雌?”凡怎;

“看看航班,下周二出發(fā)去紐約的”赊抖;

“要出差统倒,幫我查下機(jī)票”;

等等等等

可以說“自然的表達(dá)” 有無窮多的組合(自然語言)都是在代表 “訂機(jī)票” 這個(gè)意圖的氛雪。而聽到這些表達(dá)的人房匆,可以準(zhǔn)確理解這些表達(dá)指的是“訂機(jī)票”這件事。

而要理解這么多種不同的表達(dá)报亩,對(duì)機(jī)器是個(gè)挑戰(zhàn)浴鸿。在過去,機(jī)器只能處理“結(jié)構(gòu)化的數(shù)據(jù)”(比如關(guān)鍵詞)弦追,也就是說如果要聽懂人在講什么岳链,必須要用戶輸入精確的指令。

所以劲件,無論你說“我要出差”還是“幫我看看去北京的航班”掸哑,只要這些字里面沒有包含提前設(shè)定好的關(guān)鍵詞“訂機(jī)票”,系統(tǒng)都無法處理零远。而且苗分,只要出現(xiàn)了關(guān)鍵詞,比如“我要退訂機(jī)票”里也有這三個(gè)字遍烦,也會(huì)被處理成用戶想要訂機(jī)票俭嘁。

自然語言理解這個(gè)技能出現(xiàn)后,可以讓機(jī)器從各種自然語言的表達(dá)中服猪,區(qū)分出來供填,哪些話歸屬于這個(gè)意圖拐云;而那些表達(dá)不是歸于這一類的,而不再依賴那么死板的關(guān)鍵詞近她。比如經(jīng)過訓(xùn)練后叉瘩,機(jī)器能夠識(shí)別“幫我推薦一家附近的餐廳”,就不屬于“訂機(jī)票”這個(gè)意圖的表達(dá)粘捎。

并且薇缅,通過訓(xùn)練,機(jī)器還能夠在句子當(dāng)中自動(dòng)提取出來“上涸苣ィ”泳桦,這兩個(gè)字指的是目的地這個(gè)概念(即實(shí)體);“下周二”指的是出發(fā)時(shí)間娩缰。

這樣一來灸撰,看上去“機(jī)器就能聽懂人話啦!”拼坎。

這個(gè)技術(shù)為啥會(huì)普及浮毯?主要是因?yàn)闄C(jī)器學(xué)習(xí)領(lǐng)域的學(xué)術(shù)氛圍,導(dǎo)致重要的論文基本都是公開的泰鸡。不同團(tuán)隊(duì)要做的是考慮具體工程實(shí)施的成本债蓝。

最后的效果,就是在識(shí)別自然語言這個(gè)領(lǐng)域里盛龄,每家的基礎(chǔ)工具都差不多饰迹。在意圖識(shí)別和實(shí)體提取的準(zhǔn)確率,都是百分點(diǎn)的差異讯嫂。既然這個(gè)工具本身不是核心競爭力蹦锋,甚至你可以用別家的,大把可以選欧芽,但是關(guān)鍵是你能用它來干什么莉掂?

“Due to the academic culture that ML comes from, pretty much all of the primary science is published as soon as it’s created - almost everything new is a paper that you can read and build with. But what do you build? ”——Benedict Evans (A16Z合伙人)

在這方面,最顯而易見的價(jià)值千扔,就是解放雙手憎妙。語音控制類的產(chǎn)品,只需要聽懂用戶的自然語言曲楚,就去執(zhí)行這個(gè)操作:在家里要開燈厘唾,可以直接說 “開燈”,而不用去按開關(guān)龙誊;在車上抚垃,說要“開天窗”,天窗就打開了,而不用去找對(duì)應(yīng)的按鈕在哪里鹤树。

這類系統(tǒng)的重點(diǎn)在于铣焊,清楚聽清哪個(gè)用戶在講是什么。所以麥克風(fēng)陣列罕伯、近場遠(yuǎn)場的抗噪曲伊、聲紋識(shí)別講話的人的身份、ASR(語音轉(zhuǎn)文字)追他,等等硬件軟件的技術(shù)就相應(yīng)出現(xiàn)坟募,向著前面這個(gè)目標(biāo)不斷優(yōu)化。

“講人話”在這類應(yīng)用當(dāng)中邑狸,并不那么重要懈糯。通常任務(wù)的執(zhí)行,以結(jié)果進(jìn)行反饋单雾,比如燈應(yīng)聲就亮了昂利。而語言上的反饋,只是一個(gè)輔助作用铁坎,可有可無。

但是任務(wù)類的對(duì)話智能犁苏,往往不止是語音控制這樣一輪交互硬萍。如果一個(gè)用戶說,“看看明天的機(jī)票”——這表達(dá)正常围详,但無法直接去執(zhí)行朴乖。因?yàn)槿鄙賵?zhí)行的必要信息:1)從哪里出發(fā)?和 2)去哪里助赞?

如果我們希望AI Agent來執(zhí)行這個(gè)任務(wù)买羞,一定要獲得這兩個(gè)信息。對(duì)于人來完成這個(gè)業(yè)務(wù)的話雹食,要獲得信息畜普,就得靠問這個(gè)用戶問題,來獲得信息群叶。很多時(shí)候吃挑,這樣的問題,還不止一個(gè)街立,也就意味著舶衬,要發(fā)起多輪對(duì)話。

對(duì)于AI而言赎离,也是一樣的逛犹。

要知道 “去哪里” = Agent 問用戶“你要去哪里?”

要知道 “從哪里出發(fā)” = Agent 問用戶“你要從哪里出發(fā)呢?”

這就涉及到了對(duì)話語言的生成虽画。


?AI?如何講人話舞蔽?

決定“該說什么話”,才是對(duì)話系統(tǒng)的核心——無論是硅基的還是碳基的智能狸捕。但是深度學(xué)習(xí)在這個(gè)版塊喷鸽,并沒有起到什么作用。

在當(dāng)前灸拍,處理“該說什么”這個(gè)問題做祝,主流的做法是由所謂“對(duì)話管理”系統(tǒng)決定的。

盡管每一個(gè)對(duì)話系統(tǒng)背后的“對(duì)話管理”機(jī)制都不同鸡岗,每家都有各種理解混槐、各種設(shè)計(jì),但是萬變不離其宗——目前所有任務(wù)類對(duì)話系統(tǒng)轩性,無論是前段時(shí)間的Google duplex声登,還是智能客服,或者智能助理揣苏,最核心的對(duì)話管理方法悯嗓,有且僅有一個(gè):“填槽”,即Slot filling卸察。

如果你并不懂技術(shù)脯厨,但是又要迅速知道一家做對(duì)話AI的水平如何,到底有沒有黑科技(比如剛剛開始看AI領(lǐng)域的做投資的朋友 )坑质,你只需要問他一個(gè)問題:“是不是填槽合武?”

如果他們(誠實(shí)地)回答“是”,那你就可以放下心來涡扼,黑科技尚未出現(xiàn)稼跳。接下來,能討論的范圍吃沪,無非都是產(chǎn)品設(shè)計(jì)汤善、工程實(shí)現(xiàn)、如何解決體驗(yàn)和規(guī)钠北耄化的困境萎津,這類的問題∧鳎基本上該智障的锉屈,還是會(huì)智障。

要是他們回答“不是填槽”垮耳,而且產(chǎn)品的效果還很好颈渊,那么就有意思了遂黍,值得研究,或者請(qǐng)速速聯(lián)系我:)

那么這個(gè)“填槽”究竟是個(gè)什么鬼俊嗽?嗯雾家,不搞開發(fā)的大家可以簡單的把它理解為“填表”:好比你要去銀行辦個(gè)業(yè)務(wù),先要填一張表绍豁。

如果這張表上的空沒有填完芯咧,柜臺(tái)小姐姐就不給你辦。她會(huì)紅筆給你圈出來:“必須要填的空是這些竹揍,別的你都可以不管敬飒。” 你全部填好了芬位,再遞給小姐姐无拗,她就去給你辦理業(yè)務(wù)了。

還記得剛剛那個(gè)機(jī)票的例子么昧碉?用戶說“看看明天的機(jī)票”英染,要想執(zhí)行“查機(jī)票”,就得做以下的步奏被饿,還要按順序來:?

1. ASR:把用戶的語音四康,轉(zhuǎn)化成文字。

2. NLU語義識(shí)別:識(shí)別上面的文字狭握,屬于(之前設(shè)定好的)哪一個(gè)意圖箭养,在這里就是“訂機(jī)票”;然后哥牍,提取文字里面的實(shí)體,“明天”作為訂票日期喝检,被提取出來啦嗅辣。

3. 填表:這個(gè)意圖是訂機(jī)票,那么就選“訂機(jī)票”這張表來填挠说;這表里有三個(gè)空澡谭,時(shí)間那個(gè)空里,就放進(jìn)“明天”损俭。

(這個(gè)時(shí)候蛙奖,表里的3個(gè)必填項(xiàng),還差兩個(gè):“出發(fā)地”和“到達(dá)地”)

4. 開始跑之前編好的程序:如果差“出發(fā)地”杆兵,就回“從哪里走把阒佟?”琐脏;如果差“目的地”攒砖,就回“你要去哪里缸兔?”(NLG上打引號(hào),是因?yàn)椴⒉皇钦嬲饬x上的自然語言生成吹艇,而是套用的對(duì)話模版)

5. TTS:把回復(fù)文本惰蜜,合成為語音,播放出去

在上面這個(gè)過程當(dāng)中受神,1和2步奏都是用深度學(xué)習(xí)來做識(shí)別抛猖。如果這個(gè)環(huán)節(jié)出現(xiàn)問題,后面就會(huì)連續(xù)出錯(cuò)鼻听。

循環(huán)1-5這個(gè)過程财著,只要表里還有空要填,就不斷問用戶精算,直到所有的必填項(xiàng)都被填完瓢宦。于是,表就可以提交小姐姐(后端處理)了灰羽。

后端看了要查的條件驮履,返回滿足這些條件的機(jī)票情況。Agent再把查詢結(jié)果用之前設(shè)計(jì)好的回復(fù)模板發(fā)回給用戶廉嚼。

順便說一下玫镐,我們經(jīng)常聽到有些人說“我們的多輪對(duì)話可以支持xx輪,最多的時(shí)候有用戶能說xx輪”〉≡耄現(xiàn)在大家知道恐似,在任務(wù)類對(duì)話系統(tǒng)里,“輪數(shù)的產(chǎn)生”是由填表的次數(shù)決定的傍念,那么這種用“輪數(shù)多少”來衡量產(chǎn)品水平的方法矫夷,在這個(gè)任務(wù)類對(duì)話里里完全無意義。

一定要有意義憋槐,也應(yīng)該是:在達(dá)到目的双藕、且不影響體驗(yàn)的前提下,輪數(shù)越少越好阳仔。

在當(dāng)前忧陪,只要做任務(wù)類的多輪對(duì)話,基本跑不掉填表近范。

5月的時(shí)候嘶摊,Google I/O發(fā)布了Duplex的錄音Demo,場景是Google Assistant代替用戶打電話去訂餐廳评矩,和店員溝通叶堆,幫助用戶預(yù)定位子。值得注意斥杜,這并不是Live demo蹂空。

Google's Assistant. CREDIT:GOOGLE


Google I/O 2018 Google Duplex Restaurant Call

那Google的智能助理(后稱IPA)又怎么知道用戶的具體需求呢俯萌?跑不掉的是,用戶還得給Google Assistant填一張表上枕,用對(duì)話來交代自己的具體需求咐熙,比如下面這樣:?

圖中左邊是一個(gè)使用Google Assistant訂餐廳的真實(shí)案例,來自The Verge辨萍。


?當(dāng)前對(duì)話系統(tǒng)的局限?

我剛剛花了兩千來個(gè)字來說明對(duì)話系統(tǒng)的通用思路棋恼。接下來,要指出這個(gè)做法的問題

還記得之前提到的 “不要日本菜”測試么锈玉?我們把這個(gè)測試套用在“訂機(jī)票”這個(gè)場景上爪飘,試試看:“看看明天去北京的航班,東航以外的都可以”拉背,還是按步奏來:

1. ASR語音轉(zhuǎn)文字师崎,沒啥問題;

2. 語義識(shí)別椅棺,貌似有點(diǎn)問題

- 意圖:是訂機(jī)票犁罩,沒錯(cuò);

- 實(shí)體提攘骄巍:跟著之前的訓(xùn)練來床估;

? ? - 時(shí)間:明天

? ? - 目的地:北京

? ? - 出發(fā)地:這個(gè)用戶沒說,一會(huì)得問問他...

等等诱渤,他說的這個(gè)“東航以外的都可以”丐巫,指的是啥?之前沒有訓(xùn)練過與航空公司相關(guān)的表達(dá)啊勺美。

沒關(guān)系递胧,咱們可以把這個(gè)表達(dá)的訓(xùn)練加上去:東航 = 航司。多找些表達(dá)赡茸,只要用戶說了各個(gè)航空公司的名字的缎脾,都訓(xùn)練成航司這個(gè)實(shí)體好啦。

另外坛掠,咱們還可以在填表的框里,添加一個(gè)航司選擇治筒,就像這樣(黃色部分):

(嗯屉栓,好多做TO B的團(tuán)隊(duì),都是掉在這個(gè)“在后面可以加上去”的坑里耸袜。)

但是友多,這么理所當(dāng)然的訓(xùn)練之后,實(shí)體提取出來的航司卻是“東航”——而用戶說的是 “東航以外的”堤框,這又指的哪個(gè)(些)航司呢域滥?

“要不纵柿,咱們做點(diǎn)Trick把‘以外’這樣的邏輯單獨(dú)拿出來手工處理掉?”——如果這個(gè)問題可以這么容易處理掉启绰,你覺得Siri等一干貨色還會(huì)是現(xiàn)在這個(gè)樣子昂儒?難度不在于“以外”提取不出來,而是在處理“這個(gè)以外委可,是指哪個(gè)實(shí)體以外渊跋?

當(dāng)前基于深度學(xué)習(xí)的NLU在“實(shí)體提取”這個(gè)技術(shù)上,就只能提取“實(shí)體”着倾。

而人能夠理解拾酝,在這個(gè)情況下,用戶是指的“排除掉東航以外的其他選擇”卡者,這是因?yàn)槿顺俗觥皩?shí)體提取”以外蒿囤,還根據(jù)所處語境,做了一個(gè)對(duì)邏輯的識(shí)別:“xx以外”崇决。然后材诽,自動(dòng)執(zhí)行了這個(gè)邏輯的處理,即推理嗽桩,去進(jìn)一步理解岳守,對(duì)方真正指的是什么(即指代)。

而這個(gè)邏輯推理的過程碌冶,并不存在于之前設(shè)計(jì)好的步奏(從1到5)里湿痢。

更麻煩的是,邏輯的出現(xiàn)扑庞,不僅僅影響“實(shí)體”譬重,還影響“意圖”:

“hi Siri,別推薦餐廳”——它還是會(huì)給你推薦餐廳罐氨;

“hi Siri臀规,除了推薦餐廳,你還能推薦什么栅隐?”——它還是會(huì)給你推薦餐廳塔嬉。?

中文英文都是一樣的;Google assistant也是一樣的租悄。

想要處理這個(gè)問題谨究,不僅僅是要識(shí)別出“邏輯”;還要正確判斷出泣棋,這個(gè)邏輯是套用在哪個(gè)實(shí)體胶哲,或者是不是直接套用在某一個(gè)意圖上。這個(gè)判斷如何做潭辈?用什么做鸯屿?都不在當(dāng)前SLU的范圍內(nèi)澈吨。

對(duì)這些問題的處理,如果是集中在一些比較封閉的場景下寄摆,還可以解決個(gè)七七八八谅辣。但是,如果想要從根本上冰肴、泛化的處理屈藐,希望一次處理就解決所有場景的問題,到目前都無解熙尉。在這方面联逻,Siri是這樣,Google Assistant也是這樣检痰,任意一家包归,都是這樣。

為啥說無解铅歼?我們來看看測試公壤。


?用圖靈測試來測對(duì)話系統(tǒng)沒用?

一說到對(duì)人工智能進(jìn)行測試,大部分人的第一反應(yīng)是圖靈測試椎椰。

5月Google I/O大會(huì)的那段時(shí)間厦幅,我們團(tuán)隊(duì)正在服務(wù)一家全球100強(qiáng)企業(yè),為他們規(guī)劃基于AI Agent的服務(wù)慨飘。

在發(fā)布會(huì)的第二天确憨,我收到這家客戶的Tech Office的好心提醒:Google這個(gè)像真人一樣的黑科技,會(huì)不會(huì)顛覆現(xiàn)有的技術(shù)方案瓤的?我的回答是并不會(huì)休弃。

話說Google Duplex在發(fā)布會(huì)上的demo確實(shí)讓人印象深刻,而且大部分看了Demo的人圈膏,都分辨不出打電話去做預(yù)定的是不是真人塔猾。

“這個(gè)效果在某種意義上,算是通過了圖靈測試稽坤≌傻椋”?

Google母公司的Chairman說google duplex可以算過了圖靈測試了

由于圖靈測試的本質(zhì)是“欺騙”?(A game of deception,詳見Toby Walsh的論文)尿褪,所以很多人批評(píng)它睦擂,這只能用來測試人有多好騙,而不是用來測智能的茫多。在這一點(diǎn)上祈匙,我們?cè)诤笪腜art 4對(duì)話的本質(zhì)中會(huì)有更多解釋忽刽。

人們被這個(gè)Demo騙到的主要原因天揖,是因?yàn)楹铣傻恼Z音非常像真人夺欲。

這確實(shí)是Duplex最牛的地方:語音合成。不得不承認(rèn)今膊,包括語氣些阅、音調(diào)等等模擬人聲的效果,確實(shí)是讓人嘆為觀止斑唬。只是市埋,單就在語音合成方面,就算是做到極致恕刘,在本質(zhì)上就是一只鸚鵡——最多可以騙騙Alexa(所以你看活體識(shí)別有多么重要)缤谎。

只是,Google演示的這個(gè)對(duì)話系統(tǒng)褐着,一樣處理不了邏輯推理坷澡、指代這類的問題。這意味著含蓉,就它算能過圖靈測試频敛,也過不了Winograd Schema Challenge測試。

相比圖靈測試馅扣,這個(gè)測試是直擊深度學(xué)習(xí)的要害斟赚。當(dāng)人類對(duì)句子進(jìn)行語法分析時(shí),會(huì)用真實(shí)世界的知識(shí)來理解指代的對(duì)象差油。這個(gè)測試的目標(biāo)拗军,就是測試目前深度學(xué)習(xí)欠缺的常識(shí)推理能力。

如果我們用Winograd Schema Challenge的方法厌殉,來測試AI在“餐廳推薦”這個(gè)場景里的水平食绿,題目會(huì)是類似這樣的:

A. “四川火鍋比日料更好,因?yàn)樗芾薄?/p>

B. “四川火鍋比日料更好公罕,因?yàn)樗焕薄?/p>

AI需要能準(zhǔn)確指出:在A句里器紧,“它”指的是四川火鍋;而在B句里楼眷,“它”指的則是日料铲汪。

還記得在本文Part 1里提到的那個(gè)“不要日本菜測試”么?我真的不是在強(qiáng)調(diào)“回字有四種寫法”——這個(gè)測試的本質(zhì)罐柳,是測試對(duì)話系統(tǒng)能不能使用簡單邏輯來做推理(指代的是什么)掌腰。

而在Winograd Schema Challenge中,則是用世界知識(shí)(包括常識(shí))來做推理:

如果系統(tǒng)不知道相應(yīng)的常識(shí)(四川火鍋是辣的张吉;日料是不辣的)齿梁,就沒有推理的基礎(chǔ)。更不用說推理還需要被準(zhǔn)確地執(zhí)行。

有人說勺择,我們可以通過上下文處理來解決這個(gè)問題创南。不好意思,上面這個(gè)常識(shí)根本就沒有出現(xiàn)在整個(gè)對(duì)話當(dāng)中省核。不在“上文”里面稿辙,又如何處理?

對(duì)于這個(gè)部分的詳細(xì)解釋气忠,請(qǐng)看下一章 (Part 3 對(duì)話的本質(zhì))邻储。

盡管指代問題和邏輯問題,看上去旧噪,在應(yīng)用方面已經(jīng)足夠致命了吨娜;但這些也只是深度學(xué)習(xí)表現(xiàn)出來的諸多局限性中的一部分。

哪怕更進(jìn)一步淘钟,再過一段時(shí)間萌壳,有一家AI在Winograd Schema Challenge拿了100%的正確率,我們也不能期望它在自然語言處理中的表現(xiàn)如同人一樣日月,因?yàn)檫€有更嚴(yán)重和更本質(zhì)的問題在后面等著袱瓮。


?對(duì)話系統(tǒng)更大的挑戰(zhàn)不是NLU?

我們來看問題表現(xiàn)在什么地方。

現(xiàn)在我們知道了爱咬,當(dāng)人跟現(xiàn)在的AI對(duì)話的時(shí)候尺借,AI能識(shí)別你說的話,是靠深度學(xué)習(xí)對(duì)你說出的自然語言進(jìn)行分類精拟,歸于設(shè)定好的意圖燎斩,并找出來文本中有哪些實(shí)體。

而AI什么時(shí)候回答你蜂绎,什么時(shí)候反問你栅表,基本都取決于背后的“對(duì)話管理”系統(tǒng)里面的各種表上還有啥必填項(xiàng)沒有填完。而問你的話师枣,則是由產(chǎn)品經(jīng)理和代碼小哥一起手動(dòng)完成的怪瓶。

那么,這張表是誰做的践美?

或者說洗贰,是誰決定,對(duì)于“訂機(jī)票”這件事陨倡,要考慮哪些方面敛滋?要獲得哪些信息?需要問哪些問題兴革?機(jī)器又是怎么知道的绎晃?

是人蜜唾。是產(chǎn)品經(jīng)理,準(zhǔn)確點(diǎn)說庶艾。

就像剛才的“訂機(jī)票”的案例灵妨,當(dāng)用戶問到“航司”的時(shí)候,之前的表里并沒有設(shè)計(jì)這個(gè)概念落竹,AI就無法處理了。

要讓AI能處理這樣的新條件货抄,得在“訂機(jī)票”這張表上述召,新增加“航空公司”一欄(黃色部分)。而這個(gè)過程蟹地,都得人為手動(dòng)完成:產(chǎn)品經(jīng)理設(shè)計(jì)好后积暖,工程師編程完成這張表的編程。

所以AI并不是真的怪与,通過案例學(xué)習(xí)就自動(dòng)理解了“訂機(jī)票”這件事情夺刑,包含了哪些因素。只要這個(gè)表還是由人來設(shè)計(jì)和編程實(shí)現(xiàn)的分别,在產(chǎn)品層面遍愿,一旦用戶稍微談及到表以外的內(nèi)容,智障的情況就自然出現(xiàn)了耘斩。

因此沼填,當(dāng)Google duplex出現(xiàn)的時(shí)候,我并不那么關(guān)心 Google duplex發(fā)音和停頓有多像一個(gè)人——實(shí)際上括授,當(dāng)我觀察任意一個(gè)對(duì)話系統(tǒng)的時(shí)候坞笙,我都只關(guān)心1個(gè)問題:

“是誰設(shè)計(jì)的那張表:人,還是AI荚虚?”

只是薛夜,深度學(xué)習(xí)在對(duì)話系統(tǒng)里面,能做的只是識(shí)別用戶講出的那句話那部分——嚴(yán)格依照被人為訓(xùn)練的那樣(監(jiān)督學(xué)習(xí))版述。至于其他方面梯澜,比如該講什么話?該在什么時(shí)候講話渴析?它都無能為力腊徙。

但是真正人們?cè)趯?duì)話時(shí)的過程焙畔,卻不是上面提到的對(duì)話系統(tǒng)這么設(shè)計(jì)的邦泄,而且相差十萬八千里。人的對(duì)話装黑,又是怎么開展的恢恼?這個(gè)差異究竟在哪里民傻?為什么差異那么大?所謂深度學(xué)習(xí)很難搞定的地方,是人怎么搞定的呢漓踢?畢竟在這個(gè)星球上牵署,我們自身就是70億個(gè)完美的自然語言處理系統(tǒng)呢。

我們需要了解要解決的問題喧半,才可能開展解決問題的工作奴迅。在對(duì)話領(lǐng)域,我們需要知道人們對(duì)話的本質(zhì)是什么挺据。下一章比較燒腦取具,我們將討論“思維”這件事情,是如何主導(dǎo)人們的對(duì)話的扁耐。



關(guān)于作者

作者M(jìn)ingke暇检,正在從事對(duì)話智能方面的創(chuàng)業(yè),為世界一百強(qiáng)企業(yè)提供對(duì)話智能應(yīng)用的咨詢和解決方案婉称。上次《為什么現(xiàn)在的人工智能助理都像人工智障》一文發(fā)出來之后块仆,認(rèn)識(shí)結(jié)交了不少行業(yè)內(nèi)的朋友。希望這次王暗,把過去一段時(shí)間的思考與大家分享悔据,能給行業(yè)內(nèi)的新老朋友們一些啟發(fā),有興趣溝通和碰撞的也歡迎與我聯(lián)系俗壹。

歡迎行業(yè)里的新老朋友勾搭吐槽蜜暑,微信:mingke27 (請(qǐng)注明稱呼+所在機(jī)構(gòu))

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市策肝,隨后出現(xiàn)的幾起案子肛捍,更是在濱河造成了極大的恐慌,老刑警劉巖之众,帶你破解...
    沈念sama閱讀 216,496評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拙毫,死亡現(xiàn)場離奇詭異,居然都是意外死亡棺禾,警方通過查閱死者的電腦和手機(jī)缀蹄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來膘婶,“玉大人缺前,你說我怎么就攤上這事⌒螅” “怎么了衅码?”我有些...
    開封第一講書人閱讀 162,632評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長脊岳。 經(jīng)常有香客問我逝段,道長垛玻,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,180評(píng)論 1 292
  • 正文 為了忘掉前任奶躯,我火速辦了婚禮帚桩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘嘹黔。我一直安慰自己账嚎,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評(píng)論 6 388
  • 文/花漫 我一把揭開白布儡蔓。 她就那樣靜靜地躺著郭蕉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪浙值。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評(píng)論 1 299
  • 那天檩小,我揣著相機(jī)與錄音开呐,去河邊找鬼。 笑死规求,一個(gè)胖子當(dāng)著我的面吹牛筐付,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播阻肿,決...
    沈念sama閱讀 40,052評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼瓦戚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了丛塌?” 一聲冷哼從身側(cè)響起较解,我...
    開封第一講書人閱讀 38,910評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎赴邻,沒想到半個(gè)月后印衔,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡姥敛,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評(píng)論 2 332
  • 正文 我和宋清朗相戀三年奸焙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片彤敛。...
    茶點(diǎn)故事閱讀 39,711評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡与帆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出墨榄,到底是詐尸還是另有隱情玄糟,我是刑警寧澤,帶...
    沈念sama閱讀 35,424評(píng)論 5 343
  • 正文 年R本政府宣布袄秩,位于F島的核電站茶凳,受9級(jí)特大地震影響嫂拴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜贮喧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評(píng)論 3 326
  • 文/蒙蒙 一筒狠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧箱沦,春花似錦辩恼、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至寒跳,卻和暖如春聘萨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背童太。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評(píng)論 1 269
  • 我被黑心中介騙來泰國打工米辐, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人书释。 一個(gè)月前我還...
    沈念sama閱讀 47,722評(píng)論 2 368
  • 正文 我出身青樓翘贮,卻偏偏與公主長得像,于是被迫代替她去往敵國和親爆惧。 傳聞我的和親對(duì)象是個(gè)殘疾皇子狸页,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容