內容來源:2017年8月12日,愛因互動創(chuàng)始人兼CTO洪強寧在“網(wǎng)易博學實踐日:大數(shù)據(jù)與人工智能技術大會”進行《對話機器人如何落地》演講分享北发。IT 大咖說(ID:itdakashuo)作為獨家視頻合作方纹因,經(jīng)主辦方和講者審閱授權發(fā)布。
閱讀字數(shù):2161?| 4分鐘閱讀
獲取嘉賓演講視頻及PPT琳拨,請點擊:http://t.cn/RDoSTts
摘要
人工智能這個行業(yè)并不是純算法論瞭恰,算法固然重要,但是算法之外的東西對于一個創(chuàng)業(yè)公司來說會更重要狱庇。今天的分享會讓大家了解到惊畏,機器人雖然是算法核心的應用,但在現(xiàn)有的技術條件下要想真正把它做好密任,除了算法之外還有更多需要考慮的東西颜启。
什么是對話機器人?
Bot:自動化的完成某項任務浪讳,并以自然語言的方式進行溝通的機器人缰盏。
Chatbot:以自然語言為對話目的的機器人。
聊天機器人概念的出現(xiàn)非常早淹遵,甚至早過人工智能口猜。1966年誕生了第一個對話機器人ELIZA,它是一個模擬的心理咨詢師透揣,標志著對話集成的開端济炎。
在1970年有一個名為SHRDLU的對話機器人,它把對話限定在一個封閉域中辐真,能夠理解人們說的話并做出響應须尚,在溝通的時候效果更好。
1988年出現(xiàn)了Jabberwacky拆祈,也是基于模式匹配恨闪,Jabberwacky中增加了娛樂性,它的回答會很幽默放坏,人們在和它對話的過程中會感到很愉快咙咽。
1995年的時候出現(xiàn)了A.L.I.C.E,從技術角度來說淤年,A.L.I.C.E.基于模式匹配創(chuàng)建了一套人工智能標記語言的引擎钧敞,它使人工智能變得更加規(guī)范化。
2001年麸粮,SmarterChild帶來了新的變革溉苛。SmarterChild把聊天機器人搬到了互聯(lián)網(wǎng)上,最多時候的用戶數(shù)達到了三千萬弄诲,影響擴大了很多愚战。
2006年娇唯,Watson在一個問答型的綜藝節(jié)目上打敗了真人,因為它的知識庫整理得非常好寂玲,所以準確率已經(jīng)超過了人類塔插。
2010年,蘋果發(fā)布了siri拓哟。Siri是一個語音個人助理想许,給聊天機器人帶來了新的應用場景。
到2016年断序,facebook發(fā)布了messager platform流纹。2016年可以算是人工智能元年,facebook認為機會到了违诗,所以它發(fā)布了一個平臺漱凝,讓大家可以在平臺上去開發(fā)機器人。在發(fā)布第一個月時就擁有了上萬個bot運行在該平臺上较雕。
理想很豐滿
從1966年至今碉哑,有這么多的科學家前仆后繼地讓機器人用自然語言和人類進行對話挚币,是因為有著豐滿的理想亮蒋,希望機器人能夠擁有人類的智能。而人工智能的一個定義是妆毕,可以通過圖靈測試的智能就是人工智能慎玖。圖靈測試本身就是一個對話機器人的測試。
現(xiàn)實很骨感
大概在2016年4月的時候笛粘,大家對于facebook發(fā)布的messager platform抱有極高的熱情趁怔,很多人在這個平臺上開發(fā)機器人。
但到了2017年2月薪前,facebook發(fā)現(xiàn)這些機器人的效果非常差润努,里面的錯誤率高達70%。于是facebook收縮了這部分的投入示括。
那么我們現(xiàn)在做對話機器人是不是過早了铺浇?我覺得是,但也不是垛膝△⒙拢“是”的原因就是現(xiàn)在的人工智能技術在自然語言理解上還處于早期階段,這個時候要讓一個算法能準確理解人類在說什么吼拥,還是有些難度倚聚;我說“不是”是因為現(xiàn)在由于對話的發(fā)展,人們已經(jīng)習慣在對話平臺上進行交互凿可,只要選擇合適的場景惑折、算法和對話方式,我們還是可以做到不錯的準確率。
對話機器人如何落地惨驶?
算法與工程緊密結合
因為目前算法還不夠成熟矗积,所以做對話機器人的公司需要緊追工業(yè)界、學界任何一點可能的成績敞咧,不斷嘗試各種新的優(yōu)化棘捣。
這使得我們在算法框架的層面上處于一個非常不確定的狀態(tài)。工程和算法緊密結合休建,所以工程需要給算法提供一個非常好的條件乍恐,讓算法可以很容易地嘗試不同方式。
開發(fā)域 vs.封閉域
在聊天機器人這個行業(yè)测砂,我們解決的問題域大致有兩種流派茵烈,一種是開放域,一種是封閉域砌些。
開放域是不限定用戶提什么問題呜投,我們都要給出一個正確的解答。目前這個場景能做到的只有閑聊存璃。
我們希望能夠讓機器人真正理解人類說的話并執(zhí)行指令仑荐,在對話中還要向用戶去個性化推薦產(chǎn)品,在現(xiàn)有的技術框架下就只能做封閉域纵东。封閉域既可以做檢索式的回復粘招,也可以使用生成式的方式來做。
封閉域對話
封閉域對話需要清晰地定義出人類說的話有幾種可能性偎球,而機器要做的就是把這句話定義出是哪個領域洒扎、什么意圖以及要完成這個意圖需要知道哪些槽位信息,這些都是要預先定義的衰絮,工作量很大袍冷。
要想能夠在比較低的成本下完成這件事,就需要規(guī)范數(shù)據(jù)結構猫牡,通過原始語料分析自動提取胡诗,再逐步增加意圖。
讓機器人主導對話
可以避免主題發(fā)散镊掖,用戶的對話內容是可預期的乃戈。可以引導對話目標亩进,避免無休止的調戲症虑。
人性化的對話設計
對用戶的回答做出針對性反饋,并優(yōu)雅地打破沉默归薛。出現(xiàn)異常的時候可以通過賣萌的方式來處理谍憔,需要對用戶表達出正面的情緒匪蝙,要得到用戶的理解并給出可解決的方案。
善用對話的私密性
基于對話的CUI和基于圖形的GUI非常顯著的區(qū)別就是CUI是一對一的對話习贫,更具有私密性逛球。GUI特別適合展示廣度,而CUI在對話場景下更適合展示深度苫昌。GUI的空間感更強颤绕,CUI則更具有時間感。由于它的私密性祟身,還可以做很多個性化的操作奥务,加強用戶的參與感。
在對話過程中機器人需要記住用戶曾經(jīng)說過什么袜硫,對用戶體驗非常好氯葬,所以需要有一個長期記憶,可以在里面進行個性化推薦婉陷。
人機協(xié)作
當機器無法百分百接受人類說的話時帚称,可以轉接人工服務。同時在用戶輸入的時候提示可以輸入哪些內容秽澳,這樣用戶輸入的內容一定是在可理解的范圍之內闯睹,大幅提高準確率。即使是在人工服務的時候肝集,依然可以對回復提出建議瞻坝。這個本身就是一個標注過程蛛壳,告訴機器人它的回復是正反饋還是負反饋杏瞻。
管理期望
有多少人工,就有多少智能衙荐。并不是所有事情都適合機器做捞挥,只把重復性、確定的事情交給機器忧吟。一定會有不準確的情況發(fā)生砌函,我們只要在出現(xiàn)不準確的時候能夠有一個好的解決方案,讓用戶仍然能把事情做完溜族,那么不準確還是可以被接受的讹俊。數(shù)據(jù)是AI的糧食,沒有數(shù)據(jù)就沒有AI煌抒。強人工智能還是很遙遠仍劈。
我們在實踐的過程中發(fā)現(xiàn),真正影響項目能否成功的因素寡壮,算法雖然很重要贩疙,但我前面所介紹的那些與算法并不是十分緊密相關讹弯。很多是產(chǎn)品的選擇、場景的選擇和對話的設計等方面这溅,其實它們起到的作用并不亞于算法组民。
我今天的分享就到這里,謝謝大家悲靴!