AI時代Chatbots對話式交互系統(tǒng)的技術與挑戰(zhàn)

內(nèi)容來源：2017年4月17日悦昵，愛因互動技術合伙人吳金龍在“深度學習最新進展與實踐”進行《Chatbots 中對話式交互系統(tǒng)的分析與應用》演講分享萧吠。IT大咖說（ID：itdakashuo）作為獨家視頻合作方鸥咖，經(jīng)主辦方和講者審閱授權(quán)發(fā)布。

閱讀字數(shù)：2233?| 5分鐘閱讀

嘉賓演講視頻回顧及PPT，請點擊：http://t.cn/Rezi3Wd

摘要

一直以來，人機交互方式都在發(fā)生著不斷的變化菜皂，從命令行交互适室，GUI交互轮蜕，GUI＋交互诊杆，直到現(xiàn)在的對話交互（CUI）。之前傳統(tǒng)交互都是人在適配機器氓拼，而CUI則實現(xiàn)了機器來適配人你画。本次演講將介紹常用的對話交互技術框架，并通過實踐來分享chatbots系統(tǒng)平臺的技術和挑戰(zhàn)桃漾。

Chatbots簡史

三個火槍手：三個Bot框架

IR-Bot：智能檢索機器人

智能檢索的框架和搜索引擎差不多坏匪。第一步的問題分析包括了實體識別、問題分類呈队、指代消解剥槐、關系抽取和情感分析。

第一步完成后進行檢索宪摧，將對應的問題檢索到庫里的相關問題粒竖。這里最傳統(tǒng)的方式就是用詞，如果一個詞在用戶問題和庫里的問題都出現(xiàn)過几于，我認為它們是相關的蕊苗。更復雜的可以用詞向量做檢索。檢索就是把庫里和用戶問題相關的對應問題或答案檢索出來沿彭。很多時候會用到和領域朽砰、所在應用相關的知識庫或知識圖譜，這個會在問題分析和檢索里做對應喉刘。

檢索出來的候選級會進行排序瞧柔，排序最簡單的是TF-IDF。現(xiàn)在有更多的技術睦裳，比如基于排序方式還有LtR以及深度學習的CNN/RNN相關造锅。

最后排序完給出的就是最終答案。

基于CNN/RNN廉邑，把一個問題或答案變成一種向量化的表示哥蔚。上圖中左邊框架是把CNN用到一個句子上，將句子變成一個向量的表達蛛蒙。這樣理論上來說可以做到詞之間的長效關系糙箍。

在獲得問題和答案的向量代表之后，我們可以用其它的框架進行匹配牵祟。例如上圖中右邊的框架深夯，X是問題，Y是答案诺苹。通過CNN的抽取得到兩個向量咕晋，再把它變成相似度的分數(shù)計算，最后如果分數(shù)高筝尾，我們認為這兩個是比較匹配的捡需。

檢索問題和問題間的相關性。上圖左邊框架中筹淫，兩個問題都做詞向量站辉，然后判斷它們的相似性。右邊框架相對復雜一些损姜，可以判斷兩個向量的距離以及它們之間的點擊饰剥。

這些是問題和問題或問題和答案之間匹配的常用框架，在這一塊深度學習已經(jīng)做得比較成熟摧阅。

Task-Bot：任務對話機器人

做多人對話或者任務型多人對話常用的對話叫做任務型機器人汰蓉，全稱是基于任務導向的機器人。

基于任務導向的常用框架第一部分棒卷，用戶輸入后會進入理解模塊顾孽。理解模塊里主要包括語音識別和語言理解祝钢。語音識別是把用戶的語音識別成文字，語言理解是把語音識別出來的自然語言解析成結(jié)構(gòu)化數(shù)據(jù)若厚。

語言理解的結(jié)果會輸出到對話理解模塊拦英，對話理解模塊里包含了對話狀態(tài)追蹤和策略優(yōu)化兩個模塊。

因為任務型的這套框架主要是做多人對話测秸，所以多人對話的時候我們需要記住用戶在前幾輪說的話或者系統(tǒng)前幾輪給的回答疤估，對話狀態(tài)追蹤做的就是把用戶和系統(tǒng)歷史上的交互相關信息記錄下來。

策略優(yōu)化是根據(jù)當前所處的狀態(tài)去給出系統(tǒng)應該怎樣回答用戶最近一次提問的方法霎冯。策略優(yōu)化的輸出就是一個結(jié)構(gòu)化的表示铃拇。對話狀態(tài)應該包含持續(xù)對話所需要的各種信息，依據(jù)系統(tǒng)最新的系統(tǒng)和用戶動作沈撞，更新對話狀態(tài)慷荔。

產(chǎn)生模塊中有語言產(chǎn)生和語音合成。語言產(chǎn)生是把結(jié)構(gòu)化的信息翻譯成自然語言关串，返回給用戶的是一種容易理解的東西拧廊。語言合成是把文字合成為語音。

從去年開始到現(xiàn)在晋修，已經(jīng)出現(xiàn)其它很多端到端的框架吧碾。這些就是常用的基于多元對話的任務型技術框架。

Chitchat-Bot：開域閑聊機器人

開域閑聊機器人在深度學習中發(fā)展最快的方向墓卦，常用的框架就是翻譯模型倦春。

但是直接把翻譯模型放進來以后并沒有想象中那么好，最大的問題是它容易產(chǎn)生安全的答案落剪。

目標函數(shù)中有三個考慮：

對話容易繼續(xù)進行睁本，降低“我不知道”這類答案的可能性。

帶來新的信息忠怖，讓產(chǎn)生的答復與之前的不同呢堰。

語義要連貫。加入互信息：同時考慮從answer到question的概率凡泣。

還有其它的因素就是要小心數(shù)據(jù)訓練枉疼，以及如何引入上下文信息、如何加入外部信息鞋拟、如何產(chǎn)生個性化答復骂维。

總結(jié)：三個Bot框架

如果IR-Bot的成熟度有五分，那么Task-Bot的成熟度就是三分贺纲，Chitchat-Bot的成熟度只有一分航闺。

IR-Bot基于檢索/排序的流程，歷史悠久，技術成熟潦刃。引入深度學習侮措，計入長效依賴，生成更好的語句表達福铅。

Task-Bot是一個適合去做解決任務型的框架萝毛，它強調(diào)的是多輪問答的邏輯项阴。

Chitchat-Bot是一個新的領域滑黔，是深度學習在NLP的新舞臺。它目前的完善度還很低环揽，還有很長的路要走略荡。但它的發(fā)展也是很快的，每年都有非常多的論文在開域聊天這塊發(fā)表出來歉胶。

愛因互動EIN+：深度定制對話服務

愛因互動EIN+是一個為其它企業(yè)提供人工智能對話解決方案的小型創(chuàng)業(yè)公司汛兜，把對話作為一種服務輸出。

Bot應用場景

有清晰的知識結(jié)構(gòu)和邊界通今。

應用場景是一個非標準化服務粥谬，信息不對稱。

能夠通過數(shù)據(jù)積累提升服務質(zhì)量辫塌。

能夠建立知識和技術壁壘漏策。

對話作為粘合劑，連接用戶和對應的產(chǎn)品臼氨，提高用戶到產(chǎn)品的轉(zhuǎn)化率掺喻。

愛因互動：API in，API out

愛因互動合作模式基本都是API的方式储矩。合作方只需提供原始數(shù)據(jù)感耙，我們會建立對應的知識庫和問答語料，再把它放入EinBot算法的后臺框架里持隧，最后生成對應的系統(tǒng)API即硼，合作方只要調(diào)用我們的API就可以了。

各路API快速對接

愛因互動提供了很多API的方式屡拨，比如Ein API只酥、Wechat、BearyChat以及其它的洁仗。只要合作方有一定的開發(fā)能力层皱，只要一周左右就能上線一個可用的聊天機器人。

啟示

如果無法理解問題赠潦，那就盡可能給出正確答案叫胖。如果可以識別出焦點詞，就能獲得更為人性化的答案她奥；定型詞則是依據(jù)給定的一段話瓮增，回答對應的提問怎棱。

根據(jù)不同的問題使用不同的方法。

合作方式總結(jié)

快速部署绷跑，深度定制拳恋。持續(xù)迭代，價值優(yōu)先砸捏。

總結(jié)：一個嶄新的世界

趨勢

現(xiàn)在智能設備越來越多谬运，從人遷就機器變?yōu)榱藱C器遷就人。GUI的發(fā)展非常高效垦藏，但是給我們帶來的孤獨感也很強梆暖。CUI能否為我們帶回幸福感，還是一個需要探索的話題掂骏。

對話交互的價值：在哪兒/在那兒

對話交互目前還處于行業(yè)早期階段轰驳，除了技術比較成熟，還有很多不成熟的方面弟灼，它的價值還有待驗證级解。

現(xiàn)在的技術有限，需要界定合理的需求田绑，降低合作方的相關需求勤哗。

對話設計要更優(yōu)雅地達到目的。

我們希望在現(xiàn)在的基礎上做能做且有價值的事辛馆，努力把不能做的變成可做的俺陋。

今天的分享到此結(jié)束，謝謝大家昙篙！

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末腊状，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子苔可，更是在濱河造成了極大的恐慌缴挖，老刑警劉巖，帶你破解...
沈念sama閱讀 211,265評論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件焚辅，死亡現(xiàn)場離奇詭異映屋，居然都是意外死亡，警方通過查閱死者的電腦和手機同蜻，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,078評論 2贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門棚点，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人湾蔓，你說我怎么就攤上這事瘫析。” “怎么了？”我有些...
開封第一講書人閱讀 156,852評論 0贊 347
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵贬循，是天一觀的道長咸包。經(jīng)常有香客問我，道長杖虾，這世上最難降的妖魔是什么烂瘫？我笑而不...
開封第一講書人閱讀 56,408評論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮奇适，結(jié)果婚禮上坟比，老公的妹妹穿的比我還像新娘。我一直安慰自己滤愕，他們只是感情好温算，可當我...
茶點故事閱讀 65,445評論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著间影，像睡著了一般。火紅的嫁衣襯著肌膚如雪茄茁。梳的紋絲不亂的頭發(fā)上魂贬，一...
開封第一講書人閱讀 49,772評論 1贊 290
城市分裂傳說
那天，我揣著相機與錄音裙顽，去河邊找鬼付燥。笑死，一個胖子當著我的面吹牛愈犹，可吹牛的內(nèi)容都是我干的键科。我是一名探鬼主播，決...
沈念sama閱讀 38,921評論 3贊 406
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼漩怎，長吁一口氣：“原來是場噩夢啊……” “哼勋颖！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起勋锤，我...
開封第一講書人閱讀 37,688評論 0贊 266
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤饭玲，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后叁执，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茄厘，經(jīng)...
沈念sama閱讀 44,130評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,467評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年谈宛，在試婚紗的時候發(fā)現(xiàn)自己被綠了次哈。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,617評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡吆录，死狀恐怖窑滞，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤葛假，帶...
沈念sama閱讀 34,276評論 4贊 329
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布障陶，位于F島的核電站，受9級特大地震影響聊训，放射性物質(zhì)發(fā)生泄漏抱究。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,882評論 3贊 312
男人毒藥：我在死后第九天來索命
文/蒙蒙一带斑、第九天我趴在偏房一處隱蔽的房頂上張望鼓寺。院中可真熱鬧，春花似錦勋磕、人聲如沸妈候。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,740評論 0贊 21
一樁弒父案挂滓，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽苦银。三九已至，卻和暖如春赶站，著一層夾襖步出監(jiān)牢的瞬間幔虏，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,967評論 1贊 265
情欲美人皮
我被黑心中介騙來泰國打工贝椿，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留想括，地道東北人。一個月前我還...
沈念sama閱讀 46,315評論 2贊 360
代替公主和親
正文我出身青樓烙博，卻偏偏與公主長得像瑟蜈，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子渣窜，可洞房花燭夜當晚...
茶點故事閱讀 43,486評論 2贊 348