讀懂智能對話系統(tǒng)(1)任務(wù)導(dǎo)向型對話系統(tǒng)

京東數(shù)據(jù)團(tuán)隊曾經(jīng)出了一片關(guān)于對話系統(tǒng)的論文《A Survey on Dialogue Systems:Recent Advances and New Frontiers(智能對話系統(tǒng)調(diào)查:前沿與進(jìn)展)》,全文引用了124篇論文,是一篇綜合全面的介紹對話系統(tǒng)的文章。

論文原文地址:

https://www.kdd.org/exploration_files/19-2-Article3.pdf

公眾號“機(jī)器學(xué)習(xí)算法全棧工程師”對這篇論文的內(nèi)容進(jìn)行了解讀痛侍,主要概述了對話系統(tǒng)鲫趁,尤其是對話系統(tǒng)在深度學(xué)習(xí)方面的進(jìn)展磷杏,還討論了可能的研究方向吏饿。以下是主要架構(gòu):

奇點機(jī)智對這篇文章進(jìn)行了進(jìn)一步的拆解,分成四篇文章來介紹智能對話系統(tǒng)憋活。

讀懂智能對話系統(tǒng)(1)任務(wù)導(dǎo)向型對話系統(tǒng)

讀懂智能對話系統(tǒng)(2)聊天機(jī)器人

讀懂智能對話系統(tǒng)(3)對話系統(tǒng)的未來發(fā)展


來源:機(jī)器學(xué)習(xí)算法全棧工程師
作者:蒙康

任務(wù)導(dǎo)向型對話系統(tǒng)

擁有一個虛擬助理或一個擁有足夠智能的聊天伙伴系統(tǒng)似乎是虛幻的,而且可能只在科幻電影中存在很長一段時間虱黄。近年來悦即,人機(jī)對話因其潛在的潛力和誘人的商業(yè)價值而受到越來越多研究者的關(guān)注。

隨著大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的發(fā)展橱乱,創(chuàng)建一個自動的人機(jī)對話系統(tǒng)作為我們的私人助理或聊天伙伴辜梳,將不再是一個幻想。
當(dāng)前泳叠,對話系統(tǒng)在各個領(lǐng)域越來越引起人們的重視作瞄,深度學(xué)習(xí)技術(shù)的不斷進(jìn)步極大地推動了對話系統(tǒng)的發(fā)展。對于對話系統(tǒng)析二,深度學(xué)習(xí)技術(shù)可以利用大量的數(shù)據(jù)來學(xué)習(xí)特征表示和回復(fù)生成策略粉洼,這其中僅需要少量的手工操作。

現(xiàn)如今叶摄,我們可以很容易地訪問網(wǎng)絡(luò)上對話的“大數(shù)據(jù)”属韧,我們也許能夠?qū)W習(xí)如何回復(fù),以及如何回復(fù)幾乎任何的輸入蛤吓,這將極大地允許我們在人類和計算機(jī)之間建立數(shù)據(jù)驅(qū)動的宵喂、開放的對話系統(tǒng)。

另一方面会傲,深度學(xué)習(xí)技術(shù)已經(jīng)被證明是有效的锅棕,可以在大數(shù)據(jù)中捕獲復(fù)雜的模式,并擁有大量的研究領(lǐng)域淌山,如計算機(jī)視覺裸燎、自然語言處理和推薦系統(tǒng)等。在本文中泼疑,作者從不同的角度對這些最近的關(guān)于對話系統(tǒng)的進(jìn)展進(jìn)行概述德绿,并討論了一些可能的研究方向。
具體來說,對話系統(tǒng)大致可分為兩種:

  • 任務(wù)導(dǎo)向型(task-oriented)對話系統(tǒng)
  • 非任務(wù)導(dǎo)向型(non-task-oriented)對話系統(tǒng)(也稱為聊天機(jī)器人)

面向任務(wù)的對話系統(tǒng)是對話系統(tǒng)的一個重要分支移稳。在這部分中蕴纳,作者總結(jié)了面向任務(wù)的對話系統(tǒng)的管道方法和端到端方法。

管道(pipeline)方法

任務(wù)導(dǎo)向型對話系統(tǒng)的典型結(jié)構(gòu)在之前的圖中已經(jīng)展示个粱,它包括四個關(guān)鍵組成部分:

  • 自然語言理解(Natural Language Understanding古毛,NLU)

它將用戶輸入解析為預(yù)定義的語義槽。

如果有一個話語都许,自然語言理解將其映射為語義槽稻薇。插槽是根據(jù)不同的場景預(yù)先定義的。

上圖展示了一個自然語言表示的示例梭稚,其中“New York”是指定為slot值的位置颖低,并且分別指定了域和意圖。典型的弧烤,有兩種類型的表示忱屑。一個是話語層次類別,如用戶的意圖和話語類別暇昂。另一個是字級信息提取莺戒,如命名實體識別和槽填充。對話意圖檢測是為了檢測用戶的意圖急波。它將話語劃分為一個預(yù)先定義的意圖从铲。

  • 對話狀態(tài)跟蹤(Dialogue State Tracker,DST)

對話狀態(tài)跟蹤是確保對話系統(tǒng)健壯性的核心組件澄暮。它在對話的每一輪次對用戶的目標(biāo)進(jìn)行預(yù)估名段,管理每個回合的輸入和對話歷史,輸出當(dāng)前對話狀態(tài)泣懊。這種典型的狀態(tài)結(jié)構(gòu)通常稱為槽填充或語義框架伸辟。傳統(tǒng)的方法已經(jīng)在大多數(shù)商業(yè)實現(xiàn)中得到了廣泛的應(yīng)用,通常采用手工規(guī)則來選擇最有可能的輸出結(jié)果馍刮。然而信夫,這些基于規(guī)則的系統(tǒng)容易出現(xiàn)頻繁的錯誤,因為最可能的結(jié)果并不總是理想的卡啰。
最近深度學(xué)習(xí)采用的方法是使用一個滑動窗口輸出任意數(shù)量的可能值的概率分布序列静稻。雖然它在一個領(lǐng)域受過訓(xùn)練,但它可以很容易地轉(zhuǎn)移到新的領(lǐng)域匈辱。此處運(yùn)用較多的模型是振湾,multi-domain RNN dialog state tracking models和Neural Belief Tracker (NBT) 。

  • 對話策略學(xué)習(xí)(Dialogue policy learning)

策略學(xué)習(xí)根據(jù)狀態(tài)跟蹤器的狀態(tài)表示生成下一個可用的系統(tǒng)操作亡脸。無論是監(jiān)督學(xué)習(xí)還是強(qiáng)化學(xué)習(xí)都可以用來優(yōu)化政策學(xué)習(xí)押搪。監(jiān)督學(xué)習(xí)是針對規(guī)則產(chǎn)生的行為進(jìn)行的佛南,在在線購物場景中,如果對話狀態(tài)是“推薦”嵌言,那么觸發(fā)“推薦”操作,系統(tǒng)將從產(chǎn)品數(shù)據(jù)庫中檢索產(chǎn)品及穗。強(qiáng)化學(xué)習(xí)方法的引入可以對對話策略進(jìn)行進(jìn)一步的訓(xùn)練摧茴,以引導(dǎo)系統(tǒng)制定最終的策略。在實際實驗中埂陆,強(qiáng)化學(xué)習(xí)方法的效果超過了基于規(guī)則和監(jiān)督的方法苛白。

  • 自然語言生成(Natural Language Generation,NLG)

選擇操作進(jìn)行映射并生成回復(fù)焚虱。
一個好的生成器通常依賴于幾個因素:適當(dāng)性购裙、流暢性、可讀性和變化性鹃栽。傳統(tǒng)的NLG方法通常是執(zhí)行句子計劃躏率。它將輸入語義符號映射到代表話語的中介形式,如樹狀或模板結(jié)構(gòu)民鼓,然后通過表面實現(xiàn)將中間結(jié)構(gòu)轉(zhuǎn)換為最終響應(yīng)薇芝。深度學(xué)習(xí)比較成熟的方法是基于LSTM的encoder-decoder形式,將問題信息丰嘉、語義槽值和對話行為類型結(jié)合起來生成正確的答案夯到。同時利用了注意力機(jī)制來處理對解碼器當(dāng)前解碼狀態(tài)的關(guān)鍵信息,根據(jù)不同的行為類型生成不同的回復(fù)饮亏。

端到端(end-to-end)方法

盡管傳統(tǒng)的面向任務(wù)的對話系統(tǒng)中有許多特定領(lǐng)域的手工制作耍贾,但它們很難適應(yīng)新的領(lǐng)域,近年來路幸,隨著端到端神經(jīng)生成模型的發(fā)展荐开,為面向任務(wù)的對話系統(tǒng)構(gòu)建了端到端的可訓(xùn)練框架。值得注意的是劝赔,當(dāng)我們引入非面向任務(wù)的對話系統(tǒng)時誓焦,將討論關(guān)于神經(jīng)生成模型的更多細(xì)節(jié)。與傳統(tǒng)的管道模型不同着帽,端到端模型使用一個模塊杂伟,并與結(jié)構(gòu)化的外部數(shù)據(jù)庫交互。

上圖的模型是一種基于網(wǎng)絡(luò)的端到端可訓(xùn)練任務(wù)導(dǎo)向型對話系統(tǒng)仍翰,將對話系統(tǒng)的學(xué)習(xí)作為學(xué)習(xí)從對話歷史到系統(tǒng)回復(fù)的映射問題赫粥,并應(yīng)用encoder-decoder模型來訓(xùn)練。然而予借,該系統(tǒng)是在監(jiān)督的方式下進(jìn)行訓(xùn)練——不僅需要大量的訓(xùn)練數(shù)據(jù)越平,而且由于缺乏對訓(xùn)練數(shù)據(jù)對話控制的進(jìn)一步探索频蛔,它也可能無法找到一個好的策略。

隨著強(qiáng)化學(xué)習(xí)研究的不斷深入秦叛,上圖的模型首先提出了一種端到端強(qiáng)化學(xué)習(xí)的方法晦溪,在對話管理中聯(lián)合訓(xùn)練對話狀態(tài)跟蹤和對話策略學(xué)習(xí),從而更有力地對系統(tǒng)的動作進(jìn)行優(yōu)化挣跋。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末三圆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子避咆,更是在濱河造成了極大的恐慌舟肉,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件查库,死亡現(xiàn)場離奇詭異路媚,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)樊销,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門整慎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人围苫,你說我怎么就攤上這事院领。” “怎么了够吩?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵比然,是天一觀的道長。 經(jīng)常有香客問我周循,道長强法,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任湾笛,我火速辦了婚禮饮怯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘嚎研。我一直安慰自己蓖墅,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布临扮。 她就那樣靜靜地躺著论矾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪杆勇。 梳的紋絲不亂的頭發(fā)上贪壳,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天,我揣著相機(jī)與錄音蚜退,去河邊找鬼闰靴。 笑死彪笼,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蚂且。 我是一名探鬼主播配猫,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼杏死!你這毒婦竟也來了章姓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤识埋,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后零渐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體窒舟,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年诵盼,在試婚紗的時候發(fā)現(xiàn)自己被綠了惠豺。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡风宁,死狀恐怖洁墙,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情戒财,我是刑警寧澤热监,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站饮寞,受9級特大地震影響孝扛,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜幽崩,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一苦始、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧慌申,春花似錦陌选、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至柒爵,卻和暖如春臼勉,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背餐弱。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工宴霸, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留囱晴,地道東北人。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓瓢谢,卻偏偏與公主長得像畸写,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子氓扛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容