論文-A Self-Attention Joint Model for Spoken Language Understanding in Situational Dialog Applications

1. 簡稱

論文《A Self-Attention Joint Model for Spoken Language Understanding in Situational Dialog Applications》,作者Mengyang Chen(ByteDance Corporation, China)弧烤,經(jīng)典的NLU論文(Semantic Frame)岔激。

2. 摘要

3. 引言

口語理解(SLU)是面向目標的對話系統(tǒng)中的重要組成部分啃匿。它通常涉及識別說話者的意圖并從用戶話語中提取語義槽位柱嫌,這被稱為意圖檢測(ID)和空位填充(SF)谒养。表I展示了一個來自航空旅行信息系統(tǒng)(ATIS)語料庫的示例游岳。近年來沥潭,人們對SLU問題進行了深入研究邀泉。但是,這些方法只是在語法上限制了SF結(jié)果钝鸽,獨立地解決了ID和SF汇恤,或者沒有充分利用兩個任務的相互影響。本文提出了一個具有條件隨機場(CRF)層和先驗掩碼的多頭自注意力模型拔恰。實驗表明啡氢,與最新模型相比照宝,我們模型的有效性叁巨。同時避诽,最近幾年中國的在線教育取得了長足的進步。但是饭冬,很少有用于學生學習外語的智能教育對話應用程序使鹅。因此,我們設(shè)計了一個智能對話機器人昌抠,該機器人配備了不同的場景設(shè)置患朱,可以幫助學生學習交流技能。

我們提出了一個聯(lián)合模型炊苫,該模型使用多頭局部自注意來提取共享特征裁厅,使用掩碼門控機制來探索輸出的相關(guān)性,并使用CRF來約束SF輸出侨艾,以完美地解決該問題执虹。

4. 核心

我們在本節(jié)中介紹我們的模型,概述為圖一唠梨。第一層將輸入序列X={x_k}映射成向量袋励,通過把詞級別嵌入{e_k^w}和從BI-LSTM中獲取字級別的嵌入e_k^c連接起來。其中k是序列中單詞索引当叭。由于上下文信息(尤其是相鄰單詞)在序列標記中很有用茬故,因此我們采用多頭局部自注意來提取上下文感知特征{c_k^e}。局部上下文特征是H=(h_{k-1},...,h_k,...h_{k+w})和注意力輸出計算公式為:

a=softmax(W_{km1}tanh(W_{km2}H))\tag{1}
c_k^e=aH\tag{2}

其中W_{km1}W_{km2}是用于第k個詞和第m個頭的局部自注意力的第一層和第二層權(quán)重蚁鳖。Bi-LSTM層產(chǎn)生{h_k}磺芭,將其用于使用多層完全連接分類器對意圖y^I進行分類。

y^I=softmax(W^Ih_n+b^I)\tag{3}

在訓練期間使用了交叉熵損失醉箕,并且意圖標簽對應于在預測期間給出最高概率的索引钾腺。

隱藏狀態(tài)也被發(fā)送到類似的多頭本地自我關(guān)注結(jié)構(gòu)以生成{c_k^h}徙垫。由于在不同意圖下的槽分布是不同的,我們采用一個先驗掩碼放棒,它是一個由意圖P(y_k^s|y^I)給出槽的條件概率分布姻报。我們將掩碼和意圖輸出相乘,將結(jié)果與{c_k^h}連接起來哨查,最后放入一個CRF層去獲取受約束的槽結(jié)果Y^s={y_k^s}逗抑,我們把P當做注意力的輸出矩陣的得分剧辐。P_{k,y_k^s}表示第k個詞的y_k^s標簽的得分寒亥,我們定義得分函數(shù)為:

s(X,Y^s)=\sum_{k=0}^nA_{y_k^s,y_{k+1}^s}+\sum_{k=1}^nP_{k,y_k^s}\tag{4}

所有可能的標簽序列上的softmax產(chǎn)生序列Y^s的概率。我們在訓練過程中最大化正確標簽序列的對數(shù)概率荧关。解碼時溉奕,對得分最高的輸出序列進行預測。

5. 實驗

為了評估所提出模型的效率忍啤,我們對ATIS和Snips數(shù)據(jù)集進行了實驗加勤,這些數(shù)據(jù)集被廣泛用作SLU研究的基準。 ATIS包含預訂機票的人的錄音同波。片段是從個人語音助手收集的鳄梅。插槽填充任務的性能由F1分數(shù)衡量,而意圖檢測任務則以預測精度進行評估未檩。表II中列出了針對其他方法的模型結(jié)果戴尸。與最新方法相比,我們的方法在兩個數(shù)據(jù)集上的ID分別提高了0.14%和0.49%冤狡,在SF中分別提高了0.02%和0.04%孙蒙。

6. 實際應用

在過去的很長一段時間里,非英語母語的學生在語法或閱讀理解上花費了太多的時間悲雳,以至于他們要么專注于言語影子挎峦,要么專注于簡單的對話,而沒有復雜的對話狀態(tài)跟蹤合瓢,從而不能幫助學生流利地表達和處理復雜場景下的對話坦胶。

為了幫助K12學生更好地處理旅行、購物和點餐等現(xiàn)實場景晴楔,我們設(shè)計了一個對話應用程序顿苇。該框架實際上是一個標準的面向目標的對話系統(tǒng),如圖4所示滥崩。首先岖圈,Agent采用前面討論的SLU方法來分析學生的意圖和槽值。其次钙皮,利用基于規(guī)則的對話跟蹤技術(shù)記錄會話狀態(tài)變化蜂科,并做出相應的動作顽决。最后,使用預定義的模板生成響應导匣。

由于本文討論的主題是SLU才菠,為了方便起見,我們?nèi)サ袅薃SR和TTS模塊贡定,使用了一個簡化的版本(實際使用的是百度語音API)赋访。

圖2顯示了一個購物示例,圖3是DST的偽代碼和決策邏輯缓待。

當學生不知道如何回應時蚓耽,可以通過在APP中選擇“幫助”來獲取提示。

7. EVIDENCE OF POTENTIAL IMPACTS

教育是全世界人民都非常重視的領(lǐng)域旋炒。

相關(guān)研究表明步悠,中國只有四分之一的學生可以進入本科學習,這遠遠少于發(fā)達國家瘫镇。幸運的是鼎兽,在過去的幾年里,教育行業(yè)取得了很大的進步铣除。2013年以來谚咬,中國K12市場規(guī)模增速保持在30%以上。然而尚粘,由于巨大的租金和教師工資成本择卦,傳統(tǒng)公司遇到了利潤問題。他們將重點轉(zhuǎn)向在線教育方案背苦,其中CR4(四家公司集中率)低于5%互捌,目前還沒有大型公司存在。此外行剂,中國還制定了政府計劃秕噪,鼓勵新興市場力量進入這一領(lǐng)域。對于父母來說厚宰,他們高度重視英語學習腌巾,并愿意為加強孩子的口語和聽力技能買單。然而铲觉,流行的應用澈蝙,如VIPKID,主要集中在語音陰影上撵幽,不能完全滿足他們的需求灯荧。事實上,學習外語的核心目標是在日常對話中流利地說和聽盐杂。

只有幾家公司專注于情景對話逗载,他們只使用簡單的邏輯來跟蹤對話狀態(tài)哆窿。換句話說,如果沒有預定義的用戶話語厉斟,對話將無法繼續(xù)挚躯。學生們可能會對這樣的模式感到厭倦。基于我們的方法設(shè)計的會話機器人提供了更大的交談自由度擦秽,并跟蹤不同意圖和槽值之間的對話狀態(tài)轉(zhuǎn)換码荔。

我們從北京當?shù)刂行W抽取了50名K12學生,進行了一項用戶研究感挥。他們中的大多數(shù)人認為這種模式很新鮮缩搅,并表現(xiàn)出極大的熱情繼續(xù)與機器人交談。

這款應用目前正在進行內(nèi)部測試链快,稍后將發(fā)布誉己。

8. 概述

在本文中,我們提出了SLU任務的聯(lián)合學習模型域蜗。執(zhí)行局部自我注意和嵌入以提取句子特征,將其發(fā)送到雙向LSTM以捕獲單詞之間的關(guān)系噪猾。然后霉祸,使用共享特征在面罩門控機制中執(zhí)行意圖分類和縫隙填充任務。此外袱蜡,我們應用了CRF層來約束時隙的輸出并獲得合理的結(jié)果丝蹭。我們還基于提出的SLU方法,基于規(guī)則的跟蹤技能和基于模板的語言生成技能坪蚁,設(shè)計了一種教育性APP奔穿,以幫助學生在實踐中很好地說和聽。此外敏晤,我們建立了幾個常見場景對話的數(shù)據(jù)集贱田。我們將繼續(xù)擴大數(shù)據(jù)集并在以后發(fā)布。

9. 重點論文

  • Zhang, Xiaodong, and Houfeng Wang. "A Joint Model of Intent Determination and Slot Filling for Spoken Language Understanding." IJCAI. 2016.
  • Liu, Bing, and Ian Lane. "Attention-based recurrent neural network models for joint intent detection and slot filling." arXiv preprint arXiv:1609.01454 (2016).
  • Goo, Chih-Wen, et al. "Slot-gated modeling for joint slot filling and intent prediction." Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 2 (Short Papers). Vol. 2. 2018.
  • Li, Changliang, Liang Li, and Ji Qi. "A Self-Attentive Model with Gate Mechanism for Spoken Language Understanding." Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. 2018.
  • Xu, Puyang, and Ruhi Sarikaya. "Convolutional neural network based triangular crf for joint intent detection and slot filling." 2013 IEEE Workshop on Automatic Speech Recognition and Understanding. IEEE, 2013.

10. 代碼編寫

# 后續(xù)追加代碼分析

參考文獻

  1. Chen, M., Zeng, J., & Lou, J. (2019). A Self-Attention Joint Model for Spoken Language Understanding in Situational Dialog Applications. CoRR.
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嘴脾,一起剝皮案震驚了整個濱河市男摧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌译打,老刑警劉巖耗拓,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異奏司,居然都是意外死亡乔询,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門韵洋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來竿刁,“玉大人岸夯,你說我怎么就攤上這事∶峭祝” “怎么了猜扮?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長监婶。 經(jīng)常有香客問我旅赢,道長,這世上最難降的妖魔是什么惑惶? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任煮盼,我火速辦了婚禮,結(jié)果婚禮上带污,老公的妹妹穿的比我還像新娘僵控。我一直安慰自己,他們只是感情好鱼冀,可當我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布报破。 她就那樣靜靜地躺著,像睡著了一般千绪。 火紅的嫁衣襯著肌膚如雪充易。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天荸型,我揣著相機與錄音盹靴,去河邊找鬼。 笑死瑞妇,一個胖子當著我的面吹牛稿静,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辕狰,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼改备,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了柳琢?” 一聲冷哼從身側(cè)響起绍妨,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎柬脸,沒想到半個月后他去,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡倒堕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年灾测,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡媳搪,死狀恐怖铭段,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情秦爆,我是刑警寧澤序愚,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站等限,受9級特大地震影響爸吮,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜望门,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一形娇、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧筹误,春花似錦桐早、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至丽惶,卻和暖如春炫七,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背钾唬。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留侠驯,地道東北人抡秆。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像吟策,于是被迫代替她去往敵國和親儒士。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容