NLP業(yè)務(wù)應(yīng)用系列-NLU

NLU定義

自然語言理解(NLU)就是要獲得一個(gè)計(jì)算機(jī)能用來計(jì)算的語義框架
文字本身就是人類用來承載語義的工具扔亥,語義框架就是對(duì)其含義的抽象典徊,語言的表示是多樣的合砂,但是背后的語義是不變的,明確的語義框架就可以由計(jì)算機(jī)處理映皆。
應(yīng)用
NLU目前應(yīng)用比較成熟的領(lǐng)域大概有兩大類
1访敌、人機(jī)對(duì)話
2凉敲、搜索與推薦系統(tǒng)

對(duì)話系統(tǒng)中的NLU模塊

人機(jī)對(duì)話中,NLU是對(duì)話系統(tǒng)的重要組成部分,用戶每次的輸入都要NLU模塊的處理爷抓。主要解決以下任務(wù):
1势决、意圖的識(shí)別,識(shí)別用戶想要干啥
2蓝撇、實(shí)體識(shí)別果复,對(duì)信息進(jìn)行標(biāo)注以用于后續(xù)多輪對(duì)話填槽
3、情感識(shí)別 閑聊機(jī)器人可能需要識(shí)別用戶的情緒以影響給用戶的回復(fù)

這里以谷歌的dialogflow為例


谷歌-意圖識(shí)別

目前對(duì)話系統(tǒng)最普遍的就是語料丟進(jìn)去直接進(jìn)行意圖分類
目前的對(duì)話系統(tǒng)丟入10條以上的數(shù)據(jù)就可以有個(gè)初步的識(shí)別效果渤昌。后期需要進(jìn)行進(jìn)一步訓(xùn)練達(dá)到精確識(shí)別虽抄。
雖然無法看到背后的技術(shù)原理,猜測(cè)應(yīng)該是基于神經(jīng)網(wǎng)絡(luò)的模型独柑,能快速提取特征實(shí)現(xiàn)分類任務(wù)迈窟,而且和實(shí)體識(shí)別一塊兒完成

基于模板的意圖識(shí)別(百度UNTI)
對(duì)話模板是對(duì)話系統(tǒng)按具體語法、句式做出的示范忌栅,教它在某一個(gè)特定語法车酣、句式中理解對(duì)話意圖,哪個(gè)詞是重要信息索绪,對(duì)應(yīng)的詞槽湖员、特征詞是什么。

例如: [D:sys_loc][D:sys_time]天氣如何瑞驱,上述標(biāo)注表示可以將所有滿足[城市]+[時(shí)間]+天氣如何這一規(guī)則的query解析,這樣的模板句式命中天氣詢問的意圖娘摔。
基于模板的意圖識(shí)別是傳統(tǒng)的手動(dòng)設(shè)計(jì)特征的方式做識(shí)別。但目前隨著深度學(xué)習(xí)預(yù)訓(xùn)練模型的完善钱烟,識(shí)別意圖所以依賴的數(shù)據(jù)大大減少晰筛,基本上都趨于使用通過語料訓(xùn)練的模式嫡丙。

不論是用什么方式拴袭,意圖識(shí)別最終解決的是一個(gè)分類問題,只是告訴系統(tǒng)這屬于 【訂酒店】還是【問天氣】

實(shí)體識(shí)別與槽填充

“實(shí)體”是 Dialogflow 用于從自然語言輸入中識(shí)別和提取有用數(shù)據(jù)的一種機(jī)制曙博。例如:北京→city 包子→food 拥刻;

在任務(wù)型對(duì)話中,對(duì)于任務(wù)完成必要的實(shí)體信息我們稱為槽位(比如詢問天氣總得知道哪里父泳、什么時(shí)候)般哼,識(shí)別這種實(shí)體信息的過程叫填槽;一般系統(tǒng)會(huì)本身附帶通用的實(shí)體惠窄,比如時(shí)間蒸眠、地點(diǎn)等;在具體的任務(wù)中有些實(shí)體信息需要我們自己定義杆融。一般有兩種方式

1楞卡、通過同義詞詞典做匹配

同義詞典匹配

本質(zhì)上是關(guān)鍵詞匹配;命中關(guān)鍵詞即識(shí)別實(shí)體
系統(tǒng)還提供了詞典自動(dòng)擴(kuò)充的功能,推測(cè)是基于詞向量相似蒋腮,自動(dòng)將語義表示相似的詞也放入詞典進(jìn)行識(shí)別。

2、通過上下文標(biāo)注

上下文標(biāo)注

將自己定義的實(shí)體在語料中進(jìn)行標(biāo)注臊岸,讓系統(tǒng)通過標(biāo)注學(xué)習(xí)識(shí)別該實(shí)體红伦;

這樣的標(biāo)注通常處于語句環(huán)境中,上下文具有一定的相似性作彤,就比較容易將這類特征的實(shí)體識(shí)別出來膘魄;
比如 我這里的 @cityto 與 @cityfrom 都是城市實(shí)體,系統(tǒng)并不容易區(qū)分竭讳;通過多次在語句中標(biāo)注后根據(jù)上下文做識(shí)別瓣距。比如它會(huì)總結(jié)出 前后位置、從代咸、去這些特征的影響從而確定槽位的識(shí)別蹈丸。

通過意圖識(shí)別與槽填充,可以將用戶的query表示為結(jié)構(gòu)化的語義呐芥;比如
北京明天天氣怎么樣逻杖? → 【v.city】【v.date】天氣怎么樣? 通過這樣的表示就可以更精確的識(shí)別意圖思瘟、提取語義信息荸百,并且為后續(xù)的DM系統(tǒng)做準(zhǔn)備

情感識(shí)別

情感識(shí)別應(yīng)用于閑聊機(jī)器人的情感化回復(fù),系統(tǒng)可以針對(duì)用戶的情緒給出響應(yīng)回答滨攻。在客服領(lǐng)域可以根據(jù)用戶情緒給予積極够话、中立、樂觀等情緒角色的回答

情感識(shí)別

情感識(shí)別是典型的分類任務(wù)光绕。上述生成任務(wù)中對(duì)情感的分類高達(dá)6種女嘲,越豐富細(xì)膩的情感機(jī)器識(shí)別率越低。一般應(yīng)用時(shí)可能只有三種: 積極诞帐、消極欣尼、中立 ;準(zhǔn)確率高點(diǎn)停蕉,90%以上愕鼓。

這是百度大腦的情感識(shí)別功能

積極情緒
消極情緒

這類情感識(shí)別任務(wù)可以應(yīng)用到社交網(wǎng)絡(luò)以及評(píng)論領(lǐng)域去做用戶群體傾向的分析;

情感分類之前有用關(guān)鍵詞做匹配去識(shí)別慧起,但是問題在于語言表達(dá)有時(shí)候出現(xiàn)的雙重否定句菇晃。目前通過深度學(xué)習(xí)網(wǎng)絡(luò)去做這類分類會(huì)比較準(zhǔn)確。能夠進(jìn)一步更細(xì)膩的情感分類蚓挤。

推薦系統(tǒng)的NLU應(yīng)用

挖坑待填

(筆者正尋求NLP磺送、人機(jī)對(duì)話方向產(chǎn)品職位 微信:cheng390552021)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末剩失,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子册着,更是在濱河造成了極大的恐慌拴孤,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,729評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件甲捏,死亡現(xiàn)場(chǎng)離奇詭異演熟,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)司顿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,226評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門芒粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人大溜,你說我怎么就攤上這事化漆。” “怎么了钦奋?”我有些...
    開封第一講書人閱讀 169,461評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵座云,是天一觀的道長。 經(jīng)常有香客問我付材,道長朦拖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,135評(píng)論 1 300
  • 正文 為了忘掉前任厌衔,我火速辦了婚禮璧帝,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘富寿。我一直安慰自己睬隶,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,130評(píng)論 6 398
  • 文/花漫 我一把揭開白布页徐。 她就那樣靜靜地躺著苏潜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪泞坦。 梳的紋絲不亂的頭發(fā)上窖贤,一...
    開封第一講書人閱讀 52,736評(píng)論 1 312
  • 那天砖顷,我揣著相機(jī)與錄音贰锁,去河邊找鬼。 笑死滤蝠,一個(gè)胖子當(dāng)著我的面吹牛豌熄,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播物咳,決...
    沈念sama閱讀 41,179評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼锣险,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起芯肤,我...
    開封第一講書人閱讀 40,124評(píng)論 0 277
  • 序言:老撾萬榮一對(duì)情侶失蹤巷折,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后崖咨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體锻拘,經(jīng)...
    沈念sama閱讀 46,657評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,723評(píng)論 3 342
  • 正文 我和宋清朗相戀三年击蹲,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了署拟。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,872評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡歌豺,死狀恐怖推穷,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情类咧,我是刑警寧澤馒铃,帶...
    沈念sama閱讀 36,533評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站痕惋,受9級(jí)特大地震影響骗露,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜血巍,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,213評(píng)論 3 336
  • 文/蒙蒙 一萧锉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧述寡,春花似錦柿隙、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,700評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至螟炫,卻和暖如春波附,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昼钻。 一陣腳步聲響...
    開封第一講書人閱讀 33,819評(píng)論 1 274
  • 我被黑心中介騙來泰國打工掸屡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人然评。 一個(gè)月前我還...
    沈念sama閱讀 49,304評(píng)論 3 379
  • 正文 我出身青樓仅财,卻偏偏與公主長得像,于是被迫代替她去往敵國和親碗淌。 傳聞我的和親對(duì)象是個(gè)殘疾皇子盏求,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,876評(píng)論 2 361