Rasa對話系統(tǒng)--篇章2

github代碼rasa_nlp

典型的對話系統(tǒng)
1.IR-Bot:檢索型問答系統(tǒng)(用戶輸入問題，系統(tǒng)返回一個答案反番，不帶對話流程朝卒，不帶上下文)
2.Task-Bot:任務型對話系統(tǒng)(eg:買票耍群、訂票、訂餐任務型的對話)
3.Chitchat-Bot:閑聊系統(tǒng)(微軟小冰畴栖，陪人聊天随静，閑扯型)

用戶輸入：語音/文本 ----> 自然語言理解NLU：領域識別/用戶意圖識別/填槽(關鍵信息) ----> 對話管理DM：對話狀態(tài)跟蹤(填槽的狀態(tài)、歷史對話記錄)/對話策略吗讶，產(chǎn)生action ----> 自然語言生成NLU：生成回答燎猛。[圖片上傳失敗...(image-1f7e04-1559211731947)]
](https://upload-images.jianshu.io/upload_images/6102062-a9ebe45dadc78563.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

一、首先根據(jù)github代碼rasa_nlp照皆，先安裝rasa重绷。
pip install rasa_core==0.9.0 (其他版本也行)
pip install rasa_nlu==0.9.0 (其他版本也行)
pip install -U scikit-learn sklearn-crfsuite
pip install git+https://github.com/mit-nlp/MITIE.git

pip install -U scikit-learn sklearn-crfsuite

pip install git+https://github.com/mit-nlp/MITIE.git

二、自然語言理解NLU模塊的訓練
1.文件train.sh

python -m rasa_nlu.train \
    --data ./data/mobile_nlu_data.json \
    --config ivr_chatbot.yml \
    --path projects \
    --fixed_model_name demo \
    --project ivr_nlu

獨自運行python -m rasa_nlu.train會提示必須有配置文件--config
注： python -m rasa_nlu.train是訓練自然語言理解模塊
注： python -m rasa_nlu.server是啟動自然語言理解模塊服務

獨自運行python -m rasa_nlu.train會提示必須有配置文件--config

獨自運行python -m rasa_nlu.server會提示需要指明其他參數(shù)值

仔細分析文件train.sh 分析自然語言理解NLU模型訓練過程中需要的數(shù)據(jù)參數(shù)信息等

仔細分析自然語言理解NLU模型訓練過程中需要的數(shù)據(jù)參數(shù)信息等

查看該python -m rasa_nlu.train的--data ./data/mobile_nlu_data.json內(nèi)容

自然語言理解模塊訓練的數(shù)據(jù)集樣例
查看該python -m rasa_nlu.train的--config ivr_chatbot.yml內(nèi)容
通過以下分析纵寝，得知：python -m rasa_nlu.train的時候需要準備訓練數(shù)據(jù)(json格式论寨，文本星立，意圖，實體標注葬凳，同義詞標注等)绰垂，因此--data必須自己準備一份自己領域的數(shù)據(jù)，必須制定自己訓練數(shù)據(jù)的位置火焰；python -m rasa_nlu.train的時候也需要制定模型的一些參數(shù)劲装，若每次運行時手動指定不方便，則需要自己設計一個xxxx.yml配置文件昌简，作為--config的值占业。其他信息可以寫在xxxx.yml文件內(nèi)。
python -m rasa_nlu.train --data your_data.json --config your_model_peizhi.yml

#注：該yml文件是rasa_nlu.train訓練時候的默認配置信息纯赎，
#注：在train.sh文件中谦疾，新指定了 path：projects ; fixed_model_name：demo ; project：ivr_nlu
#注：訓練生成的內(nèi)容存儲位置按照train.sh里指定的信息來存儲，該文件中的默認設置會被替代
language: "zh"  ###處理中文
project: "ivr_nlu"   ###項目名
fixed_model_name: "demo"   ###修正的模型名
path: "models"  ###項目存放的位置
pipeline:  ###管道犬金，訓練NLU需要的內(nèi)容
- name: "nlp_mitie"
  model: "data/total_word_feature_extractor.dat"
- name: "tokenizer_jieba"
- name: "ner_mitie"
- name: "ner_synonyms"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_mitie"
- name: "intent_classifier_sklearn"

查看python -m rasa_nlu.train的--path模型存放位置念恍；--fixed_model_name重新訓練修正后的模型名；--project重新訓練修正后的模型存放的位置

2.再重點分析一下晚顷，rasa_nlu.train --config xxx.yml配置文件
對于中文對話的rasa管道有兩種設置方案

1.使用 MITIE+Jieba:
["nlp_mitie", "tokenizer_jieba", "ner_mitie", "ner_synonyms", "intent_classifier_mitie"]
2.使用MITIE+Jieba+sklearn(config_jieba_mitie_sklearn.json):
["nlp_mitie", "tokenizer_jieba", "ner_mitie", "ner_synonyms", "intent_featurizer_mitie", "intent_classifier_sklearn"]
"nlp_mitie"初始化MITIE
"tokenizer_jieba"用jieba來做分詞
"ner_mitie"實體識別
"ner_synonyms"實體識別
"intent_featurizer_mitie"為意圖識別做特征提取
"intent_classifier_sklearn"使用sklearn做意圖識別的分類

language: "zh"  ###處理中文
project: "ivr_nlu"   ###項目名
fixed_model_name: "demo"   ###修正的模型名
path: "models"  ###項目存放的位置
pipeline:  ###管道峰伙，訓練NLU需要的內(nèi)容
- name: "nlp_mitie"
  model: "data/total_word_feature_extractor.dat"
- name: "tokenizer_jieba"
- name: "ner_mitie"
- name: "ner_synonyms"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_mitie"
- name: "intent_classifier_sklearn"

3.運行模型 sh train.sh

運行完模型生成文件目錄

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市该默，隨后出現(xiàn)的幾起案子瞳氓，更是在濱河造成了極大的恐慌，老刑警劉巖栓袖，帶你破解...
沈念sama閱讀 210,978評論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件匣摘，死亡現(xiàn)場離奇詭異，居然都是意外死亡裹刮，警方通過查閱死者的電腦和手機恋沃，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,954評論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來必指，“玉大人，你說我怎么就攤上這事恕洲∷穑” “怎么了？”我有些...
開封第一講書人閱讀 156,623評論 0贊 345
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵霜第，是天一觀的道長葛家。經(jīng)常有香客問我，道長泌类，這世上最難降的妖魔是什么癞谒？我笑而不...
開封第一講書人閱讀 56,324評論 1贊 282
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上弹砚，老公的妹妹穿的比我還像新娘双仍。我一直安慰自己，他們只是感情好桌吃，可當我...
茶點故事閱讀 65,390評論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布朱沃。她就那樣靜靜地躺著，像睡著了一般茅诱。火紅的嫁衣襯著肌膚如雪逗物。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,741評論 1贊 289
城市分裂傳說
那天瑟俭，我揣著相機與錄音翎卓，去河邊找鬼。笑死摆寄，一個胖子當著我的面吹牛失暴，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播椭迎，決...
沈念sama閱讀 38,892評論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼锐帜，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了畜号？” 一聲冷哼從身側響起缴阎，我...
開封第一講書人閱讀 37,655評論 0贊 266
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎简软，沒想到半個月后蛮拔，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,104評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡痹升，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,451評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年建炫，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疼蛾。...
茶點故事閱讀 38,569評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡肛跌，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出察郁，到底是詐尸還是另有隱情衍慎，我是刑警寧澤，帶...
沈念sama閱讀 34,254評論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布皮钠，位于F島的核電站稳捆，受9級特大地震影響，放射性物質發(fā)生泄漏麦轰。R本人自食惡果不足惜乔夯，卻給世界環(huán)境...
茶點故事閱讀 39,834評論 3贊 312
男人毒藥：我在死后第九天來索命
文/蒙蒙一砖织、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧末荐，春花似錦侧纯、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,725評論 0贊 21
一樁弒父案茂蚓，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至剃幌，卻和暖如春聋涨，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背负乡。一陣腳步聲響...
開封第一講書人閱讀 31,950評論 1贊 264
情欲美人皮
我被黑心中介騙來泰國打工牍白，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人抖棘。一個月前我還...
沈念sama閱讀 46,260評論 2贊 360
代替公主和親
正文我出身青樓茂腥，卻偏偏與公主長得像，于是被迫代替她去往敵國和親切省。傳聞我的和親對象是個殘疾皇子最岗，可洞房花燭夜當晚...
茶點故事閱讀 43,446評論 2贊 348

Rasa對話系統(tǒng)--篇章2

推薦閱讀更多精彩內(nèi)容