Rasa對話系統(tǒng)--篇章2

github代碼rasa_nlp

典型的對話系統(tǒng)
1.IR-Bot:檢索型問答系統(tǒng)(用戶輸入問題,系統(tǒng)返回一個答案反番,不帶對話流程朝卒,不帶上下文)
2.Task-Bot:任務型對話系統(tǒng)(eg:買票耍群、訂票、訂餐任務型的對話)
3.Chitchat-Bot:閑聊系統(tǒng)(微軟小冰畴栖,陪人聊天随静,閑扯型)

用戶輸入:語音/文本 ----> 自然語言理解NLU:領域識別/用戶意圖識別/填槽(關鍵信息) ----> 對話管理DM:對話狀態(tài)跟蹤(填槽的狀態(tài)、歷史對話記錄)/對話策略吗讶,產(chǎn)生action ----> 自然語言生成NLU:生成回答燎猛。[圖片上傳失敗...(image-1f7e04-1559211731947)]
](https://upload-images.jianshu.io/upload_images/6102062-a9ebe45dadc78563.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

一、首先根據(jù)github代碼rasa_nlp照皆,先安裝rasa重绷。
pip install rasa_core==0.9.0 (其他版本也行)
pip install rasa_nlu==0.9.0 (其他版本也行)
pip install -U scikit-learn sklearn-crfsuite
pip install git+https://github.com/mit-nlp/MITIE.git

pip install -U scikit-learn sklearn-crfsuite
pip install git+https://github.com/mit-nlp/MITIE.git

二、自然語言理解NLU模塊的訓練
1.文件train.sh

python -m rasa_nlu.train \
    --data ./data/mobile_nlu_data.json \
    --config ivr_chatbot.yml \
    --path projects \
    --fixed_model_name demo \
    --project ivr_nlu

獨自運行python -m rasa_nlu.train會提示必須有配置文件--config
注: python -m rasa_nlu.train是訓練自然語言理解模塊
注: python -m rasa_nlu.server是啟動自然語言理解模塊服務


獨自運行python -m rasa_nlu.train會提示必須有配置文件--config
獨自運行python -m rasa_nlu.server會提示需要指明其他參數(shù)值

仔細分析文件train.sh 分析自然語言理解NLU模型訓練過程中需要的數(shù)據(jù)參數(shù)信息等
仔細分析自然語言理解NLU模型訓練過程中需要的數(shù)據(jù)參數(shù)信息等
  • 查看該python -m rasa_nlu.train的--data ./data/mobile_nlu_data.json內(nèi)容

    自然語言理解模塊訓練的數(shù)據(jù)集樣例

  • 查看該python -m rasa_nlu.train的--config ivr_chatbot.yml內(nèi)容
    通過以下分析纵寝,得知:python -m rasa_nlu.train的時候需要準備訓練數(shù)據(jù)(json格式论寨,文本星立,意圖,實體標注葬凳,同義詞標注等)绰垂,因此--data必須自己準備一份自己領域的數(shù)據(jù),必須制定自己訓練數(shù)據(jù)的位置火焰;python -m rasa_nlu.train的時候也需要制定模型的一些參數(shù)劲装,若每次運行時手動指定不方便,則需要自己設計一個xxxx.yml配置文件昌简,作為--config的值占业。其他信息可以寫在xxxx.yml文件內(nèi)。
    python -m rasa_nlu.train --data your_data.json --config your_model_peizhi.yml

#注:該yml文件是rasa_nlu.train訓練時候的默認配置信息纯赎,
#注:在train.sh文件中谦疾,新指定了 path:projects ; fixed_model_name:demo ; project:ivr_nlu
#注:訓練生成的內(nèi)容存儲位置按照train.sh里指定的信息來存儲,該文件中的默認設置會被替代
language: "zh"  ###處理中文
project: "ivr_nlu"   ###項目名
fixed_model_name: "demo"   ###修正的模型名
path: "models"  ###項目存放的位置
pipeline:  ###管道犬金,訓練NLU需要的內(nèi)容
- name: "nlp_mitie"
  model: "data/total_word_feature_extractor.dat"
- name: "tokenizer_jieba"
- name: "ner_mitie"
- name: "ner_synonyms"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_mitie"
- name: "intent_classifier_sklearn"
  • 查看python -m rasa_nlu.train的--path模型存放位置念恍;--fixed_model_name重新訓練修正后的模型名;--project重新訓練修正后的模型存放的位置

2.再重點分析一下晚顷,rasa_nlu.train --config xxx.yml配置文件
對于中文對話的rasa管道有兩種設置方案

1.使用 MITIE+Jieba:
["nlp_mitie", "tokenizer_jieba", "ner_mitie", "ner_synonyms", "intent_classifier_mitie"]
2.使用MITIE+Jieba+sklearn(config_jieba_mitie_sklearn.json):
["nlp_mitie", "tokenizer_jieba", "ner_mitie", "ner_synonyms", "intent_featurizer_mitie", "intent_classifier_sklearn"]
"nlp_mitie"初始化MITIE
"tokenizer_jieba"用jieba來做分詞
"ner_mitie"實體識別
"ner_synonyms"實體識別
"intent_featurizer_mitie"為意圖識別做特征提取
"intent_classifier_sklearn"使用sklearn做意圖識別的分類
language: "zh"  ###處理中文
project: "ivr_nlu"   ###項目名
fixed_model_name: "demo"   ###修正的模型名
path: "models"  ###項目存放的位置
pipeline:  ###管道峰伙,訓練NLU需要的內(nèi)容
- name: "nlp_mitie"
  model: "data/total_word_feature_extractor.dat"
- name: "tokenizer_jieba"
- name: "ner_mitie"
- name: "ner_synonyms"
- name: "intent_entity_featurizer_regex"
- name: "intent_featurizer_mitie"
- name: "intent_classifier_sklearn"

3.運行模型 sh train.sh
運行完模型生成文件目錄
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市该默,隨后出現(xiàn)的幾起案子瞳氓,更是在濱河造成了極大的恐慌,老刑警劉巖栓袖,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件匣摘,死亡現(xiàn)場離奇詭異,居然都是意外死亡裹刮,警方通過查閱死者的電腦和手機恋沃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來必指,“玉大人,你說我怎么就攤上這事恕洲∷穑” “怎么了?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵霜第,是天一觀的道長葛家。 經(jīng)常有香客問我,道長泌类,這世上最難降的妖魔是什么癞谒? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上弹砚,老公的妹妹穿的比我還像新娘双仍。我一直安慰自己,他們只是感情好桌吃,可當我...
    茶點故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布朱沃。 她就那樣靜靜地躺著,像睡著了一般茅诱。 火紅的嫁衣襯著肌膚如雪逗物。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天瑟俭,我揣著相機與錄音翎卓,去河邊找鬼。 笑死摆寄,一個胖子當著我的面吹牛失暴,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播椭迎,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼锐帜,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了畜号?” 一聲冷哼從身側響起缴阎,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎简软,沒想到半個月后蛮拔,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡痹升,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年建炫,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疼蛾。...
    茶點故事閱讀 38,569評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡肛跌,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出察郁,到底是詐尸還是另有隱情衍慎,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布皮钠,位于F島的核電站稳捆,受9級特大地震影響,放射性物質發(fā)生泄漏麦轰。R本人自食惡果不足惜乔夯,卻給世界環(huán)境...
    茶點故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一砖织、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧末荐,春花似錦侧纯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至剃幌,卻和暖如春聋涨,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背负乡。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工牍白, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抖棘。 一個月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓茂腥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親切省。 傳聞我的和親對象是個殘疾皇子最岗,可洞房花燭夜當晚...
    茶點故事閱讀 43,446評論 2 348

推薦閱讀更多精彩內(nèi)容