產(chǎn)品經(jīng)理如何從0-1搭建對(duì)話(huà)機(jī)器人

前言

? ? ? ?對(duì)話(huà)機(jī)器人已經(jīng)是市面上一款比較常見(jiàn)的產(chǎn)品青责,像淘寶中的淘小蜜户誓,滴滴打車(chē)的客服機(jī)器人等等,他們最核心的價(jià)值在于:可以7*24小時(shí)不間斷服務(wù)排龄,以非常簡(jiǎn)單自然的交互方式,高效準(zhǔn)確的回答用戶(hù)的問(wèn)題或者完成特定的任務(wù)翎朱,降低公司使用人工客服的成本。

目前網(wǎng)上的文章基本是從技術(shù)人員的視角去講解如何搭建對(duì)話(huà)功能尺铣,那么到底什么是從產(chǎn)品的視角從0-1搭建對(duì)話(huà)機(jī)器人呢拴曲?筆者認(rèn)為,一個(gè)完整的對(duì)話(huà)機(jī)器人應(yīng)該分為以下幾個(gè)部分:對(duì)話(huà)功能模塊凛忿,人機(jī)交互模塊數(shù)據(jù)分析平臺(tái)澈灼。尤其在最開(kāi)始做對(duì)話(huà)項(xiàng)目的時(shí)候,應(yīng)該先了解整個(gè)項(xiàng)目的架構(gòu)店溢,不能過(guò)多的把時(shí)間放入對(duì)話(huà)能力中而忽略了其他模塊叁熔,相反可以在整個(gè)項(xiàng)目搭建完成后再逐漸提升整體功能。

? ? ? ? 從0到1床牧,做深做透,做寬做雜。


1. 構(gòu)建機(jī)器人前

? ? ? ?需要通過(guò)需求調(diào)研掖疮,用戶(hù)調(diào)研癞蚕,明確機(jī)器人的類(lèi)型、基本功能和應(yīng)用場(chǎng)景著蛙,了解自己要做的是什么樣的一個(gè)機(jī)器人删铃。

用戶(hù)調(diào)研

? ? ? ?需要了解用戶(hù)的需求,分析用戶(hù)和需要解決的問(wèn)題

對(duì)話(huà)類(lèi)型

? ? ? ?問(wèn)答型機(jī)器人一般用戶(hù)客服場(chǎng)景踏堡,可以快速回答用戶(hù)問(wèn)題猎唁。任務(wù)型機(jī)器人一般用于完成特定的任務(wù),比如給機(jī)器人發(fā)送要買(mǎi)機(jī)票的消息顷蟆,然后就可以選擇航班和填寫(xiě)相關(guān)的信息進(jìn)行下單诫隅。閑聊型機(jī)器人會(huì)模擬真人和用戶(hù)進(jìn)行對(duì)話(huà)缎患。

交互方式

? ? ? ?問(wèn)答、閑聊阎肝、和任務(wù)三種類(lèi)型挤渔。

載體

? ? ? ?即承載對(duì)話(huà)機(jī)器人的物體,目前大多存在于手機(jī)APP和智能音箱中风题。


2.?對(duì)話(huà)模塊搭建:

? ? ? ?怎么去解決對(duì)話(huà)問(wèn)題呢判导?

該模塊主要通過(guò)NLP(自然語(yǔ)言處理)去解決對(duì)話(huà)功能,過(guò)程是通過(guò)機(jī)器學(xué)習(xí)的各種算法去構(gòu)建語(yǔ)言模型沛硅,然后通過(guò)數(shù)據(jù)標(biāo)注眼刃,模型訓(xùn)練,模型測(cè)試等過(guò)程去訓(xùn)練模型摇肌,在訓(xùn)練之后擂红,模型可以在用戶(hù)發(fā)送的語(yǔ)句中獲取用戶(hù)的意圖和實(shí)體,然后返回相應(yīng)的答案給用戶(hù)围小,從而使模型可以實(shí)現(xiàn)對(duì)話(huà)效果昵骤。

? ? ? ?目前市面上有好多公司都提供第三方機(jī)器人搭建服務(wù),像百度UNIT肯适,圖靈機(jī)器人等等变秦,即在網(wǎng)頁(yè)上填寫(xiě)語(yǔ)料等數(shù)據(jù)即可構(gòu)建。在此需要注意的 是框舔,需要區(qū)分云端和本地的區(qū)別蹦玫,第三方的機(jī)器人服務(wù)基本上都是在云端部署服務(wù),需要連接網(wǎng)絡(luò)刘绣,而本地的話(huà)則需要程序員自己搭建程序樱溉,不過(guò)好處是速度比較快。一般來(lái)說(shuō)可以部署再本地部署一部分常見(jiàn)問(wèn)題纬凤,其余的問(wèn)題部署在云端福贞,即維持效率,又保證成本移斩。

? ? ? ?本文以開(kāi)源機(jī)器學(xué)習(xí)框架RASA進(jìn)行講解肚医。先簡(jiǎn)單介紹一下該框架,該框架由2部分組成向瓷,分別是語(yǔ)義理解和對(duì)話(huà)管理, 在機(jī)器人接受到用戶(hù)發(fā)送的語(yǔ)句后肠套,會(huì)把用戶(hù)的語(yǔ)句傳遞到語(yǔ)義理解部分去識(shí)別意圖和實(shí)體,再去對(duì)話(huà)管理部分尋找對(duì)應(yīng)答案猖任。具體執(zhí)行過(guò)程如下圖所示:

? ? ? ?該開(kāi)源框架使用的是embedding算法你稚,即把訓(xùn)練樣本和意圖編碼到同一個(gè)向量空間,設(shè)計(jì)損失函數(shù)(是將隨機(jī)事件變量的取值映射為非負(fù)實(shí)數(shù)以表示該隨機(jī)事件的“風(fēng)險(xiǎn)”或“損失”的函數(shù),分類(lèi)正確的取0刁赖,錯(cuò)誤的取1)搁痛,使得樣本與真實(shí)意圖更相近,樣本與其他意圖更相反宇弛,意圖之間編碼更相反鸡典,達(dá)到意圖分類(lèi)的目的。

2.1 語(yǔ)言模型

? ? ? ?語(yǔ)言模型的原理是計(jì)算句子或者單子序列的概率枪芒,或者序列中下一個(gè)單詞概率的模型彻况。主要應(yīng)用場(chǎng)景包括:情感分析,問(wèn)答舅踪,總結(jié)纽甘,機(jī)器翻譯和語(yǔ)音識(shí)別。生成的方式有使用N-grams抽碌,神經(jīng)網(wǎng)絡(luò)悍赢,長(zhǎng)短期記憶網(wǎng)絡(luò)等方法。本文因使用開(kāi)源框架RASA講解货徙,里面已經(jīng)包含了模型左权。

2.2 模型訓(xùn)練

? ? ? ?當(dāng)程序員構(gòu)建好模型后,模型需要通過(guò)標(biāo)注好的數(shù)據(jù)進(jìn)行訓(xùn)練破婆,具體流程如下圖所示:

1) 數(shù)據(jù)標(biāo)注:

? ? ? ?即標(biāo)注意圖涮总,實(shí)體。 意圖是指用戶(hù)的目的祷舀,詞槽是篩選的條件,實(shí)體是詞槽的詞典烹笔。實(shí)體和詞槽一般用于多輪對(duì)話(huà)裳扯。

2) 訓(xùn)練語(yǔ)料庫(kù):

? ? ? ?在項(xiàng)目初期,公司沒(méi)有任何積累的情況下谤职,答案庫(kù)需要人工生成饰豺。需要配置意圖與對(duì)應(yīng)的訓(xùn)練語(yǔ)料,每個(gè)意圖需要填寫(xiě)若干個(gè)訓(xùn)練的語(yǔ)料允蜈,按照框架的說(shuō)明書(shū)“定義意圖可能會(huì)出現(xiàn)的文本內(nèi)容文件”冤吨,即盡可能多的填寫(xiě)該意圖所對(duì)應(yīng)的用戶(hù)問(wèn)法。下面舉一個(gè)例子饶套,?"我該怎么登陸QQ郵箱呢" 是一個(gè)比較常見(jiàn)的問(wèn)題漩蟆,我填寫(xiě)的意圖是 "登錄郵箱", 并配置了5個(gè)訓(xùn)練語(yǔ)料,分別是 “登錄郵箱” 妓蛮,“我該怎么登陸QQ油箱呢” 怠李,“打開(kāi)QQ油箱” ,“QQ油箱如何登陸” ,“怎么進(jìn)QQ郵箱” 捺癞,訓(xùn)練預(yù)料是填的越多夷蚊,則效果越好。

3) 模型訓(xùn)練:

? ? ? ?當(dāng)配置好訓(xùn)練語(yǔ)料后髓介,將訓(xùn)練語(yǔ)料放入模型進(jìn)行訓(xùn)練惕鼓。值得一提的是,模型訓(xùn)練操作在項(xiàng)目初期可能通過(guò)自己在文件中編寫(xiě)意圖和語(yǔ)料唐础,然后導(dǎo)成Json文件f發(fā)送給程序員進(jìn)行訓(xùn)練箱歧,在數(shù)據(jù)平臺(tái)搭建后,則可以在平臺(tái)中加入訓(xùn)練功能直接操作彻犁。

4) 模型測(cè)試:

? ? ? ?下圖是筆者用Postman進(jìn)行測(cè)試的圖片叫胁。可以看到汞幢,在我輸入像機(jī)器人發(fā)出”年假“語(yǔ)句后驼鹅,會(huì)跟模型中的"年假"意圖產(chǎn)生98%的匹配度,而排名第二的意圖相似度是0.2%森篷,幾乎是不匹配输钩。

2.3 閾值:

? ? ? ?閾的意思是界限,故閾值又叫臨界值。我們需要為機(jī)器人設(shè)定閾值也就是為意圖匹配設(shè)定界限仲智。比如根據(jù)測(cè)試結(jié)果买乃,可以將閾值設(shè)定成0.7,也就是說(shuō)在匹配度0.8以上都判斷意圖匹配為正確(具體可以按照機(jī)器人實(shí)際數(shù)據(jù)調(diào)整)钓辆。

2.4 答案庫(kù)

? ? ? ?和訓(xùn)練語(yǔ)料庫(kù)一下剪验,答案庫(kù)也需要人工生成,或者從特定的網(wǎng)站上通過(guò)PYTHON抓取前联。抓取下來(lái)的文件需要經(jīng)過(guò)人工審核和處理功戚,以保證文字、標(biāo)點(diǎn)和圖片的格式保持一致似嗤,這樣在回復(fù)用戶(hù)的時(shí)候能做到效果的統(tǒng)一啸臀。

? ? ? ?當(dāng)完成模型搭建,模型訓(xùn)練烁落,閾值設(shè)定和答案庫(kù)乘粒,聊天機(jī)器人的第一模塊,也就是”對(duì)話(huà)模塊“就已經(jīng)搭建完成了伤塌。


3.數(shù)據(jù)平臺(tái)搭建

? ? ? ?該模塊也是在很多構(gòu)建機(jī)器人文章中所未提及的內(nèi)容灯萍。在筆者最開(kāi)始做對(duì)話(huà)機(jī)器人的時(shí)候,是通過(guò)開(kāi)發(fā)人員給的測(cè)試地址寸谜,使用Postman發(fā)送不同的問(wèn)題對(duì)一個(gè)意圖進(jìn)行測(cè)試的(上面模型測(cè)試中的圖)竟稳,然后記錄測(cè)試問(wèn)題的數(shù)量和意圖匹配度等數(shù)據(jù)到EXCEL中進(jìn)行統(tǒng)計(jì)與分析属桦,過(guò)程相當(dāng)復(fù)雜且費(fèi)時(shí)。然而數(shù)據(jù)平臺(tái)的搭建可以很好的解決這個(gè)問(wèn)題他爸。通過(guò)對(duì)用戶(hù)問(wèn)答的數(shù)據(jù)實(shí)行實(shí)時(shí)監(jiān)控和分析聂宾,可以準(zhǔn)確及時(shí)的提出相應(yīng)的產(chǎn)品規(guī)劃方案和調(diào)整策略,并持續(xù)優(yōu)化诊笤。

? ? ? ?數(shù)據(jù)平臺(tái)設(shè)計(jì)應(yīng)該從總覽到細(xì)分系谐,并且不斷對(duì)比√指總覽需要簡(jiǎn)潔明了纪他,讓用戶(hù)一眼就知道這是什么數(shù)據(jù)和對(duì)應(yīng)的大概指標(biāo)。細(xì)分應(yīng)該提供足夠豐富的維度晾匠,以便于分析茶袒。每次細(xì)分必須帶著指標(biāo)下去,并結(jié)合相關(guān)業(yè)務(wù)凉馆。數(shù)據(jù)本身沒(méi)有意義薪寓,分析和對(duì)比后的結(jié)果才有意義。數(shù)據(jù)平臺(tái)搭建的核心意義就是如此澜共。

? ? ? ?對(duì)話(huà)機(jī)器人數(shù)據(jù)平臺(tái)搭建需要區(qū)分一下B端和C端2個(gè)方向向叉,B端看重的是解決方案,更多的會(huì)側(cè)重意圖命中的準(zhǔn)確率嗦董,而C端則需要通過(guò)埋點(diǎn)等功能母谎,去分析用戶(hù)的行為。以筆者所在的公司為例京革,主要是通過(guò)釘釘自動(dòng)回復(fù)公司內(nèi)部工作人員一些人事問(wèn)題奇唤,所以這邊就不太需要涉及到埋點(diǎn)需求。

3.1 面向的用戶(hù)和場(chǎng)景

對(duì)產(chǎn)品人員來(lái)說(shuō):用來(lái)評(píng)估模型的準(zhǔn)確率等匹摇。

對(duì)運(yùn)營(yíng)人員來(lái)說(shuō):用來(lái)評(píng)估模型冻记,展示對(duì)話(huà)機(jī)器人的各項(xiàng)使用數(shù)據(jù):如用戶(hù)問(wèn)答次數(shù),回答準(zhǔn)確率和對(duì)話(huà)操作過(guò)程等等来惧,并根據(jù)數(shù)據(jù)進(jìn)行分析。

對(duì)運(yùn)維人員來(lái)說(shuō):用來(lái)填寫(xiě)訓(xùn)練語(yǔ)料演顾,維護(hù)各種意圖供搀。

3.2 設(shè)計(jì)各類(lèi)數(shù)據(jù)指標(biāo):

如意圖命中率钠至,單日問(wèn)答數(shù)量統(tǒng)計(jì)葛虐,單日意圖命中數(shù)量統(tǒng)計(jì)等數(shù)據(jù),具體根據(jù)公司的需求來(lái)制定棉钧。

3.3 設(shè)計(jì)數(shù)據(jù)平臺(tái)頁(yè)面:

1)單個(gè)頁(yè)面同時(shí)展示指標(biāo)不要太多屿脐,一般為4-5個(gè)比較合適

2)在指標(biāo)的展現(xiàn)時(shí)候,要明確指標(biāo)之間的主次關(guān)系

3)為合適的指標(biāo)選擇合適的可視化圖形很重要。目前幾種常見(jiàn)的圖表應(yīng)用:趨勢(shì)用折線(xiàn)或者曲線(xiàn)圖的诵,分布用餅狀圖万栅,占比趨勢(shì)用堆積圖,對(duì)比用柱狀形圖西疤,多個(gè)指標(biāo)交叉作用散點(diǎn)圖烦粒,轉(zhuǎn)化用漏斗圖,綜合能力比較用雷達(dá)圖代赁。

數(shù)據(jù)指標(biāo)對(duì)于一些功能比較有意義扰她,比如在界面上想加入常見(jiàn)問(wèn)題推薦,那么哪些問(wèn)題是可以被推薦的呢芭碍,這個(gè)時(shí)候就要根據(jù)后臺(tái)的數(shù)據(jù)分析來(lái)定徒役,看哪些問(wèn)題被提問(wèn)的頻率是最高的。


4. 交互模塊(界面+功能):

交互模塊:交互界面

設(shè)計(jì)對(duì)話(huà)流程:

1)基于任務(wù)的會(huì)話(huà):需要設(shè)定好任務(wù)的流程窖壕,以及所需求的數(shù)據(jù)忧勿,并引導(dǎo)用戶(hù)進(jìn)行相應(yīng)的反饋或操作,可以用點(diǎn)觸的方式艇拍。

2)單輪問(wèn)答:設(shè)定好對(duì)應(yīng)的答案狐蜕,以及沒(méi)有相應(yīng)意圖匹配時(shí)候的話(huà)術(shù)。

上下文

一般多輪會(huì)話(huà)中需要設(shè)計(jì)上下文卸夕。需要設(shè)計(jì)好輪次层释,和對(duì)應(yīng)的回答。

筆者因?yàn)楣举Y源有限快集,采用的是在界面上加入一個(gè)圖標(biāo)贡羔,在用戶(hù)點(diǎn)擊圖標(biāo)后,會(huì)自動(dòng)幫用戶(hù)轉(zhuǎn)入有上下文的多輪對(duì)話(huà)查詢(xún)?nèi)蝿?wù)中个初。

對(duì)話(huà)結(jié)果展示:

1)文字展示

以文字的形式展現(xiàn)答案乖寒,文字中重要的信息采用加粗顯示以表示重點(diǎn)。字體院溺,字號(hào)等格式需要統(tǒng)一楣嘁。

2)圖片或者表格展示

以圖片或者表格的形式展現(xiàn)答案,如果圖片(表格)比較大珍逸,可以采用左右滑動(dòng)逐虚,或者折疊的方式去展示。

3)推薦問(wèn)題

一般在機(jī)器人沒(méi)有命中意圖的時(shí)候谆膳,會(huì)采取推薦問(wèn)題的形式叭爱。

4)進(jìn)入人工

在客服機(jī)器人的場(chǎng)景中,當(dāng)沒(méi)有意圖匹配也沒(méi)有推薦問(wèn)題的時(shí)候漱病,可以將對(duì)話(huà)轉(zhuǎn)入人工服務(wù)买雾。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末把曼,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子漓穿,更是在濱河造成了極大的恐慌嗤军,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,607評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件器净,死亡現(xiàn)場(chǎng)離奇詭異型雳,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)山害,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)纠俭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人浪慌,你說(shuō)我怎么就攤上這事冤荆。” “怎么了权纤?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,960評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵钓简,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我汹想,道長(zhǎng)外邓,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,750評(píng)論 1 294
  • 正文 為了忘掉前任古掏,我火速辦了婚禮损话,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘槽唾。我一直安慰自己丧枪,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,764評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布庞萍。 她就那樣靜靜地躺著拧烦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪钝计。 梳的紋絲不亂的頭發(fā)上恋博,一...
    開(kāi)封第一講書(shū)人閱讀 51,604評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音私恬,去河邊找鬼交播。 笑死,一個(gè)胖子當(dāng)著我的面吹牛践付,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播缺厉,決...
    沈念sama閱讀 40,347評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼永高,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼隧土!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起命爬,我...
    開(kāi)封第一講書(shū)人閱讀 39,253評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤曹傀,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后饲宛,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體皆愉,經(jīng)...
    沈念sama閱讀 45,702評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,893評(píng)論 3 336
  • 正文 我和宋清朗相戀三年艇抠,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了幕庐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,015評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡家淤,死狀恐怖异剥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情絮重,我是刑警寧澤冤寿,帶...
    沈念sama閱讀 35,734評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站青伤,受9級(jí)特大地震影響督怜,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜狠角,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,352評(píng)論 3 330
  • 文/蒙蒙 一号杠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧擎厢,春花似錦究流、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,934評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至厘惦,卻和暖如春偷仿,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背宵蕉。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,052評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工酝静, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人羡玛。 一個(gè)月前我還...
    沈念sama閱讀 48,216評(píng)論 3 371
  • 正文 我出身青樓别智,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親稼稿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子薄榛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,969評(píng)論 2 355