Hi,忙碌了許久肠套,終于有片刻的閑暇時(shí)光。想想了最近做的一些項(xiàng)目,其中涉及的部分功能設(shè)計(jì)覺得需要重新梳理一下思路,找出其中的不足曙痘,也分享給大家,請(qǐng)大家不吝賜教~
由于人工智能(AI)風(fēng)的興起与斤,大家在日常生活中也慢慢的受AI技術(shù)的影響网持,像我們使用較頻繁的產(chǎn)品如“喜馬拉雅”、“今日頭條”竣稽、“微博”等囱怕,這些產(chǎn)品都會(huì)根據(jù)我們每日瀏覽的內(nèi)容推送給相關(guān)的內(nèi)容給我們?yōu)g覽閱讀,比較普遍的叫法就是“千人千面”毫别。
本文我想講一下在客服領(lǐng)域中的“千人千面”娃弓,略懂皮毛~
業(yè)務(wù)訴求是:在企業(yè)中有一個(gè)智能問答的機(jī)器人,收集內(nèi)部咨詢比較頻繁的業(yè)務(wù)知識(shí)岛宦,解決每位員工日常的咨詢台丛、答疑工作,從而減輕人工客服日復(fù)一日砾肺,重復(fù)的咨詢工作挽霉。
需求是:將用戶遇到問題被動(dòng)的去咨詢改變成根據(jù)用戶歷史咨詢的內(nèi)容,機(jī)器人自動(dòng)推動(dòng)與其相關(guān)的內(nèi)容变汪,讓用戶由被動(dòng)轉(zhuǎn)變成主動(dòng)獲取新的知識(shí)侠坎,更有利于用戶快速解決問題。
涉及的算法:在實(shí)現(xiàn)“千人千面”的過程裙盾,主要用到了“itemcf 基于物品的協(xié)同過濾算法”和“usercf 基于用戶協(xié)同推薦算法”
itemcf指的是給用戶推薦和他之前喜歡的物品相似的物品
usercf指的是瀏覽量該物品的用戶還瀏覽了哪些物品
抽取用戶標(biāo)簽
首先需要獲取用戶與機(jī)器人最近一段時(shí)間內(nèi)(可自定義)的會(huì)話記錄实胸,系統(tǒng)通過文本分析獲取每位用戶的標(biāo)簽信息他嫡。標(biāo)簽包含用戶所屬的部門、職級(jí)庐完、咨詢頻率較高的知識(shí)分類等
在抽取標(biāo)簽的過程中 需要了解客戶的業(yè)務(wù)钢属,將沒有用的信息降低權(quán)重,過濾掉不需要的標(biāo)簽詞门躯。比如“集團(tuán)職能”僅是每個(gè)職位前面的修飾語淆党,沒有作為標(biāo)簽的價(jià)值
標(biāo)簽抽取完成后,由于是系統(tǒng)自動(dòng)抽取存在抽取的標(biāo)簽不合理的情況生音,需要將此信息展示出來宁否,能支持人工干預(yù),提高標(biāo)簽的準(zhǔn)確性缀遍。另外抽取出的標(biāo)簽有可能表達(dá)同樣的意思但是標(biāo)簽名稱不一樣慕匠,這時(shí)候還需要利用“聚類”算法,對(duì)標(biāo)簽內(nèi)容進(jìn)行文本相似度計(jì)算域醇,對(duì)于意思相近的標(biāo)簽進(jìn)行合并
聚類可視化結(jié)果案例:同一類標(biāo)簽詞位置相近且顏色相同台谊。
根據(jù)用戶歷史訪問記錄,機(jī)器人自動(dòng)推送相關(guān)熱點(diǎn)問題供用戶訪問
用戶標(biāo)簽抽取完成后譬挚,即可用于用戶推薦了
在做推薦的過程中需要注意:
系統(tǒng)性能問題锅铅,因?yàn)閿?shù)據(jù)分析需要消耗服務(wù)器性能,所以決定每天凌晨定時(shí)去分析數(shù)據(jù)减宣,生成新的標(biāo)簽入數(shù)據(jù)庫(kù)盐须。這里也許你會(huì)發(fā)現(xiàn)一個(gè)問題,對(duì)漆腌,就是推薦數(shù)據(jù)不是實(shí)時(shí)的贼邓,每天更新一次,用戶在當(dāng)天內(nèi)看到的推薦數(shù)據(jù)都是一樣的闷尿。
冷啟動(dòng)問題塑径,對(duì)于初次訪問的用戶來說,他沒有會(huì)話記錄填具,按照上面的邏輯無法完成推薦统舀。所以我們想了其他的辦法,找到與當(dāng)前用戶同部門劳景、同職級(jí)的用戶誉简,將這些用戶咨詢的問題中瀏覽量topN的推送給當(dāng)前的用戶查看
驗(yàn)證推薦準(zhǔn)確性
推薦功能做完后,需要驗(yàn)證推薦的效果是否對(duì)用戶產(chǎn)生價(jià)值盟广。
先模擬10位新用戶闷串,其中5位用戶有針對(duì)性的對(duì)問題進(jìn)行咨詢,另外5位用戶則隨意咨詢衡蚂,每位用戶咨詢的問題數(shù)量不能少于10條窿克,有利于標(biāo)簽的抽取
再模擬10位新用戶,這些新用戶與上面用戶在相同的部門毛甲、相同的職級(jí)年叮,查看這些新用戶是否推送上面用戶咨詢過的問題。如果推送則說明推薦成功玻募,否則推薦失敗
結(jié)論
在設(shè)計(jì)這個(gè)功能的過程中只损,遇到了很多坑,標(biāo)簽抽取不準(zhǔn)七咧、推薦效果不理想跃惫、不知道該如何驗(yàn)證推薦準(zhǔn)確性等,多次向NLP艾栋、研發(fā)同事請(qǐng)教爆存,經(jīng)過多番溝通,最終完成了這個(gè)推薦功能蝗砾。自己從中學(xué)習(xí)到了不少知識(shí)點(diǎn)先较,最后產(chǎn)品上線也得到了業(yè)務(wù)部門的認(rèn)可,很是感謝小伙伴的支持~