對(duì)話式推薦綜述閱讀(Conversational Recommender System):(1)

前言

背景

推薦系統(tǒng)利用交互歷史來建模用戶的興趣骇塘,已被廣泛應(yīng)用。但由于靜態(tài)模型建模用戶偏好沒有明確的指令和用戶的正向反饋,因此靜態(tài)推薦模型(static)很難很好地回答兩個(gè)重要問題:
(a)用戶到底喜歡什么题涨?

  1. 靜態(tài)模型的學(xué)習(xí)過程通常是在歷史數(shù)據(jù)上進(jìn)行的蜗元,可能是稀疏且嘈雜的恨旱。
  2. 靜態(tài)模型的基本假設(shè)是所有歷史交互都代表用戶偏好。 首先尚揣,用戶可能不喜歡他們選擇的項(xiàng)目抑堡,因?yàn)樗麄兛赡茏龀鲥e(cuò)誤的決定摆出。 其次,用戶的偏好可能會(huì)隨著時(shí)間而變化首妖,這意味著用戶對(duì)商品的態(tài)度可能會(huì)發(fā)生變化懊蒸,并且從過去的數(shù)據(jù)中捕獲漂移的偏好會(huì)變得更加困難。
  3. 對(duì)于冷用戶悯搔,很難根據(jù)數(shù)據(jù)對(duì)他們的偏好進(jìn)行建模骑丸。 簡(jiǎn)而言之,靜態(tài)模型幾乎無法捕獲用戶的精確偏好妒貌。
    (b)用戶為什么喜歡某個(gè)物品通危?
  4. 許多因素會(huì)影響用戶在現(xiàn)實(shí)生活中的決定。 例如灌曙,用戶可能由于好奇心或其他人的影響而購(gòu)買產(chǎn)品, 也可能是自由考慮的結(jié)果菊碟。
  5. 不同的用戶購(gòu)買相同的產(chǎn)品锭部,但出于不同的動(dòng)機(jī)飞盆。 因此,同等對(duì)待不同用戶或同等對(duì)待同一個(gè)用戶的不同交互不適用于推薦模型惠猿。 實(shí)際上蚣驼,靜態(tài)模型很難解釋用戶消費(fèi)行為背后的各種原因魄幕。

作者認(rèn)為關(guān)鍵的困難來自于內(nèi)在的機(jī)制:交互建模的靜態(tài)模式從根本上限制了表達(dá)用戶意圖的方式,從而導(dǎo)致用戶與系統(tǒng)之間的信息不對(duì)稱 (asymmetric information)颖杏。

對(duì)話式推薦系統(tǒng)(CRS)的近期興起從根本上改變了這種情況纯陨。在CRS中,用戶和系統(tǒng)可以通過自然語(yǔ)言交互實(shí)現(xiàn)動(dòng)態(tài)交互留储,這提供了前所未有的機(jī)會(huì)來獲得用戶的準(zhǔn)確偏好翼抠。

CRS定義

A recommendation system that can elicit the dynamic preferences of users and take actions based on their current needs through real-time multi-turn interactions using natural language.
可以利用自然語(yǔ)言進(jìn)行實(shí)時(shí)多輪交互,從而激發(fā)用戶的動(dòng)態(tài)偏好并根據(jù)其當(dāng)前需求采取行動(dòng)获讳。
CRS示例如下:

一種替代解決方案是利用商品的屬性信息阴颖,這對(duì)于理解用戶的意圖是不言而喻的,并且可以迅速縮小候選商品的范圍丐膝。 基于批判的推薦系統(tǒng)(critiquing-based)是一種解決方案量愧,旨在引起用戶對(duì)某些屬性(而非物品)的反饋钾菊,是CRS的早期的一種形式。

批評(píng)就像推銷員一樣侠畔,通過主動(dòng)詢問商品屬性來收集用戶偏好结缚。例如损晤,當(dāng)尋找手機(jī)時(shí)软棺,用戶可以遵循系統(tǒng)的提示并提供諸如“更便宜”或“更長(zhǎng)的電池壽命”之類的反饋。根據(jù)這些反饋尤勋,系統(tǒng)將建議更合適的項(xiàng)目喘落; 該過程重復(fù)幾次,直到用戶找到滿意的物品或放棄為止最冰。該機(jī)制使系統(tǒng)具有更好的推斷用戶偏好的能力瘦棋,并有助于快速縮小(narrow down)推薦候選者的范圍。

現(xiàn)有的交互式和批注方法盡管有效暖哨,但受其表示能力的限制赌朋,用戶只能通過一些預(yù)定義的選項(xiàng)與系統(tǒng)進(jìn)行交互。 對(duì)話模塊在CRS中的集成可以進(jìn)行更靈活的交互篇裁,例如以標(biāo)簽沛慢,模板話語(yǔ)等自然語(yǔ)言的形式。 毫無疑問达布,通過對(duì)話形式可以更自然地表達(dá)和理解用戶的意圖团甲。

相關(guān)研究工作情況:近年來比較多,目前共有148篇相關(guān)論文

盡管已經(jīng)對(duì)CRS進(jìn)行了許多研究黍聂,但是還沒有統(tǒng)一的任務(wù)表述躺苦。 之前2020年的一篇綜述中(A Survey on Conversational Recommender Systems.)根據(jù)使用知識(shí)來源或交互方式進(jìn)行分類,例如基于格式(forms)或自然語(yǔ)言的方法产还,或由系統(tǒng)或用戶驅(qū)動(dòng)的方法匹厘。
現(xiàn)在的一些研究關(guān)注CRS的對(duì)話能力,嘗試基于端對(duì)端對(duì)話系統(tǒng)或深度語(yǔ)言模型來構(gòu)建模型脐区。 但是集乔,這些模型旨在學(xué)習(xí)人類會(huì)話語(yǔ)料庫(kù)中的模式,并且通常是不透明的且難以解釋坡椒。端到端方法在推薦和響應(yīng)方面人工評(píng)估效果不佳扰路。 因此,一個(gè)明確的對(duì)話策略是必要的倔叼,并且需要大量的研究工作汗唱。

CRS框架

本文提出了一個(gè)統(tǒng)一的框架來定義CRS任務(wù),由三個(gè)獨(dú)立的部件構(gòu)成丈攒。具體地說哩罪,由用戶界面授霸,對(duì)話策略模塊和推薦引擎組成。

  • user Interface 用戶界面充當(dāng)用戶與機(jī)器之間的翻譯器际插; 通常碘耳,它從用戶的原始話語(yǔ)中提取信息,并將信息轉(zhuǎn)換為機(jī)器可理解的表示框弛,并根據(jù)會(huì)話策略為用戶生成有意義的響應(yīng)辛辨。
  • Conversation Strategy 對(duì)話策略模塊是核心,負(fù)責(zé)協(xié)調(diào)其他兩個(gè)組件瑟枫,決定了CRS的核心邏輯斗搞,例如引起用戶興趣,保持多輪對(duì)話和引導(dǎo)新主題慷妙。
  • Recommendation Engine 推薦引擎負(fù)責(zé)對(duì)實(shí)體之間的關(guān)系進(jìn)行建模(例如僻焚,用戶-物品交互或物品-物品鏈接),學(xué)習(xí)和記錄用戶對(duì)物品和物品屬性的偏好膝擂,并檢索所需的信息虑啤。

具體的研究問題包括4個(gè)方面:

  1. Question-based User Preference Elicitation. 問題導(dǎo)向的用戶偏好啟發(fā)

CRS提供了通過詢問屬性問題的方面來顯式地引出用戶偏好。具體存在有兩個(gè)重要的問題:
(1)要問什么架馋?
(2)如何根據(jù)用戶反應(yīng)調(diào)整建議狞山?
前者著重于構(gòu)建問題以引出盡可能多的信息
后者利用用戶反饋的信息來提出更適當(dāng)?shù)耐扑]绩蜻。

  1. Multi-turn Conversational Recommendation Strategies 多輪對(duì)話策略

CRS需要與用戶反復(fù)互動(dòng)铣墨,并多次動(dòng)態(tài)地適應(yīng)用戶的響應(yīng)。 一個(gè)有效的策略涉及何時(shí)提出問題以及何時(shí)推薦办绝,
即讓模型在(1)繼續(xù)提出問題以進(jìn)一步減少偏好不確定性和(2)根據(jù)當(dāng)前對(duì)用戶偏好的建模生成推薦之間進(jìn)行選擇伊约。
通常應(yīng)以最少的對(duì)話次數(shù)為目標(biāo),以成功推薦為目標(biāo)孕蝉,因?yàn)橛脩粼谵D(zhuǎn)數(shù)過多后將失去耐心屡律。

  1. Natural Language Understanding and Generation 自然語(yǔ)言理解與生成

像人類一樣進(jìn)行交流仍然是CRS中最艱巨的挑戰(zhàn)之一。 為了理解用戶的興趣和意圖降淮,一些CRS方法將模型輸入定義為捕獲語(yǔ)義信息和用戶偏好的預(yù)定義標(biāo)簽超埋。 一些方法通過slot填充技術(shù)從用戶的原始話語(yǔ)中提取語(yǔ)義信息。 為了產(chǎn)生人類可理解的響應(yīng)佳鳖,CRS使用許多策略霍殴,例如直接提供推薦列表,將推薦物品納入基于規(guī)則的自然語(yǔ)言模板系吩。 此外来庭,一些研究人員提出了端到端框架,以使CRS能夠從原始自然語(yǔ)言中準(zhǔn)確理解用戶的情感和意圖穿挨,并生成可讀月弛,流暢肴盏,一致且有意義的自然語(yǔ)言響應(yīng)。(readable, fluent, consistent, and meaningful )

  1. Trade-offs between Exploration and Exploitation (E&E) 探索和利用問題

Exploitation:根據(jù)當(dāng)前信息帽衙,由訓(xùn)練的模型做出最佳的決策菜皂。
Exploration:探索未知的領(lǐng)域,比如在某個(gè)state執(zhí)行之前在這個(gè)state沒有執(zhí)行的action厉萝。
所以做exploitation和exploration的目的就是獲得一種長(zhǎng)期收益最高的策略恍飘,這個(gè)過程可能對(duì)short-term reward有損失。如果exploitation太多冀泻,那么模型比較容易陷入局部最優(yōu)常侣,但是exploration太多蜡饵,模型收斂速度太慢弹渔。這就是exploitation-exploration困境。

推薦系統(tǒng)的一個(gè)問題是溯祸,每個(gè)用戶只能與整個(gè)數(shù)據(jù)集中的一些項(xiàng)目進(jìn)行交互肢专。用戶可能會(huì)看不見用戶可能感興趣的大量物品。對(duì)于冷啟動(dòng)用戶(剛加入系統(tǒng)并且交互次數(shù)為零或很少)焦辅,問題特別嚴(yán)重博杖。由于具有交互性,CRS可以積極探索看不見的項(xiàng)目筷登,以更好地捕獲用戶的偏好剃根。這樣,用戶可以受益于有機(jī)會(huì)表達(dá)自己的意圖并獲得個(gè)性化的推薦前方。
但是狈醉,探索的過程是有代價(jià)的。由于用戶只有有限的時(shí)間和精力與系統(tǒng)進(jìn)行交互惠险,因此失敗的探索將浪費(fèi)時(shí)間苗傅,并且失去進(jìn)行準(zhǔn)確推薦的機(jī)會(huì)。因此班巩,尋求E&E權(quán)衡是CRS中的關(guān)鍵問題渣慕。

  1. Evaluation and User Simulation

與針對(duì)離線數(shù)據(jù)進(jìn)行優(yōu)化的靜態(tài)推薦器模型不同,CRS強(qiáng)調(diào)動(dòng)態(tài)交互過程中的用戶體驗(yàn)抱慌。因此逊桦,我們不僅應(yīng)考慮對(duì)推薦和響應(yīng)生成進(jìn)行輪次級(jí)別的評(píng)估,還應(yīng)注意對(duì)話級(jí)別評(píng)估抑进。
評(píng)估CRS還需要大量的在線用戶交互强经,而這種交互獲得昂貴的資源。 因此单匣,必須使用模擬用戶夕凝。 開發(fā)可靠的用戶模擬器具有挑戰(zhàn)性宝穗,并且仍然是一個(gè)懸而未決的問題

小結(jié)

本篇記錄了CRS的關(guān)鍵定義和主要任務(wù)码秉,下一篇將介紹CRS的任務(wù)細(xì)節(jié)逮矛。

END

本人簡(jiǎn)書所有文章均為原創(chuàng),歡迎轉(zhuǎn)載转砖,請(qǐng)注明文章出處 须鼎。百度和各類采集站皆不可信,搜索請(qǐng)謹(jǐn)慎鑒別府蔗。技術(shù)類文章一般都有時(shí)效性晋控,本人習(xí)慣不定期對(duì)自己的博文進(jìn)行修正和更新,因此請(qǐng)?jiān)L問本人簡(jiǎn)書主頁(yè)查看最新信息http://www.reibang.com/u/40d14973d97c

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末姓赤,一起剝皮案震驚了整個(gè)濱河市赡译,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌蝌焚,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件誓斥,死亡現(xiàn)場(chǎng)離奇詭異只洒,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)劳坑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門毕谴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人距芬,你說我怎么就攤上這事涝开。” “怎么了蔑穴?”我有些...
    開封第一講書人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵忠寻,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我存和,道長(zhǎng)奕剃,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任捐腿,我火速辦了婚禮纵朋,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘茄袖。我一直安慰自己操软,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開白布宪祥。 她就那樣靜靜地躺著聂薪,像睡著了一般家乘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上藏澳,一...
    開封第一講書人閱讀 49,036評(píng)論 1 285
  • 那天仁锯,我揣著相機(jī)與錄音,去河邊找鬼翔悠。 笑死业崖,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的蓄愁。 我是一名探鬼主播双炕,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼撮抓!你這毒婦竟也來了妇斤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤胀滚,失蹤者是張志新(化名)和其女友劉穎趟济,沒想到半個(gè)月后乱投,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咽笼,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年戚炫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了剑刑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡双肤,死狀恐怖施掏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情茅糜,我是刑警寧澤七芭,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站蔑赘,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏耙箍。R本人自食惡果不足惜酥馍,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一旨袒、第九天 我趴在偏房一處隱蔽的房頂上張望术辐。 院中可真熱鬧术吗,春花似錦、人聲如沸较屿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至曼振,卻和暖如春蔚龙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背木羹。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工坑填, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人妖枚。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓苍在,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親抒寂。 傳聞我的和親對(duì)象是個(gè)殘疾皇子屈芜,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容