對(duì)話式推薦綜述閱讀(Conversational Recommender System)：(1)

前言

本文簡(jiǎn)要記錄閱讀何向南老師關(guān)于CRS的綜述文章：Advances and Challenges in Conversational Recommender Systems: A Survey
SIGIR2020-CRS-turorial

背景

推薦系統(tǒng)利用交互歷史來建模用戶的興趣骇塘，已被廣泛應(yīng)用。但由于靜態(tài)模型建模用戶偏好沒有明確的指令和用戶的正向反饋，因此靜態(tài)推薦模型(static)很難很好地回答兩個(gè)重要問題：
（a）用戶到底喜歡什么题涨？

靜態(tài)模型的學(xué)習(xí)過程通常是在歷史數(shù)據(jù)上進(jìn)行的蜗元，可能是稀疏且嘈雜的恨旱。

靜態(tài)模型的基本假設(shè)是所有歷史交互都代表用戶偏好。首先尚揣，用戶可能不喜歡他們選擇的項(xiàng)目抑堡，因?yàn)樗麄兛赡茏龀鲥e(cuò)誤的決定摆出。其次，用戶的偏好可能會(huì)隨著時(shí)間而變化首妖，這意味著用戶對(duì)商品的態(tài)度可能會(huì)發(fā)生變化懊蒸，并且從過去的數(shù)據(jù)中捕獲漂移的偏好會(huì)變得更加困難。

對(duì)于冷用戶悯搔，很難根據(jù)數(shù)據(jù)對(duì)他們的偏好進(jìn)行建模骑丸。簡(jiǎn)而言之，靜態(tài)模型幾乎無法捕獲用戶的精確偏好妒貌。
（b）用戶為什么喜歡某個(gè)物品通危？

許多因素會(huì)影響用戶在現(xiàn)實(shí)生活中的決定。例如灌曙，用戶可能由于好奇心或其他人的影響而購(gòu)買產(chǎn)品, 也可能是自由考慮的結(jié)果菊碟。

不同的用戶購(gòu)買相同的產(chǎn)品锭部，但出于不同的動(dòng)機(jī)飞盆。因此，同等對(duì)待不同用戶或同等對(duì)待同一個(gè)用戶的不同交互不適用于推薦模型惠猿。實(shí)際上蚣驼，靜態(tài)模型很難解釋用戶消費(fèi)行為背后的各種原因魄幕。

作者認(rèn)為關(guān)鍵的困難來自于內(nèi)在的機(jī)制：交互建模的靜態(tài)模式從根本上限制了表達(dá)用戶意圖的方式，從而導(dǎo)致用戶與系統(tǒng)之間的信息不對(duì)稱 （asymmetric information）颖杏。

對(duì)話式推薦系統(tǒng)（CRS）的近期興起從根本上改變了這種情況纯陨。在CRS中，用戶和系統(tǒng)可以通過自然語(yǔ)言交互實(shí)現(xiàn)動(dòng)態(tài)交互留储，這提供了前所未有的機(jī)會(huì)來獲得用戶的準(zhǔn)確偏好翼抠。

CRS定義

A recommendation system that can elicit the dynamic preferences of users and take actions based on their current needs through real-time multi-turn interactions using natural language.
可以利用自然語(yǔ)言進(jìn)行實(shí)時(shí)多輪交互，從而激發(fā)用戶的動(dòng)態(tài)偏好并根據(jù)其當(dāng)前需求采取行動(dòng)获讳。
CRS示例如下：

一種替代解決方案是利用商品的屬性信息阴颖，這對(duì)于理解用戶的意圖是不言而喻的，并且可以迅速縮小候選商品的范圍丐膝。基于批判的推薦系統(tǒng)(critiquing-based)是一種解決方案量愧，旨在引起用戶對(duì)某些屬性（而非物品）的反饋钾菊，是CRS的早期的一種形式。

批評(píng)就像推銷員一樣侠畔，通過主動(dòng)詢問商品屬性來收集用戶偏好结缚。例如损晤，當(dāng)尋找手機(jī)時(shí)软棺，用戶可以遵循系統(tǒng)的提示并提供諸如“更便宜”或“更長(zhǎng)的電池壽命”之類的反饋。根據(jù)這些反饋尤勋，系統(tǒng)將建議更合適的項(xiàng)目喘落；該過程重復(fù)幾次，直到用戶找到滿意的物品或放棄為止最冰。該機(jī)制使系統(tǒng)具有更好的推斷用戶偏好的能力瘦棋，并有助于快速縮小(narrow down)推薦候選者的范圍。

現(xiàn)有的交互式和批注方法盡管有效暖哨，但受其表示能力的限制赌朋，用戶只能通過一些預(yù)定義的選項(xiàng)與系統(tǒng)進(jìn)行交互。對(duì)話模塊在CRS中的集成可以進(jìn)行更靈活的交互篇裁，例如以標(biāo)簽沛慢，模板話語(yǔ)等自然語(yǔ)言的形式。毫無疑問达布，通過對(duì)話形式可以更自然地表達(dá)和理解用戶的意圖团甲。

相關(guān)研究工作情況：近年來比較多，目前共有148篇相關(guān)論文

盡管已經(jīng)對(duì)CRS進(jìn)行了許多研究黍聂，但是還沒有統(tǒng)一的任務(wù)表述躺苦。之前2020年的一篇綜述中(A Survey on Conversational Recommender Systems.)根據(jù)使用知識(shí)來源或交互方式進(jìn)行分類，例如基于格式(forms)或自然語(yǔ)言的方法产还，或由系統(tǒng)或用戶驅(qū)動(dòng)的方法匹厘。
現(xiàn)在的一些研究關(guān)注CRS的對(duì)話能力，嘗試基于端對(duì)端對(duì)話系統(tǒng)或深度語(yǔ)言模型來構(gòu)建模型脐区。但是集乔，這些模型旨在學(xué)習(xí)人類會(huì)話語(yǔ)料庫(kù)中的模式，并且通常是不透明的且難以解釋坡椒。端到端方法在推薦和響應(yīng)方面的人工評(píng)估效果不佳扰路。因此，一個(gè)明確的對(duì)話策略是必要的倔叼，并且需要大量的研究工作汗唱。

CRS框架

本文提出了一個(gè)統(tǒng)一的框架來定義CRS任務(wù)，由三個(gè)獨(dú)立的部件構(gòu)成丈攒。具體地說哩罪，由用戶界面授霸，對(duì)話策略模塊和推薦引擎組成。

user Interface 用戶界面充當(dāng)用戶與機(jī)器之間的翻譯器际插；通常碘耳，它從用戶的原始話語(yǔ)中提取信息，并將信息轉(zhuǎn)換為機(jī)器可理解的表示框弛，并根據(jù)會(huì)話策略為用戶生成有意義的響應(yīng)辛辨。
Conversation Strategy 對(duì)話策略模塊是核心，負(fù)責(zé)協(xié)調(diào)其他兩個(gè)組件瑟枫，決定了CRS的核心邏輯斗搞，例如引起用戶興趣，保持多輪對(duì)話和引導(dǎo)新主題慷妙。
Recommendation Engine 推薦引擎負(fù)責(zé)對(duì)實(shí)體之間的關(guān)系進(jìn)行建模（例如僻焚，用戶-物品交互或物品-物品鏈接），學(xué)習(xí)和記錄用戶對(duì)物品和物品屬性的偏好膝擂，并檢索所需的信息虑啤。

具體的研究問題包括4個(gè)方面：

Question-based User Preference Elicitation. 問題導(dǎo)向的用戶偏好啟發(fā)

CRS提供了通過詢問屬性問題的方面來顯式地引出用戶偏好。具體存在有兩個(gè)重要的問題：
（1）要問什么架馋？
（2）如何根據(jù)用戶反應(yīng)調(diào)整建議狞山？
前者著重于構(gòu)建問題以引出盡可能多的信息。
后者利用用戶反饋的信息來提出更適當(dāng)?shù)耐扑]绩蜻。

Multi-turn Conversational Recommendation Strategies 多輪對(duì)話策略

CRS需要與用戶反復(fù)互動(dòng)铣墨，并多次動(dòng)態(tài)地適應(yīng)用戶的響應(yīng)。 一個(gè)有效的策略涉及何時(shí)提出問題以及何時(shí)推薦办绝，
即讓模型在（1）繼續(xù)提出問題以進(jìn)一步減少偏好不確定性和（2）根據(jù)當(dāng)前對(duì)用戶偏好的建模生成推薦之間進(jìn)行選擇伊约。
通常應(yīng)以最少的對(duì)話次數(shù)為目標(biāo)，以成功推薦為目標(biāo)孕蝉，因?yàn)橛脩粼谵D(zhuǎn)數(shù)過多后將失去耐心屡律。

Natural Language Understanding and Generation 自然語(yǔ)言理解與生成

像人類一樣進(jìn)行交流仍然是CRS中最艱巨的挑戰(zhàn)之一。為了理解用戶的興趣和意圖降淮，一些CRS方法將模型輸入定義為捕獲語(yǔ)義信息和用戶偏好的預(yù)定義標(biāo)簽超埋。一些方法通過slot填充技術(shù)從用戶的原始話語(yǔ)中提取語(yǔ)義信息。為了產(chǎn)生人類可理解的響應(yīng)佳鳖，CRS使用許多策略霍殴，例如直接提供推薦列表，將推薦物品納入基于規(guī)則的自然語(yǔ)言模板系吩。此外来庭，一些研究人員提出了端到端框架，以使CRS能夠從原始自然語(yǔ)言中準(zhǔn)確理解用戶的情感和意圖穿挨，并生成可讀月弛，流暢肴盏，一致且有意義的自然語(yǔ)言響應(yīng)。（readable, fluent, consistent, and meaningful ）

Trade-offs between Exploration and Exploitation (E&E) 探索和利用問題

Exploitation：根據(jù)當(dāng)前信息帽衙，由訓(xùn)練的模型做出最佳的決策菜皂。
Exploration：探索未知的領(lǐng)域，比如在某個(gè)state執(zhí)行之前在這個(gè)state沒有執(zhí)行的action厉萝。
所以做exploitation和exploration的目的就是獲得一種長(zhǎng)期收益最高的策略恍飘，這個(gè)過程可能對(duì)short-term reward有損失。如果exploitation太多冀泻，那么模型比較容易陷入局部最優(yōu)常侣，但是exploration太多蜡饵，模型收斂速度太慢弹渔。這就是exploitation-exploration困境。

推薦系統(tǒng)的一個(gè)問題是溯祸，每個(gè)用戶只能與整個(gè)數(shù)據(jù)集中的一些項(xiàng)目進(jìn)行交互肢专。用戶可能會(huì)看不見用戶可能感興趣的大量物品。對(duì)于冷啟動(dòng)用戶（剛加入系統(tǒng)并且交互次數(shù)為零或很少）焦辅，問題特別嚴(yán)重博杖。由于具有交互性，CRS可以積極探索看不見的項(xiàng)目筷登，以更好地捕獲用戶的偏好剃根。這樣，用戶可以受益于有機(jī)會(huì)表達(dá)自己的意圖并獲得個(gè)性化的推薦前方。
但是狈醉，探索的過程是有代價(jià)的。由于用戶只有有限的時(shí)間和精力與系統(tǒng)進(jìn)行交互惠险，因此失敗的探索將浪費(fèi)時(shí)間苗傅，并且失去進(jìn)行準(zhǔn)確推薦的機(jī)會(huì)。因此班巩，尋求E＆E權(quán)衡是CRS中的關(guān)鍵問題渣慕。

Evaluation and User Simulation

與針對(duì)離線數(shù)據(jù)進(jìn)行優(yōu)化的靜態(tài)推薦器模型不同，CRS強(qiáng)調(diào)動(dòng)態(tài)交互過程中的用戶體驗(yàn)抱慌。因此逊桦，我們不僅應(yīng)考慮對(duì)推薦和響應(yīng)生成進(jìn)行輪次級(jí)別的評(píng)估，還應(yīng)注意對(duì)話級(jí)別評(píng)估抑进。
評(píng)估CRS還需要大量的在線用戶交互强经，而這種交互獲得昂貴的資源。因此单匣，必須使用模擬用戶夕凝。 開發(fā)可靠的用戶模擬器具有挑戰(zhàn)性宝穗，并且仍然是一個(gè)懸而未決的問題。

小結(jié)

本篇記錄了CRS的關(guān)鍵定義和主要任務(wù)码秉，下一篇將介紹CRS的任務(wù)細(xì)節(jié)逮矛。

END

本人簡(jiǎn)書所有文章均為原創(chuàng)，歡迎轉(zhuǎn)載转砖，請(qǐng)注明文章出處须鼎。百度和各類采集站皆不可信，搜索請(qǐng)謹(jǐn)慎鑒別府蔗。技術(shù)類文章一般都有時(shí)效性晋控，本人習(xí)慣不定期對(duì)自己的博文進(jìn)行修正和更新，因此請(qǐng)?jiān)L問本人簡(jiǎn)書主頁(yè)查看最新信息http://www.reibang.com/u/40d14973d97c

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末姓赤，一起剝皮案震驚了整個(gè)濱河市赡译，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌蝌焚，老刑警劉巖，帶你破解...
沈念sama閱讀 206,378評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件誓斥，死亡現(xiàn)場(chǎng)離奇詭異只洒，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)劳坑，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,356評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門毕谴，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人距芬，你說我怎么就攤上這事涝开。” “怎么了蔑穴？”我有些...
開封第一講書人閱讀 152,702評(píng)論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵忠寻，是天一觀的道長(zhǎng)。經(jīng)常有香客問我存和，道長(zhǎng)奕剃，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,259評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任捐腿，我火速辦了婚禮纵朋，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘茄袖。我一直安慰自己操软，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,263評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布宪祥。她就那樣靜靜地躺著聂薪，像睡著了一般家乘。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上藏澳，一...
開封第一講書人閱讀 49,036評(píng)論 1贊 285
城市分裂傳說
那天仁锯，我揣著相機(jī)與錄音，去河邊找鬼翔悠。笑死业崖，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的蓄愁。我是一名探鬼主播双炕，決...
沈念sama閱讀 38,349評(píng)論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼撮抓！你這毒婦竟也來了妇斤？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,979評(píng)論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤胀滚，失蹤者是張志新（化名）和其女友劉穎趟济，沒想到半個(gè)月后乱投，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咽笼，經(jīng)...
沈念sama閱讀 43,469評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,938評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年戚炫，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了剑刑。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 38,059評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡双肤，死狀恐怖施掏，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情茅糜，我是刑警寧澤七芭，帶...
沈念sama閱讀 33,703評(píng)論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站蔑赘，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏耙箍。R本人自食惡果不足惜酥馍，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,257評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一旨袒、第九天我趴在偏房一處隱蔽的房頂上張望术辐。院中可真熱鬧术吗，春花似錦、人聲如沸较屿。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,262評(píng)論 0贊 19
一樁弒父案襟企，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至曼振，卻和暖如春蔚龙，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背木羹。一陣腳步聲響...
開封第一講書人閱讀 31,485評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來泰國(guó)打工坑填，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人妖枚。一個(gè)月前我還...
沈念sama閱讀 45,501評(píng)論 2贊 354
代替公主和親
正文我出身青樓苍在，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親抒寂。傳聞我的和親對(duì)象是個(gè)殘疾皇子屈芜，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,792評(píng)論 2贊 345

對(duì)話式推薦綜述閱讀(Conversational Recommender System)：(1)

前言

背景

CRS定義

CRS框架

小結(jié)

END

推薦閱讀更多精彩內(nèi)容