-
www2021
摘要
基于會話的推薦旨在根據(jù)會話中歷史物品的序列預測下一個物品衅鹿,例如電子商務或多媒體流服務撒踪。 具體來說,會話數(shù)據(jù)表現(xiàn)出一些獨特的特征大渤,即會話內(nèi)物品的會話一致性(session consistency)和順序依賴性(sequential dependency)制妄、重復的物品消費(repeated item consumption)和會話時效性(session timeliness)。
本文提出了簡單而有效的線性模型來考慮會話的整體方面泵三。 模型的綜合性有助于提高基于會話的推薦的質(zhì)量耕捞。 更重要的是,它提供了一個通用框架來反映會話數(shù)據(jù)的不同觀點烫幕。 本文提出的線性模型具有封閉解俺抽,因此它們具有高度的可擴展性。 實驗結(jié)果表明较曼,所提出的線性模型在幾個真實世界數(shù)據(jù)集的各種指標中顯示出具有競爭力或最先進的性能
Main Story
傳統(tǒng)的推薦系統(tǒng)通常對用戶帳戶進行個性化設置凌埂,假設為一個人所有,并且隨著時間的推移是靜態(tài)的诗芜。 然而瞳抓,這種假設往往是無效的。 首先伏恐,可能無法驗證基本用戶信息孩哑,例如人口統(tǒng)計數(shù)據(jù)。 同一個賬戶也可能被多個人共享翠桦,例如横蜒,跨家庭成員的混合瀏覽和點擊行為胳蛮。 即使是同一個用戶也可以根據(jù)上下文以不同的方式使用她的帳戶,例如與工作相關(guān)的與娛樂目的丛晌。 因此仅炊,純粹依賴用戶帳戶可能會導致次優(yōu)的個性化推薦。
基于會話的推薦完全依賴于用戶在正在進行的會話中的操作澎蛛,以克服上述問題抚垄。與傳統(tǒng)推薦系統(tǒng)相比,基于會話的推薦系統(tǒng)表現(xiàn)出一些獨特的特征谋逻。
- session consistency. 首先呆馁,在同一會話中觀察到的物品通常高度連貫且與用戶的特定意圖一致,例如毁兆,同一類別的產(chǎn)品列表或具有相似情緒的歌曲列表浙滤,稱為會話一致性。例如气堕,圖 1 中“會話 B”中的全新智能手機高度相關(guān)纺腊。
- sequential dependency:某些物品傾向于按特定順序消費,即順序依賴茎芭,例如連續(xù)劇集摹菠。在圖 1 的“會話 A”中,智能手機配件通常緊隨其后的是智能手機骗爆,但反之則不然次氨。
- repeated item consumption:用戶可能會在會話中重復消費/交互相同的物品,稱為重復物品消費摘投。例如煮寡,用戶可能會反復收聽她最喜歡的歌曲或選擇相同的智能手機進行比較,如圖 1 的“會話 C”所示
- session timeliness:最近的會話通常是用戶興趣的更強指標犀呼,即會話的及時性幸撕。在圖 1 中,“會話 B”和“會話 C”在時間上很接近外臂,并共享幾個熱門物品坐儿。
以上四個屬性不一定會出現(xiàn)在所有會話中,一個屬性可能比其他屬性占優(yōu)勢
最近基于會話的推薦算法研究將循環(huán)神經(jīng)網(wǎng)絡或注意力機制應用于模型順序依賴,圖神經(jīng)網(wǎng)絡 (GNN) 可有效表示會話一致性罪佳。然而逛漫,它們主要關(guān)注會話的某些特性,因此不能很好地推廣到各種數(shù)據(jù)集赘艳。此外酌毡,它們通常需要高計算成本來進行模型訓練和推理克握。為了克服基于 DNN 的模型的可擴展性問題,最近的研究提出了基于鄰域的模型用于基于會話的推薦枷踏,這些模型具有高度的可擴展性菩暗,它們還在幾個基準數(shù)據(jù)集上實現(xiàn)了與基于 DNN 的模型相當?shù)母偁幮阅堋H欢?strong>基于鄰域的模型僅利用相鄰會話旭蠕,僅限于捕獲會話的全局模式
在本文提出了新的會話感知線性模型停团,以彌補基于 DNN 和基于鄰域的模型的缺點。 具體來說下梢,我們設計了一個簡單而有效的模型: (i) 綜合考慮了基于會話的推薦的各個方面 (ii) 并同時實現(xiàn)了可擴展性贝室。
Method
1. Preliminaries
問題定義:
會話級推薦即給給定會話內(nèi)的歷史記錄旭斥,預測用戶下一個可能交互的物品撒强。
借鑒SLIM等傳統(tǒng)線性推薦算法的定義评疗,文中定義線性item-item模型:
盡管 SLIM在文獻中顯示出具有競爭力的準確性扬霜,但眾所周知定鸟,SLIM 的訓練速度非常慢。 盡管一些擴展方法提出降低訓練成本著瓶,但在工業(yè)規(guī)模上联予,它們在計算上仍然令人望而卻步。 最近材原,EASE及其變體從方程中刪除了 B 和 L1 范數(shù)約束的非負約束沸久,只留下對角約束:
2. Session Representations
首先討論如何利用線性模型表示session:
- Full session representation: 忽略物品序列诵竭,更適合會話中的物品之間往往具有更強的相關(guān)性话告,對消費順序相對不敏感的情況。 會話中的重復物品被視為單個物品卵慰,因為完整會話表示主要處理跨物品的會話一致性沙郭。
-
Partial session representation: 會話分為過去和未來兩個子集,以表示物品之間的順序相關(guān)性裳朋。
3. Session-aware Linear Models
首先針對不同的session表征形式病线,設計兩種不同的線性模型; 然后將兩個模型進行統(tǒng)一鲤嫡。
-
Session-aware Linear Item Similarity Model (SLIS)
我們提出了一個使用完整會話表示的線性模型送挑,重點是項目之間的相似性。 如第 3.2 節(jié)所述暖眼,輸入和輸出矩陣 (X) 與現(xiàn)有線性模型 [29, 39] 中處理的相同惕耕,即 X = X·B。但是诫肠,現(xiàn)有模型無法處理 會話一致性以外的會話司澎,使它們不是最佳的。
我們通過重新制定 SLIM的目標函數(shù)來提出一個新的線性模型栋豫,以適應會話的及時性和會話中重復的項目消耗挤安。 首先,我們采用權(quán)重矩陣,假設會話的時效性隨時間衰減丧鸯,W 用于區(qū)分會話的時效性蛤铜。 其次,我們放寬了 B 的零對角線約束來處理重復的物品消費丛肢。 由于 B 的對角線元素受到松散懲罰围肥,我們的模型允許我們預測相同的物品作為下一個物品。 形式上摔踱,SLIS 的目標函數(shù)由下式表示
為了解決該問題,討論W的兩種特殊情況: session權(quán)重和物品權(quán)重篮愉,物品權(quán)重不會影響B(tài)參數(shù)的學習腐芍,只需要考慮session的權(quán)重影響,它將作為session對應的權(quán)重向量來區(qū)分session間的重要性试躏。將W通過權(quán)重向量的外積來表示:
-
Session-aware Linear Item Transition Model (SLIT)
使用Partial session representation助析,設計了一個線性模型來捕獲跨項目的順序依賴性。 與 SLIS 不同的是椅您,每個會話被分成多個部分會話外冀,形成不同的輸入和輸出矩陣。 與 SLIS 類似掀泳,我們也將會話的權(quán)重合并到 SLIT雪隧。 同時,我們忽略了 B 中對角元素的約束员舵,因為不同的輸入和輸出矩陣自然不受平凡解的影響脑沿。
表示歷史數(shù)據(jù)和對應的標簽數(shù)據(jù)。假設這個地方的會話具有原始會話的時間戳马僻,
下面具體討論一下庄拇,如何設置權(quán)重,本文還是參照已有工作使用兩個物品間的位置差來表示物品的物品間的權(quán)重:
這塊的權(quán)重設計邏輯尚未理解丛忆,具體使用時如何使用祠汇? 后續(xù)會看早期的工作做進一步理解仍秤,然后再來更新本博客
-
Unifying Two Linear Models.
-
Model Inference
最終在給定歷史會話,預測下一個交互時使用
但不確定這個權(quán)重在推理時如何使用,直接與S交互向量相乘么我抠?
實驗
小結(jié)
- 本文基于線性模型的思想苇本,針對會話推薦設計了線性會話推薦模型,由于具有封閉解的特性菜拓,具有極高的計算效率
END
本人簡書所有文章均為原創(chuàng)瓣窄,歡迎轉(zhuǎn)載,請注明文章出處 纳鼎。百度和各類采集站皆不可信俺夕,搜索請謹慎鑒別。技術(shù)類文章一般都有時效性贱鄙,本人習慣不定期對自己的博文進行修正和更新劝贸,因此請訪問本人簡書主頁查看最新信息http://www.reibang.com/u/40d14973d97c