序列推薦(3): Session-aware Linear Item-Item Models for Session-based Recommendation

  • www2021

摘要

基于會話的推薦旨在根據(jù)會話中歷史物品的序列預測下一個物品衅鹿,例如電子商務或多媒體流服務撒踪。 具體來說,會話數(shù)據(jù)表現(xiàn)出一些獨特的特征大渤,即會話內(nèi)物品的會話一致性(session consistency)和順序依賴性(sequential dependency)制妄、重復的物品消費(repeated item consumption)和會話時效性(session timeliness)

本文提出了簡單而有效的線性模型來考慮會話的整體方面泵三。 模型的綜合性有助于提高基于會話的推薦的質(zhì)量耕捞。 更重要的是,它提供了一個通用框架來反映會話數(shù)據(jù)的不同觀點烫幕。 本文提出的線性模型具有封閉解俺抽,因此它們具有高度的可擴展性。 實驗結(jié)果表明较曼,所提出的線性模型在幾個真實世界數(shù)據(jù)集的各種指標中顯示出具有競爭力或最先進的性能

Main Story

傳統(tǒng)的推薦系統(tǒng)通常對用戶帳戶進行個性化設置凌埂,假設為一個人所有,并且隨著時間的推移是靜態(tài)的诗芜。 然而瞳抓,這種假設往往是無效的。 首先伏恐,可能無法驗證基本用戶信息孩哑,例如人口統(tǒng)計數(shù)據(jù)。 同一個賬戶也可能被多個人共享翠桦,例如横蜒,跨家庭成員的混合瀏覽和點擊行為胳蛮。 即使是同一個用戶也可以根據(jù)上下文以不同的方式使用她的帳戶,例如與工作相關(guān)的與娛樂目的丛晌。 因此仅炊,純粹依賴用戶帳戶可能會導致次優(yōu)的個性化推薦。

基于會話的推薦完全依賴于用戶在正在進行的會話中的操作澎蛛,以克服上述問題抚垄。與傳統(tǒng)推薦系統(tǒng)相比,基于會話的推薦系統(tǒng)表現(xiàn)出一些獨特的特征谋逻。

  • session consistency. 首先呆馁,在同一會話中觀察到的物品通常高度連貫且與用戶的特定意圖一致,例如毁兆,同一類別的產(chǎn)品列表或具有相似情緒的歌曲列表浙滤,稱為會話一致性。例如气堕,圖 1 中“會話 B”中的全新智能手機高度相關(guān)纺腊。
  • sequential dependency:某些物品傾向于按特定順序消費,即順序依賴茎芭,例如連續(xù)劇集摹菠。在圖 1 的“會話 A”中,智能手機配件通常緊隨其后的是智能手機骗爆,但反之則不然次氨。
  • repeated item consumption:用戶可能會在會話中重復消費/交互相同的物品,稱為重復物品消費摘投。例如煮寡,用戶可能會反復收聽她最喜歡的歌曲或選擇相同的智能手機進行比較,如圖 1 的“會話 C”所示
  • session timeliness:最近的會話通常是用戶興趣的更強指標犀呼,即會話的及時性幸撕。在圖 1 中,“會話 B”和“會話 C”在時間上很接近外臂,并共享幾個熱門物品坐儿。

以上四個屬性不一定會出現(xiàn)在所有會話中,一個屬性可能比其他屬性占優(yōu)勢

對于以上四點宋光,個人對第一點存在疑問貌矿,有研究專門針對會話/序列內(nèi)的多興趣進行建模

最近基于會話的推薦算法研究將循環(huán)神經(jīng)網(wǎng)絡或注意力機制應用于模型順序依賴,圖神經(jīng)網(wǎng)絡 (GNN) 可有效表示會話一致性罪佳。然而逛漫,它們主要關(guān)注會話的某些特性,因此不能很好地推廣到各種數(shù)據(jù)集赘艳。此外酌毡,它們通常需要高計算成本來進行模型訓練和推理克握。為了克服基于 DNN 的模型的可擴展性問題,最近的研究提出了基于鄰域的模型用于基于會話的推薦枷踏,這些模型具有高度的可擴展性菩暗,它們還在幾個基準數(shù)據(jù)集上實現(xiàn)了與基于 DNN 的模型相當?shù)母偁幮阅堋H欢?strong>基于鄰域的模型僅利用相鄰會話旭蠕,僅限于捕獲會話的全局模式

在本文提出了新的會話感知線性模型停团,以彌補基于 DNN 和基于鄰域的模型的缺點。 具體來說下梢,我們設計了一個簡單而有效的模型: (i) 綜合考慮了基于會話的推薦的各個方面 (ii) 并同時實現(xiàn)了可擴展性贝室。

Method

1. Preliminaries

簡單的講锨推,就是講session數(shù)據(jù)組織成為矩陣形式奸柬,最終得到session-item矩陣X\in\mathbb{R}^{m\times n}表示訓練數(shù)據(jù)续搀,而X\in\mathbb{R}^{m\times n} 對應標簽數(shù)據(jù)

問題定義:
會話級推薦即給給定會話內(nèi)的歷史記錄旭斥,預測用戶下一個可能交互的物品撒强。

借鑒SLIM等傳統(tǒng)線性推薦算法的定義评疗,文中定義線性item-item模型:

\mathbf{B}\in\mathbb{R}^{n\times n}優(yōu)化方法如下:
在傳統(tǒng)的推薦中冻晤,每個用戶被表示為所有消費物品的集合漱办,沒有會話的概念这刷,X 和 Y 被視為相同的矩陣。 在這種情況下娩井,用\lambda=0暇屋,它以方程中 B = I 的平凡解結(jié)束。 這對預測是無用的,為了避免這種情況洞辣,現(xiàn)有的研究向目標函數(shù)添加了一些約束,SLIM強制 B 中的所有條目都是非負的咐刨,對角線元素為零

盡管 SLIM在文獻中顯示出具有競爭力的準確性扬霜,但眾所周知定鸟,SLIM 的訓練速度非常慢。 盡管一些擴展方法提出降低訓練成本著瓶,但在工業(yè)規(guī)模上联予,它們在計算上仍然令人望而卻步。 最近材原,EASE及其變體從方程中刪除了 B 和 L1 范數(shù)約束的非負約束沸久,只留下對角約束:

最終參數(shù)可以通過以下公式給出:
盡管反轉(zhuǎn)正則化的 Gram 矩陣是大規(guī)模數(shù)據(jù)集的瓶頸,但封閉形式的表達式在效率上具有顯著優(yōu)勢余蟹。 EASE [39] 的復雜度與物品的數(shù)量成正比麦向。 它還實現(xiàn)了與傳統(tǒng)推薦設置中最先進模型相比具有競爭力的預測準確性。 受這些優(yōu)勢的啟發(fā)客叉,我們利用線性模型的優(yōu)勢進行基于會話的推薦

2. Session Representations

首先討論如何利用線性模型表示session:

  • Full session representation: 忽略物品序列诵竭,更適合會話中的物品之間往往具有更強的相關(guān)性话告,對消費順序相對不敏感的情況。 會話中的重復物品被視為單個物品卵慰,因為完整會話表示主要處理跨物品的會話一致性沙郭。
  • Partial session representation: 會話分為過去和未來兩個子集,以表示物品之間的順序相關(guān)性裳朋。


3. Session-aware Linear Models

首先針對不同的session表征形式病线,設計兩種不同的線性模型; 然后將兩個模型進行統(tǒng)一鲤嫡。

  • Session-aware Linear Item Similarity Model (SLIS)
    我們提出了一個使用完整會話表示的線性模型送挑,重點是項目之間的相似性。 如第 3.2 節(jié)所述暖眼,輸入和輸出矩陣 (X) 與現(xiàn)有線性模型 [29, 39] 中處理的相同惕耕,即 X = X·B。但是诫肠,現(xiàn)有模型無法處理 會話一致性以外的會話司澎,使它們不是最佳的。

我們通過重新制定 SLIM的目標函數(shù)來提出一個新的線性模型栋豫,以適應會話的及時性和會話中重復的項目消耗挤安。 首先,我們采用權(quán)重矩陣W\in\mathbb{R}^{m\times n},假設會話的時效性隨時間衰減丧鸯,W 用于區(qū)分會話的時效性蛤铜。 其次,我們放寬了 B 的零對角線約束來處理重復的物品消費丛肢。 由于 B 的對角線元素受到松散懲罰围肥,我們的模型允許我們預測相同的物品作為下一個物品。 形式上摔踱,SLIS 的目標函數(shù)由下式表示

我們?nèi)匀豢梢酝ㄟ^ Karush-Kuhn-Tucker (KKT) 條件為沒有 W 的松弛對角線約束實現(xiàn)封閉形式的解決方案虐先。 然而,對于任意權(quán)重矩陣 W派敷,獲得封閉形式的解決方案并非易事蛹批。

為了解決該問題,討論W的兩種特殊情況: session權(quán)重和物品權(quán)重篮愉,物品權(quán)重不會影響B(tài)參數(shù)的學習腐芍,只需要考慮session的權(quán)重影響,它將作為session對應的權(quán)重向量來區(qū)分session間的重要性试躏。將W通過權(quán)重向量的外積來表示:W_{full}=w_{full}\cdot 1^T,w_{full}\in\mathbb{R}^m,\mathbf{1}\in \mathbb{R}^n

那么猪勇,下面需要討論一下如何設置會話的權(quán)重:我們假設會話的重要性會隨著時間的推移而衰減。 為了反映會話的及時性颠蕴,我們?yōu)樽罱臅挿峙涓叩臋?quán)重
最終使用\sqrt{w_{time}(j)}來定義泣刹。

  • Session-aware Linear Item Transition Model (SLIT)
    使用Partial session representation助析,設計了一個線性模型來捕獲跨項目的順序依賴性。 與 SLIS 不同的是椅您,每個會話被分成多個部分會話外冀,形成不同的輸入和輸出矩陣。 與 SLIS 類似掀泳,我們也將會話的權(quán)重合并到 SLIT雪隧。 同時,我們忽略了 B 中對角元素的約束员舵,因為不同的輸入和輸出矩陣自然不受平凡解的影響脑沿。
    其中\mathbf{S},\mathbf{T}\in\mathbb{R}^{m' \times n}表示歷史數(shù)據(jù)和對應的標簽數(shù)據(jù)。假設這個地方的會話具有原始會話的時間戳马僻,W_{par}=w_{par} \cdot 1^T

下面具體討論一下庄拇,如何設置權(quán)重,本文還是參照已有工作使用兩個物品間的位置差來表示物品的物品間的權(quán)重:

p(i,s)是物品i在會話s中的位置信息巫玻。

這塊的權(quán)重設計邏輯尚未理解丛忆,具體使用時如何使用祠汇? 后續(xù)會看早期的工作做進一步理解仍秤,然后再來更新本博客

  • Unifying Two Linear Models.
  • Model Inference
    最終在給定歷史會話,預測下一個交互時使用\hat{T}=S\cdot \hat{B}: 并有必要根據(jù)會話中的物品序列來考慮物品的重要性可很。我們隨著時間的推移衰減用于推理的物品權(quán)重為
    诗力,即時間越近權(quán)重越大

但不確定這個權(quán)重在推理時如何使用,直接與S交互向量相乘么我抠?

實驗

小結(jié)

  • 本文基于線性模型的思想苇本,針對會話推薦設計了線性會話推薦模型,由于具有封閉解的特性菜拓,具有極高的計算效率

END

本人簡書所有文章均為原創(chuàng)瓣窄,歡迎轉(zhuǎn)載,請注明文章出處 纳鼎。百度和各類采集站皆不可信俺夕,搜索請謹慎鑒別。技術(shù)類文章一般都有時效性贱鄙,本人習慣不定期對自己的博文進行修正和更新劝贸,因此請訪問本人簡書主頁查看最新信息http://www.reibang.com/u/40d14973d97c

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市逗宁,隨后出現(xiàn)的幾起案子映九,更是在濱河造成了極大的恐慌,老刑警劉巖瞎颗,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件件甥,死亡現(xiàn)場離奇詭異捌议,居然都是意外死亡,警方通過查閱死者的電腦和手機引有,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進店門禁灼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人轿曙,你說我怎么就攤上這事弄捕。” “怎么了导帝?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵守谓,是天一觀的道長。 經(jīng)常有香客問我您单,道長斋荞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任虐秦,我火速辦了婚禮平酿,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘悦陋。我一直安慰自己蜈彼,他們只是感情好,可當我...
    茶點故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布俺驶。 她就那樣靜靜地躺著幸逆,像睡著了一般。 火紅的嫁衣襯著肌膚如雪暮现。 梳的紋絲不亂的頭發(fā)上还绘,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天,我揣著相機與錄音栖袋,去河邊找鬼拍顷。 笑死,一個胖子當著我的面吹牛塘幅,可吹牛的內(nèi)容都是我干的昔案。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼晌块,長吁一口氣:“原來是場噩夢啊……” “哼爱沟!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起匆背,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤呼伸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體括享,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡搂根,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了铃辖。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剩愧。...
    茶點故事閱讀 40,090評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖娇斩,靈堂內(nèi)的尸體忽然破棺而出仁卷,到底是詐尸還是另有隱情,我是刑警寧澤犬第,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布锦积,位于F島的核電站,受9級特大地震影響歉嗓,放射性物質(zhì)發(fā)生泄漏丰介。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一鉴分、第九天 我趴在偏房一處隱蔽的房頂上張望哮幢。 院中可真熱鬧,春花似錦志珍、人聲如沸橙垢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钢悲。三九已至点额,卻和暖如春舔株,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背还棱。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工载慈, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人珍手。 一個月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓办铡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親琳要。 傳聞我的和親對象是個殘疾皇子寡具,可洞房花燭夜當晚...
    茶點故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內(nèi)容