一添瓷、跨域推薦
RecGURU--摘要
跨域推薦可以幫助緩解傳統(tǒng)順序推薦系統(tǒng)中的數(shù)據(jù)稀少問題涩金。在這篇論文中,我們提出了RecGURU算法框架遂赠,以生成一個通用的用戶表征(GUR)桐罕,在順序推薦中納入用戶信息脉让,即使在兩個領域中的共同用戶最少或沒有。我們提出了一個自注意力的自動編碼器來推導潛在的用戶代表功炮,以及一個領域判別器溅潜,其目的是預測生成的潛在代表的起源領域。我們提出了一種新的對抗性學習方法來訓練這兩個模塊薪伏,以便將從不同領域產(chǎn)生的用戶嵌入統(tǒng)一到每個用戶的全局GUR中滚澜。學習到的GUR捕捉到了用戶的整體偏好和特征,因此可以用來增強行為數(shù)據(jù)并改善用戶參與的任何單一領域中的推薦毅该。在兩個公共的跨領域推薦數(shù)據(jù)集以及從現(xiàn)實世界的應用中收集的大型數(shù)據(jù)集上進行了廣泛的實驗博秫。結(jié)果表明,RecGURU提升了性能眶掌,并超過了各種最先進的順序推薦和跨域推薦方法挡育。所收集的數(shù)據(jù)將被公布,以促進未來的研究朴爬。
Personalized Transfer of User Preferences for Cross-domain Recommendation--摘要
冷啟動問題仍然是推薦系統(tǒng)中一個非常具有挑戰(zhàn)性的問題即寒。幸運的是,冷啟動用戶的互動
在輔助源域的互動可以幫助目標域的冷啟動推薦。如何將用戶的偏好從
如何將用戶的偏好從源域轉(zhuǎn)移到目標域母赵,是跨域推薦(CDR)的關鍵問題逸爵,它是一個有希望解決
處理冷啟動問題的關鍵問題。大多數(shù)現(xiàn)有的方法都是以
一個共同的偏好橋來轉(zhuǎn)移所有用戶的偏好凹嘲。
直觀地說师倔,由于每個用戶的偏好不同,不同用戶的偏好橋應該是不同的周蹭。沿著這個思路趋艘。
我們提出了一個新的框架,名為跨域推薦的個性化用戶偏好(PTUPCDR)凶朗。
具體來說瓷胧,通過學習用戶特征嵌入的元網(wǎng)絡來生成個性化的橋梁函數(shù),以實現(xiàn)每個用戶的個性化偏好轉(zhuǎn)移棚愤。
為了穩(wěn)定地學習元網(wǎng)絡搓萧,我們采用了一個面向任務的優(yōu)化程序。
通過元生成的個性化橋梁函數(shù)宛畦,用戶的偏好嵌入可以被轉(zhuǎn)換到目標域中瘸洛。
到目標域中,而轉(zhuǎn)換后的用戶偏好嵌入可以作為冷啟動用戶的初始嵌入
我們使用大型的真實世界數(shù)據(jù)集次和,進行廣泛的實驗來評估PTUPCDR在冷啟動和暖啟動階段的有效性货矮。
代碼:https://github.com/easezyc/WSDM2022-PTUPCDR
二、序列推薦
Contrastive Learning for Representation Degeneration Problem in Sequential Recommendation-摘要
最近斯够,諸如Transformer和BERT等順序深度學習模型的進步大大促進了順序推薦。然而喧锦,根據(jù)我們的研究读规,這些模型生成的項目嵌入的分布趨向于退化為各向異性的形狀,這可能導致嵌入之間的高語義相似性燃少。本文首先對這一表征退化問題進行了經(jīng)驗和理論研究束亏,并在此基礎上提出了一種新型的推薦模型DuoRec,以改善項目嵌入分布阵具。具體來說碍遍,根據(jù)對比學習的均勻性特性,為DuoRec設計了一個對比正則化阳液,以重塑序列表示的分布怕敬。鑒于推薦任務是通過點積測量序列表征與同一空間的項目嵌入之間的相似性來完成的,正則化可以隱含地應用于項目嵌入分布×泵螅現(xiàn)有的對比學習方法主要依賴于通過項目裁剪东跪、遮蔽或重新排序?qū)τ脩?項目交互序列進行數(shù)據(jù)層面的增強,很難提供語義上一致的增強樣本。在DuoRec中虽填,我們提出了一種基于Dropout的模型級增強方法丁恭,以實現(xiàn)更好的語義保存。此外斋日,還開發(fā)了一種新的抽樣策略牲览,即選擇具有相同目標項的序列作為硬正樣本。在五個數(shù)據(jù)集上進行的廣泛實驗表明恶守,與基線方法相比第献,擬議的DuoRec模型性能更優(yōu)。學習到的表征的可視化結(jié)果驗證了DuoRec能夠在很大程度上緩解表征退化的問題熬的。
04.Heterogeneous Global Graph Neural Networks for Personalized Session-based Recommendation-摘要
預測一個短期互動會話的下一次互動是基于會話的推薦中的一項挑戰(zhàn)性任務痊硕。幾乎所有的現(xiàn)有的工作都依賴于項目轉(zhuǎn)換模式,而忽略了用戶歷史會話押框,同時對用戶的偏好進行建模岔绸,這往往會導致了非個性化的推薦。而現(xiàn)有的基于會話的個性化推薦器只限于當前用戶的會話橡伞,而忽略了有用的其他用戶歷史會話中有用的項目轉(zhuǎn)換模式盒揉。
為了解決這些問題,我們提出
一種新型的異質(zhì)全局圖神經(jīng)網(wǎng)絡(HG-GNNN)兑徘。
以一種微妙的方式利用所有會話中的項目轉(zhuǎn)換
從當前和歷史會話中更好地推斷出用戶的偏好刚盈。
為了有效地利用所有會話中的項目轉(zhuǎn)換我們的全局圖包含會話的項目轉(zhuǎn)換。
我們的全局圖包含了會話的項目轉(zhuǎn)換挂脑、用戶與項目之間的互動以及全局共現(xiàn)項目藕漱。此外,為了為了全面捕捉用戶的偏好崭闲,我們提出了
一個圖增強的偏好編碼器來學習會話表示肋联。具體來說,我們設計了一個新的異質(zhì)圖神經(jīng)網(wǎng)絡(HGNN)刁俭。
網(wǎng)絡(HGNN)來學習長期的用戶偏好和具有豐富語義的項目表示橄仍。
在HGNN的基礎上,我們提出了個性化的會話編碼器來結(jié)合一般的用戶偏好和當前會話的時間興趣來生成個性化的會話編碼器牍戚。
我們提出了個性化會話編碼器侮繁,將用戶的一般偏好和當前會話的時間興趣結(jié)合起來,生成用于推薦的個性化會話表示如孝。在三個真實世界的數(shù)據(jù)集上的大量實驗結(jié)果表明宪哩,我們的模型優(yōu)于其他先進的方法。
代碼:https://github.com/0215Arthur/HG-GNN
三暑竟、去偏推薦
用戶與推薦系統(tǒng)(RSs)的互動受到以下影響斋射,例如育勺,用戶更有可能對受歡迎的項目進行評價 (流行偏向)或他們預期會喜歡的項目(積極性偏向)。有一些方法可以減輕選擇偏差的影響罗岖。然而這些方法將選擇偏差視為靜態(tài)的涧至,盡管事實上 盡管一個項目的受歡迎程度可能會隨著時間的推移而急劇變化。
我們專注于物品的年齡及其對選擇偏差和用戶偏好的影響桑包。我們的實驗分析顯示用戶在MovieLens數(shù)據(jù)集上的評分行為被更好地捕捉到南蓬。考慮到項目年齡對偏見和偏好的影響哑了。我們在理論上表明赘方,在一個動態(tài)的場景中現(xiàn)有的去偏方法不再是無偏差的。為了解決這一局限性弱左。我們引入了DadiAsing in the dyNamiC scEnaRio (DANCER)窄陡,這是一種新的去偏方法。它擴展了反傾向性評分的去除方法拆火,以考慮到動態(tài)選擇偏差和用戶偏好跳夭。我們的實驗結(jié)果表明,DANCER改善了與那些不正確地假定選擇偏差的除錯方法相比们镜,DANCER提高了評級預測的性能币叹。在動態(tài)情況下,錯誤地假設選擇偏差是靜態(tài)的模狭。據(jù)我們所知颈抚,DANCER是第一個考慮到動態(tài)選擇偏差和用戶偏好的去偏移方法。
Fighting Mainstream Bias in Recommender Systems via Local Fine Tuning
在協(xié)同過濾中嚼鹉,推薦的質(zhì)量關鍵在于的質(zhì)量主要取決于一個模型如何輕松地找到目標用戶的類似用戶贩汉。因此,一個喜歡非主流項目的小眾用戶可能會收到很差的推薦锚赤。而一個與許多人分享興趣的主流用戶則有可能收到質(zhì)量更高的推薦更高的質(zhì)量雾鬼。
在這項工作中,我們圍繞著三個關鍵點來研究這種主流偏見宴树。首先,為了區(qū)分主流和利基用戶晶疼,我們探索了四種基于離群點檢測技術的方法酒贬,以確定表明每個用戶的主流分數(shù)。第二翠霍,我們通過經(jīng)驗表明锭吨,傳統(tǒng)的推薦模型會產(chǎn)生嚴重的主流偏見。最后寒匙,我們探索了全局和局部的方法來減輕偏差的方法零如。具體來說躏将,我們提出了兩個全局模型。分布式校準(DC)和加權損失(WL)方法考蕾;以及一種局部的方法祸憋。本地微調(diào)(LFT)方法。廣泛的實驗表明肖卧,所提出的方法對提高利基用戶的效用是有效的蚯窥。同時也表明所提出的LFT可以提高主流用戶的效用。
四塞帐、聯(lián)邦推薦
PipAttack: Poisoning Federated Recommender Systems for Manipulating Item Promotion
由于越來越多的隱私問題拦赠,去中心化在個性化服務中迅速出現(xiàn)。特別是推薦葵姥。另外荷鼠,最近的研究表明,集中式模型很容易受到毒攻擊榔幸,損害了它們的完整性允乐。在推薦系統(tǒng)方面這種中毒攻擊的一個典型目標是通過干擾訓練數(shù)據(jù)集和/或過程來促進敵方的目標項目。因此牡辽,一個常見的做法是將推薦系統(tǒng)歸入分散的聯(lián)合學習范式下喳篇。這使得所有的用戶設備能夠協(xié)作地學習一個全局性的推薦器,同時在本地保留所有的敏感數(shù)據(jù)态辛。在不暴露推薦器的全部知識的情況下和整個數(shù)據(jù)集的全部知識麸澜,這樣的聯(lián)合推薦被廣泛認為是對中毒攻擊的 "安全"。
在本文中我們提出了一種系統(tǒng)化的方法奏黑,為聯(lián)合推薦系統(tǒng)提供后門炊邦,以實現(xiàn)有針對性的項目推廣。其核心策略是利用數(shù)據(jù)驅(qū)動的推薦器中通常存在的固有的流行偏差熟史。由于受歡迎的項目更有可能出現(xiàn)在推薦列表中馁害,我們創(chuàng)新設計的攻擊模型使目標項目具有嵌入空間中流行項目的特征。然后蹂匹,通過上傳精心制作的梯度碘菜,我們可以有效地增加曝光率,并在模型更新過程中通過少量的惡意用戶更新限寞,我們可以有效地提高目標項目的曝光率忍啸。(不受歡迎的)項目在結(jié)果的聯(lián)合推薦器中的曝光率。在兩個真實世界的數(shù)據(jù)集上進行的評估顯示:
1)我們的攻擊模型以隱蔽的方式顯著提高了目標項目的曝光率履植。我們的攻擊模型以一種隱蔽的方式大大提高了目標項目的曝光率计雌,而不損害被下毒的推薦器的準確性。
2)現(xiàn)有的防御措施不夠有效玫霎,突出了對我們的本地模型中毒攻擊的新防御措施的需求凿滤。
五妈橄、基于圖結(jié)構(gòu)的推薦
Profiling the Design Space for Graph Neural Networks based Collaborative Filtering
近年來,圖神經(jīng)網(wǎng)絡(GNNs)被廣泛應用于協(xié)同過濾(CF)翁脆,這是推薦系統(tǒng)中最常用的方法之一眷蚓。然而,現(xiàn)有的大多數(shù)工作都是針對特定的場景設計單獨的模型體系結(jié)構(gòu)鹃祖,而沒有研究不同設計維度的影響溪椎。因此,在新的推薦場景中快速獲得性能最好的模型仍然是一個具有挑戰(zhàn)性的問題恬口。為了解決這一問題校读,本文首次嘗試對基于gnn的CF方法的設計空間進行了梳理,豐富了對不同設計維度的理解祖能,為模型設計提供了一種新的范式歉秫。具體而言,提出了一個統(tǒng)一的基于gnn的CF框架养铸,并在此基礎上開發(fā)了一個設計空間雁芙,并通過大量實驗進行了評估。不同設計維度對推薦性能的影響得到了有趣的發(fā)現(xiàn)钞螟。在實證研究結(jié)果的指導下兔甘,我們進一步修剪設計空間,以獲得一個緊湊的空間鳞滨,其中包含更高集中度的頂級模型洞焙。實證研究表明,該方法質(zhì)量高拯啦,泛化能力強澡匪。
Modeling Scale-free Graphs with Hyperbolic Geometry for Knowledge-aware Recommendation
為了緩解傳統(tǒng)推薦系統(tǒng)的數(shù)據(jù)稀疏和冷啟動問題,引入知識圖(KGs)
輔助信息的補充近來得到了相當多的關注褒链。通過將KG與用戶物品交互統(tǒng)一為三部圖唁情,最近的作品探索圖的拓撲結(jié)構(gòu)來學習具有豐富語義的用戶和條目的低維表示。這些真實世界的三部圖通常是無標度的甫匹,
然而甸鸟,其內(nèi)在的層次圖結(jié)構(gòu)是現(xiàn)有作品強調(diào)不足,導致推薦效果次優(yōu)兵迅。來解決這個問題
為了提供更準確的推薦哀墓,我們提出了一種基于雙曲幾何Lorentz模型的知識推薦方法,即Lorentzian Knowledge-enhanced Graph convolutional networks for recommendation (LKGR)喷兼。LKGR有利于對數(shù)據(jù)后的無標度三部圖進行更好的建模
統(tǒng)一。我們在雙曲空間中采用不同的信息傳播策略后雷,對歷史交互和知識圖譜中的異構(gòu)信息進行顯式編碼季惯,并引入知識感知的注意機制吠各,使模型能夠自動度量信息貢獻,產(chǎn)生雙曲空間中的相干信息聚合勉抓。在三個真實世界的基準上進行廣泛的實驗證明LKGR的性能優(yōu)于最先進的方法Top-K推薦占Recall@20的3.6-15.3%贾漏。
六、公平性推薦
Enumerating Fair Packages for Group Recommendations
package的推薦系統(tǒng)向一組人推薦一組統(tǒng)一的項目藕筋。與傳統(tǒng)設置不同纵散,群組推薦的效用不容易衡量,因為群組推薦涉及多個用戶隐圾。特別是伍掀,公平在群體推薦中至關重要。即使組中的某些成員對某項推薦相當滿意暇藏,但如果為了增加總效用而忽略其他成員蜜笤,這也是不可取的。文獻中提出了許多評價和應用群體推薦公平性的方法盐碱。但是把兔,所有這些方法都將分數(shù)最大化,只輸出一個package瓮顽。這與傳統(tǒng)的推薦系統(tǒng)相反县好,傳統(tǒng)的推薦系統(tǒng)輸出幾個(例如,top-[Math Processing Error])候選者暖混。這可能會產(chǎn)生問題缕贡,因為一些未被發(fā)現(xiàn)的原因可能會使一個群體對推薦的方案不滿意,即使評分很高儒恋。為了解決這個問題善绎,我們提出了一種有效枚舉公平package的方法。我們的方法還支持過濾查詢诫尽,例如top-[Math Processing Error]和交集禀酱,以便在列表很長時選擇喜歡的package。我們確認我們的算法可以擴展到大型數(shù)據(jù)集牧嫉,并且可以平衡package的幾個方面的效用剂跟。
七、基于元學習的推薦
Long Short-Term Temporal Meta-learning in Online Recommendation
一個有效的在線推薦系統(tǒng)應該在用戶內(nèi)部行為(來自目標推薦任務)和外部行為(來自其他任務)中共同捕捉用戶的長期和短期偏好酣藻。然而曹洽,由于現(xiàn)實世界在實時訓練效率和外部行為獲取方面的限制,在大規(guī)模系統(tǒng)中充分利用所有歷史行為的同時辽剧,對實時新趨勢進行快速適應是極具挑戰(zhàn)性的送淆。為了解決這些實際的挑戰(zhàn),我們提出了一個新的長期短期時間元學習框架(LSTTM)在線推薦怕轿。它將用戶的多源行為安排在一個全局的長期圖和一個內(nèi)部的短期圖中偷崩,并通過不同的基于gat的聚合器和訓練策略來分別學習用戶的短期和長期偏好辟拷。為了及時捕捉用戶的實時興趣,我們提出了一種基于快速適應異步優(yōu)化策略的時間元學習方法阐斜,該方法將不同時段的推薦視為不同的任務衫冻。在實驗中,LSTTM在離線和在線評價上都取得了顯著的改進谒出。它被部署在一個被廣泛使用的名為微信Top Stories的在線推薦系統(tǒng)中隅俘,影響了數(shù)百萬用戶。
八笤喳、基于強化學習的推薦
12.A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in Online Advertising
自推薦系統(tǒng)(RS)誕生以來为居,推薦的準確性一直是評價RS算法質(zhì)量的黃金標準。
然而莉测,通過側(cè)重于項目的相關性颜骤,人們在其他重要指標方面付出了很大的代價:用戶被困在一個 "過濾泡 "中,他們的選擇范圍被大大縮小捣卤。因此降低了用戶體驗的質(zhì)量忍抽,并導致用戶流失。推薦董朝,特別是基于會話/順序的推薦鸠项。
是一項復雜的任務,有多種目標子姜,而且往往是相互沖突的目標現(xiàn)有的最先進的方法無法解決這個問題祟绊。
在這項工作中,我們接受了上述挑戰(zhàn)哥捕,并引入了用于RS的Scalarized Multi-Objective Reinforcement Learning(SMORL)
一個新的強化學習(RL)框架牧抽。能有效解決多目標推薦任務。
提議的SMORL代理增強了標準的推薦額外的RL層來增強標準的推薦模型遥赚,使其能夠同時滿足三個主要目標:
推薦的準確性扬舒、多樣性和新穎性。
我們將這一框架與四種基于會話的推薦模型相結(jié)合凫佛,并將其與單一目標的RL模型進行比較讲坎。
與一個只關注準確性的單目標RL代理進行比較。我們的
我們在兩個真實世界的數(shù)據(jù)集上的實驗結(jié)果顯示愧薛,總的多樣性有了很大的提高晨炕。在準確性方面有適度的提高。
減少了推薦的重復性毫炉,并證明了加強多樣性和新穎性作為補充性目標的重要性瓮栗。
注:文章將不斷深化和深挖,如有問題可以留言提出