前言
- KDD2020,針對基于會(huì)話推薦任務(wù)提出的GNN方法
- 對已有的GNN方法的缺陷進(jìn)行分析并做出改進(jìn)
- 主要針對lossy session encoding和ineffective long-range dependency capturing兩個(gè)問題:基于GNN的方法存在損失部分序列信息的問題叮雳,主要是在session轉(zhuǎn)換為圖以及消息傳播過程中的排列無關(guān)(permutation-invariant)的聚合過程中造成想暗。
-
由于GNN層數(shù)限制,session內(nèi)的一些長期依賴無法被捕捉
引言
基于會(huì)話的推薦算法具有極高的實(shí)用價(jià)值债鸡,近年來被廣泛研究江滨,基于GNN的會(huì)話推薦也被很多學(xué)者研究,然而卻存在著信息損失的問題厌均。
-
有損編碼問題 lossy session encoding problem
如下圖所示唬滑,不同的session被編碼成同樣的graph,
- 長期依賴捕捉問題 ineffective long-range dependency capturing
文中提出無損編碼:edge-order preserving(EOP) multigraph 保存交互順序信息棺弊;
并提出shortcut graph來解決長期依賴捕捉的問題晶密。
模型方法
1. 問題定義
物品集合:沒有利用額外的上下文信息
2. 構(gòu)圖
包含兩種構(gòu)圖方式:構(gòu)建EOP graph和構(gòu)建shortcut graph
S2MG: Session to EOP Multigraph
給每個(gè)節(jié)點(diǎn)的入邊進(jìn)行有序編號,是一種無損編碼的方法
S2SG: Session to Shortcut Graph
為了有效解決現(xiàn)有基于GNN的方法無法處理長期依賴的問題模她,文中提出構(gòu)建shortcut graph稻艰,利用the shortcut graph attention (SGAT) layer處理graph. 圖中的邊根據(jù)session中物品的時(shí)序來構(gòu)建,當(dāng)且僅當(dāng)節(jié)點(diǎn)u侈净,v都在session中并且時(shí)尊勿,二者之間存在一條邊僧凤,即單向全連接圖
(本質(zhì)上是加了Mask的Transformer)
3. 模型LESSR
主要工作創(chuàng)新在于利用RNN聚合來解決信息損失問題途事。
信息更新過程如下shortcut graph Attention (SGAT)
不加限制的添加short-cut 會(huì)不會(huì)造成信息冗余尸变?
將EOP Layer和SGAT交替堆疊,一方面避免SGAT構(gòu)圖的損失累計(jì)减俏;另一方面:可以有效地利用不同層學(xué)習(xí)到的特征召烂。
最后將圖中節(jié)點(diǎn)表征進(jìn)行聚合得到session的表征,即readout操作模型預(yù)測與訓(xùn)練
預(yù)測方法:實(shí)驗(yàn)情況
小結(jié)
本文對GNN方法中的缺陷進(jìn)行了分析垄懂,指出了GNN用于SBR的問題骑晶,并針對性地提出了無損編碼方法和GNN改進(jìn)方法,工作還是挺有創(chuàng)新性草慧,但在具體的SGAT中仍然存在著改進(jìn)的空間桶蛔。