文章名稱
【AAAI-2019】【Rutgers University】Causal Collaborative Filtering
核心要點
文章旨在將現(xiàn)有的基于相關(guān)性的協(xié)同過濾模型,擴展到基于因果的協(xié)同過濾模型宝踪,使得模型能夠打破觀測數(shù)據(jù)的邊界,真正的估計那些沒有被觀測到的反事實結(jié)果怠惶。作者提出了一個通用的協(xié)同過濾框架CCF來建模推薦系統(tǒng)中的因果關(guān)系,并且表明原有的基于相關(guān)性的協(xié)同過濾模型是CCF的特例轧粟,是簡化CCF因果圖之后的結(jié)果策治。作者還提出了一個條件干預方法來模擬do-calculus脓魏,以此從觀測數(shù)據(jù)中估計因果關(guān)系,并利用新提出的反事實約束學習框架估計用戶對物品的偏好览妖。
方法細節(jié)
問題引入
用戶和物品分別記作轧拄,
表示對物品的偏好(點擊或者購買)揽祥。傳統(tǒng)的推薦模型建模的是相關(guān)關(guān)系讽膏,
- 基于物品流行度模型,假設(shè)
拄丰,利用觀測數(shù)據(jù)學習相關(guān)關(guān)系
府树。
- 基于用戶的系統(tǒng)過濾,假設(shè)
料按,利用觀測到的相似用戶的評分估計用戶對給定物品評分奄侠。
- 基于物品的系統(tǒng)過濾,假設(shè)
载矿,利用觀測到的該用戶對相似物品的評分垄潮,估計該用戶對給定物品評分。
- 基于矩陣分解的模型闷盔,假設(shè)
弯洗,利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示
,并利用
估計該戶對給定物品評分逢勾。
- 基于概率矩陣分解的模型牡整,假設(shè)
,利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示
溺拱,并利用概率模型估計戶對給定物品評分逃贝。
- 基于神經(jīng)網(wǎng)絡(luò)的模型,假設(shè)
迫摔,利用觀測數(shù)據(jù)學習神經(jīng)網(wǎng)絡(luò)參數(shù)沐扳,并利用神經(jīng)網(wǎng)絡(luò)估計戶對給定物品評分。
但是句占,上述方法始終利用的是沪摄,這一 pre-intervention 的相關(guān)關(guān)系,但為了估計反事實辖众,我們需要的是估計推薦后 post-intervention 的因果效應卓起,即
。
作者總結(jié)的因果圖如下圖所示凹炸,值得注意的是戏阅,通過簡化因果圖,作者把許多模型統(tǒng)一到了CCF的框架下啤它。例如奕筐,
- 基于物品流行度模型舱痘,是簡化
,其因果圖如下圖子圖a所示离赫。
- 基于匹配方法的模型(包括協(xié)同過濾芭逝,矩陣分解和神經(jīng)網(wǎng)絡(luò)),是簡化
渊胸,其因果圖如下圖子圖b所示旬盯。由于用戶和物品隨機變量是外生的,所以翎猛,可以把do-calculus簡化為相關(guān)關(guān)系胖翰。
- Causal Embeddings for Recommendation (CausE) [1],一種基于因果的嵌入表示學習方法切厘,假設(shè)用戶對物品的有因果影響(其實是用戶偏好影響了推薦模型對物品的選擇)萨咳,其因果圖如下圖子圖c所示。**此時疫稿,在估計因果關(guān)系時培他,沒有簡化
而是利用do-calculus,切斷了
遗座。
除了因果關(guān)系建模的問題舀凛,如何估計是基于因果的推薦方法需要解決的另一難題。
具體做法
依據(jù)上述分析员萍,作者構(gòu)建了因果圖如Figure1中子圖d所示腾降,并且利用mediator分析作為條件干預方法,從觀測數(shù)據(jù)中估計碎绎。
本節(jié)描述了CCF框架的研究背景螃壤,以及如果把現(xiàn)有的基于相關(guān)關(guān)系的模型統(tǒng)一到因果推斷的框架下。并且筋帖,介紹了CCF需要解決如何估計的問題奸晴。下一節(jié)具體介紹估計
的細節(jié)。
心得體會
Causal Graph
作者從因果圖的角度分析了現(xiàn)有基于相關(guān)關(guān)系的模型日麸,捋清了脈絡(luò)是亮點之一寄啼。其實,各種模型在建模時還有細微差別代箭,都可以用不同的概率圖結(jié)構(gòu)描述墩划,復雜度模型可能引入更多的隨機變量,相關(guān)關(guān)系可以表示為無向圖嗡综,所以概率圖對因果學習來說還是很重要的乙帮,另外因果發(fā)現(xiàn)對因果圖的依賴就更嚴重了。
文章引用
[1] Stephen Bonner and Flavian Vasile. 2018. Causal embeddings for recommendation. In Proceedings of the 12th ACM Conference on Recommender Systems. 104–112.