文章名稱
【RecSys-2020】【University of Tuebingen】Causal Inference for Recommender Systems
核心要點
文章旨在利用因果推斷的框架提高推薦系統(tǒng)效率泌辫,只推薦被曝光后用戶才會看的電影,而非曝光不曝光都會被觀看的電影,也就是所謂的觀看提升量。同時晤愧,利用因果推斷的框架解決推薦模型經(jīng)常遇到的混淆變量的問題北专。
方法細節(jié)
問題引入
作者認為,推薦模型天生應該是因果的琴许。推薦模型應該推薦那些不推薦用戶就不會看的電影聋涨。此時晾浴,一般模型會遇到混淆變量的影響,而無法直接從觀測數(shù)據(jù)中有效的估計出因果效應牍白〖够耍基于因果推斷的理論,需要我們觀測到所有混淆變量茂腥,才能準確反應因果效應[19]狸涌,但是我們無法確認是否觀測了所有混混淆變量[8]。
具體做法
作者提出deconfounded recommender最岗,一種嘗試糾正經(jīng)典矩陣分解以解決未觀察到的混雜問題的方法帕胆。首先,形式化的定義一下問題般渡,
- 用戶是否被曝光了電影懒豹,記作
芙盘,可以被認為是treatment。
- 用戶和物品的嵌入表示脸秽,分別記作
儒老。
- 用戶對物品的反饋可以被形式化為
,兩個potential outcome记餐,
驮樊,分別表示被曝光(be made to watch)和沒有被曝光情況下的用戶反饋。
- 作者用如下圖所示的建模上述outcome片酝,其中
表示treatment巩剖。該公式表示,當
時钠怯,模型假設用戶的反饋服從正態(tài)分布,均值是用戶和物品表示的內積(模型是矩陣分解的架構)曙聂;而
是晦炊,模型的均值是0。
outcome model
如果直接擬合觀測數(shù)據(jù)宁脊,上述模型退化為傳統(tǒng)的probabilistic matrix factorization[17]断国。這種情況下,模型只考慮觀測到的點擊數(shù)據(jù)榆苞,忽略了未暴露的物品稳衬。
作者認為,從因果推斷的角度坐漏,如果要無偏估計薄疚,需要滿足如下圖所示的ignorability的假設。
ignorability其中赊琳,
分別是在建立在所有物品上的曝光(把所有物品上的曝光或者不曝光作為treatment街夭,是一個0/1的向量),其形式如下圖所示躏筏。
treatment in vector
顯然板丽,要求獨立于
是不合理的,因為趁尼,如地域和題材等混淆變量埃碱,會被推薦模型利用,一定會影響電影的曝光酥泞,也會影響用戶對它們的評分砚殿。
因此,用戶的偏好通常會被錯誤的估計芝囤。此時瓮具,需要我們控制confounder[18, 21]荧飞。假設,confounder為
名党,unconfounderness的假設可以表述如下叹阔,
unconfounderness此時,潛在因果的估計模型如下圖所示传睹,其中
耳幢。
outcome model with confounder
但是,上述條件要求所有confounder都被觀測到欧啤,被稱為strong ignorability睛藻,通常是不可測量的[8]。
deconfounded recommender
作者通過建模曝光數(shù)據(jù)邢隧,來帶代替未觀測的混淆變量(因為曝光是與無觀測的混淆變量相關店印,是他們的一種可觀測表現(xiàn))。作者表示倒慧,從causal inference的角度看按摘,推薦系統(tǒng)是一個multiple treatment的問題,每一個用戶-物品元組的曝光是一個treatment纫谅,而所有物品上的曝光被看做是一個treatment向量炫贤,
才是真正的outcome,當然也是個向量付秕。但是對所有物品的曝光是個組合問題兰珍,導致只能觀測到部分組合,并且不知道哪些因素實際影響了這個組合询吴,所以存在未觀測變量掠河。
基于建模曝光的思想,作者把deconfounded recommender分為兩個步驟猛计,
建模曝光數(shù)據(jù)口柳。作者利用Poisson factorization[5]來建模曝光數(shù)據(jù),Poisson factorization假設數(shù)據(jù)來源于泊松分布有滑,具體公式如下圖所示跃闹,其中
是非負的
維向量,分別表示用戶偏好和物品特性毛好。作者表示望艺,PF是非負矩陣分解的變種。
PF Process assumption重新估計曝光肌访。利用訓練好的PF模型替換未觀測的混淆變量找默,可重建曝光矩陣
。其中吼驶,其中\(zhòng)boldsymbol{a}是觀察到的所有用戶的曝光惩激。值得注意的是店煞,期望在PF模型估計的所有曝光
上計算。并且后驗均值
被當做confounder的替換值[26]风钻。
計算outcome顷蟀。最后,利用如下圖所示的公式骡技,基于重新估計的曝光矩陣
(包括了替換后的confounder的影響)來計算outcome(點擊)鸣个。其中,系數(shù)
用來調節(jié)
對outcome的影響程度布朦。**值得注意的是囤萤,參數(shù)
在在實際觀測到的點擊數(shù)據(jù)
上(或評分)和未點擊的數(shù)據(jù)上共同訓練,而除了參數(shù)
以外的其他參數(shù)只在實際觀測到的點擊數(shù)據(jù)上訓練(未點擊的數(shù)據(jù)意味著
)是趴。預測時涛舍,利用
作為預估的點擊(或評分)。
predict outcome
本節(jié)講解了作者研究的問題背景唆途,同時描述了解決方法的流程細節(jié)富雅。下一節(jié)繼續(xù)介紹方法的理論分析。
心得體會
觀看提升量
作者期望最大化的窘哈,其實是電影被觀看的概率。從這個角度定義的出發(fā)亭敢,計算提升量滚婉。提升是由于推薦這個動作帶來的。事實上帅刀,一個電影是否被觀看以及提升让腹,真的能帶來全局最優(yōu)么?我們把所有提升量最高的電影推薦給了用戶扣溺,但是占用了用戶的觀看時長骇窍,可能用戶不喜歡最終效果會下降。反而是那些用戶自己也會搜的锥余,但是有一時想不起來的更反應用戶喜好腹纳?
也許從作者的角度,提升代表了給用戶帶來新鮮感或者被推薦的體驗感驱犹,因此增加用戶粘性提升平臺收入嘲恍。而不僅僅是為了符合因果推斷的框架而已。
未觀測變量
個人理解雄驹,不管是single treatment還是multiple treatment佃牛,未觀測變量出現(xiàn)的根本原因是不可控的和未知的環(huán)節(jié),比如推薦的工程鏈路医舆,模型的異常俘侠,未考慮到的case象缀,還有那些不可能被電腦記錄的人的情緒等。unmearued confounder處處存在爷速。
文章引用
[5] Prem Gopalan, Jake M Hofman, and David M Blei. 2015. Scalable Recommenda- tion with Hierarchical Poisson Factorization.. In UAI. 326–335.
[8] Paul W Holland, Clark Glymour, and Clive Granger. 1985. Statistics and causal inference. ETS Research Report Series 1985, 2 (1985).
[17] Andriy Mnih and Ruslan R Salakhutdinov. 2008. Probabilistic matrix factorization. In Advances in neural information processing systems. 1257–1264.
[18] Judea Pearl. 2009. Causality. Cambridge University Press.
[19] Paul R Rosenbaum and Donald B Rubin. 1983. The central role of the propensity score in observational studies for causal effects. Biometrika 70, 1 (1983), 41–55.
[21] Donald B Rubin. 2005. Causal inference using potential outcomes: Design, modeling, decisions. J. Amer. Statist. Assoc. 100, 469 (2005), 322–331.
[26] Yixin Wang and David M Blei. 2018. The blessings of multiple causes. arXiv preprint arXiv:1805.06826 (2018).