因果推斷推薦系統(tǒng)工具箱 - CCF（一）

文章名稱

【AAAI-2019】【Rutgers University】Causal Collaborative Filtering

核心要點

文章旨在將現(xiàn)有的基于相關(guān)性的協(xié)同過濾模型，擴展到基于因果的協(xié)同過濾模型宝踪，使得模型能夠打破觀測數(shù)據(jù)的邊界，真正的估計那些沒有被觀測到的反事實結(jié)果怠惶。作者提出了一個通用的協(xié)同過濾框架CCF來建模推薦系統(tǒng)中的因果關(guān)系，并且表明原有的基于相關(guān)性的協(xié)同過濾模型是CCF的特例轧粟，是簡化CCF因果圖之后的結(jié)果策治。作者還提出了一個條件干預方法來模擬do-calculus脓魏，以此從觀測數(shù)據(jù)中估計因果關(guān)系，并利用新提出的反事實約束學習框架估計用戶對物品的偏好览妖。

方法細節(jié)

問題引入

用戶和物品分別記作 $u, v$ 轧拄， $y$ 表示對物品的偏好（點擊或者購買）揽祥。傳統(tǒng)的推薦模型建模的是相關(guān)關(guān)系讽膏，

基于物品流行度模型，假設(shè) $p(y|u, v) \propto p(y|v)$ 拄丰，利用觀測數(shù)據(jù)學習相關(guān)關(guān)系 $p(y|v)$ 府树。

基于用戶的系統(tǒng)過濾，假設(shè) $p(y|u, v) \propto \frac{1}{|N(u)|}\sum_{u \prime \in N(u)} y_{u\prime v}$ 料按，利用觀測到的相似用戶的評分估計用戶對給定物品評分奄侠。

基于物品的系統(tǒng)過濾，假設(shè) $p(y|u, v) \propto \frac{1}{|N(v)|}\sum_{v \prime \in N(v)} y_{u v\prime}$ 载矿，利用觀測到的該用戶對相似物品的評分垄潮，估計該用戶對給定物品評分。

基于矩陣分解的模型闷盔，假設(shè) $p(y|u, v) \propto \boldsymbol{u}\top \boldsymbol{v}$ 弯洗，利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示 $\boldsymbol{u}, \boldsymbol{v}$ ，并利用 $\boldsymbol{u}\top \boldsymbol{v} + b_u + b_v + b$ 估計該戶對給定物品評分逢勾。

基于概率矩陣分解的模型牡整，假設(shè) $p(y|u, v) \propto \mathcal{N}(y|\boldsymbol{u}\top \boldsymbol{v}, \sigma^2)$ ，利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示 $\boldsymbol{u}, \boldsymbol{v}$ 溺拱，并利用概率模型估計戶對給定物品評分逃贝。

基于神經(jīng)網(wǎng)絡(luò)的模型，假設(shè) $p(y|u, v) \propto NN(\boldsymbol{u}, \boldsymbol{v})$ 迫摔，利用觀測數(shù)據(jù)學習神經(jīng)網(wǎng)絡(luò)參數(shù)沐扳，并利用神經(jīng)網(wǎng)絡(luò)估計戶對給定物品評分。

但是句占，上述方法始終利用的是 $p(y|u, v)$ 沪摄，這一 pre-intervention 的相關(guān)關(guān)系，但為了估計反事實辖众，我們需要的是估計推薦后 post-intervention 的因果效應卓起，即 $p(y|u, do(v))$ 。

作者總結(jié)的因果圖如下圖所示凹炸，值得注意的是戏阅，通過簡化因果圖，作者把許多模型統(tǒng)一到了CCF的框架下啤它。例如奕筐，

基于物品流行度模型舱痘，是簡化 $p(y|u, do(v)) = p(y|u, v) = p(y|v)$ ，其因果圖如下圖子圖a所示离赫。

基于匹配方法的模型（包括協(xié)同過濾芭逝，矩陣分解和神經(jīng)網(wǎng)絡(luò)），是簡化 $p(y|u, do(v)) = p(y|u, v)$ 渊胸，其因果圖如下圖子圖b所示旬盯。由于用戶和物品隨機變量是外生的，所以翎猛，可以把do-calculus簡化為相關(guān)關(guān)系胖翰。

Causal Embeddings for Recommendation (CausE) [1]，一種基于因果的嵌入表示學習方法切厘，假設(shè)用戶對物品的有因果影響（其實是用戶偏好影響了推薦模型對物品的選擇）萨咳，其因果圖如下圖子圖c所示。**此時疫稿，在估計因果關(guān)系時培他，沒有簡化 $p(y|u, do(v))$ 而是利用do-calculus，切斷了 $U \rightarrow V$ 遗座。

casual graph

除了因果關(guān)系建模的問題舀凛，如何估計 $p(y|u, do(v))$ 是基于因果的推薦方法需要解決的另一難題。

具體做法

依據(jù)上述分析员萍，作者構(gòu)建了因果圖如Figure1中子圖d所示腾降，并且利用mediator分析作為條件干預方法，從觀測數(shù)據(jù)中估計 $p(y|u, do(v))$ 碎绎。

本節(jié)描述了CCF框架的研究背景螃壤，以及如果把現(xiàn)有的基于相關(guān)關(guān)系的模型統(tǒng)一到因果推斷的框架下。并且筋帖，介紹了CCF需要解決如何估計 $p(y|u, do(v))$ 的問題奸晴。下一節(jié)具體介紹估計 $p(y|u, do(v))$ 的細節(jié)。

心得體會

Causal Graph

作者從因果圖的角度分析了現(xiàn)有基于相關(guān)關(guān)系的模型日麸，捋清了脈絡(luò)是亮點之一寄啼。其實，各種模型在建模時還有細微差別代箭，都可以用不同的概率圖結(jié)構(gòu)描述墩划，復雜度模型可能引入更多的隨機變量，相關(guān)關(guān)系可以表示為無向圖嗡综，所以概率圖對因果學習來說還是很重要的乙帮，另外因果發(fā)現(xiàn)對因果圖的依賴就更嚴重了。

文章引用

[1] Stephen Bonner and Flavian Vasile. 2018. Causal embeddings for recommendation. In Proceedings of the 12th ACM Conference on Recommender Systems. 104–112.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

禁止轉(zhuǎn)載极景，如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者察净。

人面猴
序言：七十年代末驾茴，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子氢卡，更是在濱河造成了極大的恐慌锈至，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件译秦，死亡現(xiàn)場離奇詭異峡捡，居然都是意外死亡，警方通過查閱死者的電腦和手機诀浪，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門棋返，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人雷猪，你說我怎么就攤上這事∥浚” “怎么了求摇？”我有些...
開封第一講書人閱讀 163,624評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長殊者。經(jīng)常有香客問我与境，道長，這世上最難降的妖魔是什么猖吴？我笑而不...
開封第一講書人閱讀 58,356評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任摔刁，我火速辦了婚禮，結(jié)果婚禮上海蔽，老公的妹妹穿的比我還像新娘共屈。我一直安慰自己，他們只是感情好党窜，可當我...
茶點故事閱讀 67,402評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布拗引。她就那樣靜靜地躺著，像睡著了一般幌衣。火紅的嫁衣襯著肌膚如雪矾削。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,292評論 1贊 301
城市分裂傳說
那天豁护，我揣著相機與錄音哼凯，去河邊找鬼。笑死楚里，一個胖子當著我的面吹牛断部，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播腻豌，決...
沈念sama閱讀 40,135評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼家坎，長吁一口氣：“原來是場噩夢啊……” “哼嘱能！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起虱疏，我...
開封第一講書人閱讀 38,992評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤惹骂，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后做瞪，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體对粪，經(jīng)...
沈念sama閱讀 45,429評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,636評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年装蓬，在試婚紗的時候發(fā)現(xiàn)自己被綠了著拭。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,785評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡牍帚，死狀恐怖儡遮，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情暗赶，我是刑警寧澤鄙币，帶...
沈念sama閱讀 35,492評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站蹂随，受9級特大地震影響十嘿，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜岳锁，卻給世界環(huán)境...
茶點故事閱讀 41,092評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一绩衷、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧激率，春花似錦咳燕、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評論 0贊 22
一樁弒父案迟郎，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至聪蘸，卻和暖如春宪肖，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背健爬。一陣腳步聲響...
開封第一講書人閱讀 32,858評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工控乾，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人娜遵。一個月前我還...
沈念sama閱讀 47,891評論 2贊 370
代替公主和親
正文我出身青樓蜕衡，卻偏偏與公主長得像，于是被迫代替她去往敵國和親设拟。傳聞我的和親對象是個殘疾皇子慨仿，可洞房花燭夜當晚...
茶點故事閱讀 44,713評論 2贊 354