因果推斷推薦系統(tǒng)工具箱 - CCF(一)

文章名稱

【AAAI-2019】【Rutgers University】Causal Collaborative Filtering

核心要點

文章旨在將現(xiàn)有的基于相關(guān)性的協(xié)同過濾模型,擴展到基于因果的協(xié)同過濾模型宝踪,使得模型能夠打破觀測數(shù)據(jù)的邊界,真正的估計那些沒有被觀測到的反事實結(jié)果怠惶。作者提出了一個通用的協(xié)同過濾框架CCF來建模推薦系統(tǒng)中的因果關(guān)系,并且表明原有的基于相關(guān)性的協(xié)同過濾模型是CCF的特例轧粟,是簡化CCF因果圖之后的結(jié)果策治。作者還提出了一個條件干預方法來模擬do-calculus脓魏,以此從觀測數(shù)據(jù)中估計因果關(guān)系,并利用新提出的反事實約束學習框架估計用戶對物品的偏好览妖。

方法細節(jié)

問題引入

用戶和物品分別記作u, v轧拄,y表示對物品的偏好(點擊或者購買)揽祥。傳統(tǒng)的推薦模型建模的是相關(guān)關(guān)系讽膏,

  • 基于物品流行度模型,假設(shè)p(y|u, v) \propto p(y|v)拄丰,利用觀測數(shù)據(jù)學習相關(guān)關(guān)系p(y|v)府树。
  • 基于用戶的系統(tǒng)過濾,假設(shè)p(y|u, v) \propto \frac{1}{|N(u)|}\sum_{u \prime \in N(u)} y_{u\prime v}料按,利用觀測到的相似用戶的評分估計用戶對給定物品評分奄侠。
  • 基于物品的系統(tǒng)過濾,假設(shè)p(y|u, v) \propto \frac{1}{|N(v)|}\sum_{v \prime \in N(v)} y_{u v\prime}载矿,利用觀測到的該用戶對相似物品的評分垄潮,估計該用戶對給定物品評分。
  • 基于矩陣分解的模型闷盔,假設(shè)p(y|u, v) \propto \boldsymbol{u}\top \boldsymbol{v}弯洗,利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示\boldsymbol{u}, \boldsymbol{v},并利用\boldsymbol{u}\top \boldsymbol{v} + b_u + b_v + b估計該戶對給定物品評分逢勾。
  • 基于概率矩陣分解的模型牡整,假設(shè)p(y|u, v) \propto \mathcal{N}(y|\boldsymbol{u}\top \boldsymbol{v}, \sigma^2),利用觀測數(shù)據(jù)學習用戶和物品的隱向量表示\boldsymbol{u}, \boldsymbol{v}溺拱,并利用概率模型估計戶對給定物品評分逃贝。
  • 基于神經(jīng)網(wǎng)絡(luò)的模型,假設(shè)p(y|u, v) \propto NN(\boldsymbol{u}, \boldsymbol{v})迫摔,利用觀測數(shù)據(jù)學習神經(jīng)網(wǎng)絡(luò)參數(shù)沐扳,并利用神經(jīng)網(wǎng)絡(luò)估計戶對給定物品評分。

但是句占,上述方法始終利用的是p(y|u, v)沪摄,這一 pre-intervention 的相關(guān)關(guān)系,但為了估計反事實辖众,我們需要的是估計推薦后 post-intervention 的因果效應卓起,即p(y|u, do(v))

作者總結(jié)的因果圖如下圖所示凹炸,值得注意的是戏阅,通過簡化因果圖,作者把許多模型統(tǒng)一到了CCF的框架下啤它。例如奕筐,

  • 基于物品流行度模型舱痘,是簡化p(y|u, do(v)) = p(y|u, v) = p(y|v),其因果圖如下圖子圖a所示离赫。
  • 基于匹配方法的模型(包括協(xié)同過濾芭逝,矩陣分解和神經(jīng)網(wǎng)絡(luò)),是簡化p(y|u, do(v)) = p(y|u, v)渊胸,其因果圖如下圖子圖b所示旬盯。由于用戶和物品隨機變量是外生的,所以翎猛,可以把do-calculus簡化為相關(guān)關(guān)系胖翰。
  • Causal Embeddings for Recommendation (CausE) [1],一種基于因果的嵌入表示學習方法切厘,假設(shè)用戶對物品的有因果影響(其實是用戶偏好影響了推薦模型對物品的選擇)萨咳,其因果圖如下圖子圖c所示。**此時疫稿,在估計因果關(guān)系時培他,沒有簡化p(y|u, do(v))而是利用do-calculus,切斷了U \rightarrow V遗座。
casual graph

除了因果關(guān)系建模的問題舀凛,如何估計p(y|u, do(v))是基于因果的推薦方法需要解決的另一難題。

具體做法

依據(jù)上述分析员萍,作者構(gòu)建了因果圖如Figure1中子圖d所示腾降,并且利用mediator分析作為條件干預方法,從觀測數(shù)據(jù)中估計p(y|u, do(v))碎绎。

本節(jié)描述了CCF框架的研究背景螃壤,以及如果把現(xiàn)有的基于相關(guān)關(guān)系的模型統(tǒng)一到因果推斷的框架下。并且筋帖,介紹了CCF需要解決如何估計p(y|u, do(v))的問題奸晴。下一節(jié)具體介紹估計p(y|u, do(v))的細節(jié)。

心得體會

Causal Graph

作者從因果圖的角度分析了現(xiàn)有基于相關(guān)關(guān)系的模型日麸,捋清了脈絡(luò)是亮點之一寄啼。其實,各種模型在建模時還有細微差別代箭,都可以用不同的概率圖結(jié)構(gòu)描述墩划,復雜度模型可能引入更多的隨機變量,相關(guān)關(guān)系可以表示為無向圖嗡综,所以概率圖對因果學習來說還是很重要的乙帮,另外因果發(fā)現(xiàn)對因果圖的依賴就更嚴重了。

文章引用

[1] Stephen Bonner and Flavian Vasile. 2018. Causal embeddings for recommendation. In Proceedings of the 12th ACM Conference on Recommender Systems. 104–112.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載极景,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者察净。
  • 序言:七十年代末驾茴,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子氢卡,更是在濱河造成了極大的恐慌锈至,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件译秦,死亡現(xiàn)場離奇詭異峡捡,居然都是意外死亡,警方通過查閱死者的電腦和手機诀浪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進店門棋返,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人雷猪,你說我怎么就攤上這事∥浚” “怎么了求摇?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長殊者。 經(jīng)常有香客問我与境,道長,這世上最難降的妖魔是什么猖吴? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任摔刁,我火速辦了婚禮,結(jié)果婚禮上海蔽,老公的妹妹穿的比我還像新娘共屈。我一直安慰自己,他們只是感情好党窜,可當我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布拗引。 她就那樣靜靜地躺著,像睡著了一般幌衣。 火紅的嫁衣襯著肌膚如雪矾削。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天豁护,我揣著相機與錄音哼凯,去河邊找鬼。 笑死楚里,一個胖子當著我的面吹牛断部,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播腻豌,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼家坎,長吁一口氣:“原來是場噩夢啊……” “哼嘱能!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起虱疏,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤惹骂,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后做瞪,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體对粪,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年装蓬,在試婚紗的時候發(fā)現(xiàn)自己被綠了著拭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡牍帚,死狀恐怖儡遮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情暗赶,我是刑警寧澤鄙币,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布,位于F島的核電站蹂随,受9級特大地震影響十嘿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜岳锁,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一绩衷、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧激率,春花似錦咳燕、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至聪蘸,卻和暖如春宪肖,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背健爬。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工控乾, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人娜遵。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓蜕衡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親设拟。 傳聞我的和親對象是個殘疾皇子慨仿,可洞房花燭夜當晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容