Denoising in Rec(1):Sampler Design for Implicit Feedback Data by Noisy-label Robust Learning

  • SIGIR2020


摘要

由于易收集且普遍適用懦胞,推薦研究中廣泛使用隱性反饋數(shù)據(jù)替久。然而,預(yù)測(cè)用戶(hù)對(duì)隱反饋數(shù)據(jù)(implicit feedback)的偏好是一項(xiàng)具有挑戰(zhàn)性的任務(wù)躏尉,因?yàn)槲覀冎荒苡^察到交互過(guò)的樣本和未交互的樣本(unvoted samples)蚯根。很難從未交互的樣本中區(qū)分負(fù)反饋樣本以及未知正反饋樣本。

現(xiàn)有的工作胀糜,如貝葉斯個(gè)性化排名(BPR)颅拦,從未交互的樣本中同一采樣構(gòu)成負(fù)樣本吼具,因此存在一個(gè)關(guān)鍵的標(biāo)簽噪聲問(wèn)題(noisy-label issue)。為了解決這一問(wèn)題矩距,本文設(shè)計(jì)了一種基于噪聲標(biāo)簽魯棒學(xué)習(xí)的自適應(yīng)采樣算法(an adaptive sampler based on noisy-label robust learning)拗盒。

為了解決這個(gè)問(wèn)題,首先引入貝葉斯逐點(diǎn)優(yōu)化(Bayesian Point-wise Optimization锥债, BPO)陡蝇,通過(guò)最大似然估計(jì)學(xué)習(xí)一個(gè)模型,例如矩陣分解(MF)哮肚。我們使用該模型預(yù)測(cè)用戶(hù)的偏好冶共,并通過(guò)最大化觀察到的數(shù)據(jù)標(biāo)簽的可能性來(lái)學(xué)習(xí)别惦,即用戶(hù)更喜歡她的正樣本平斩,而對(duì)她的未交互的樣本沒(méi)有興趣码倦。然而,在現(xiàn)實(shí)中潮剪,用戶(hù)可能對(duì)一些未交互樣本感興趣涣楷,但這些未交互的樣本有可能是用戶(hù)尚未交互的正樣本,被錯(cuò)誤標(biāo)記為陰性樣本抗碰。在此基礎(chǔ)上狮斗,考慮這些噪聲標(biāo)簽的風(fēng)險(xiǎn),本文提出Noisy-label Robust BPO(NBPO).

基于貝葉斯定理弧蝇,NBPO還通過(guò)標(biāo)簽翻轉(zhuǎn)(label flipping)的可能性來(lái)建立用戶(hù)偏好和觀察到的樣本間的關(guān)聯(lián)碳褒,同時(shí)最大化觀測(cè)似然函數(shù)(observation likelihood)。在NBPO中看疗,用戶(hù)更喜歡她的真正樣本沙峻,而對(duì)她的真負(fù)樣本不感興趣,因此優(yōu)化質(zhì)量顯著提高两芳。

Main Story

BPR是一種廣泛應(yīng)用于隱式反饋數(shù)據(jù)的優(yōu)化準(zhǔn)則摔寨,因?yàn)槠渥吭降男阅堋H欢辽龋幸粋€(gè)關(guān)鍵問(wèn)題祷肯,在BPR中,所有未交互的樣本都被同等地視為負(fù)疗隶。
事實(shí)上,用戶(hù)沒(méi)有交互的項(xiàng)目可能不是因?yàn)樗?她不喜歡它翼闹,而是因?yàn)樗?她還沒(méi)有看到它斑鼻。在現(xiàn)有的抽樣策略中,這些正樣本被錯(cuò)誤地標(biāo)記為負(fù)樣本猎荠,這導(dǎo)致了嚴(yán)重的噪聲標(biāo)簽問(wèn)題坚弱。為了提高采樣質(zhì)量蜀备,本文提出研究推薦任務(wù)中的噪聲標(biāo)簽魯棒學(xué)習(xí)對(duì)于每個(gè)未觀察到的用戶(hù)-物品交互荒叶,將其標(biāo)記為負(fù)樣本碾阁,但估計(jì)被錯(cuò)誤標(biāo)記的可能性

觀察的可能性被分解為真實(shí)標(biāo)簽的可能性和標(biāo)簽噪聲的可能性些楣。我們通過(guò)最大化觀測(cè)的可能性來(lái)聯(lián)合學(xué)習(xí)真實(shí)標(biāo)簽的可能性和標(biāo)簽噪聲的可能性脂凶。通過(guò)這種方法,我們可以從被污染的觀測(cè)標(biāo)簽中學(xué)習(xí)出真實(shí)的標(biāo)簽愁茁,并利用得到的真實(shí)標(biāo)簽進(jìn)行預(yù)測(cè)蚕钦。

Noisy-label Robust Learning

噪聲標(biāo)簽問(wèn)題是有監(jiān)督機(jī)器學(xué)習(xí)任務(wù)中的一個(gè)關(guān)鍵問(wèn)題。標(biāo)簽噪音會(huì)誤導(dǎo)模型并降低性能鹅很。越來(lái)越多的研究文獻(xiàn)旨在解決與從有噪類(lèi)別列表的樣本中學(xué)習(xí)有關(guān)的問(wèn)題

Bootkrajang和Kaban提出了一種帶噪標(biāo)簽魯棒回歸算法嘶居,該算法試圖結(jié)合估計(jì)標(biāo)簽翻轉(zhuǎn)概率來(lái)學(xué)習(xí)分類(lèi)器。真實(shí)標(biāo)簽和觀察標(biāo)簽的可能性通過(guò)翻轉(zhuǎn)概率連接促煮。最終最大化了觀測(cè)的可能性來(lái)估計(jì)所有參數(shù)邮屁。陽(yáng)性和未標(biāo)記(Positive and unlabeled, PU)數(shù)據(jù)可以被認(rèn)為是一種噪聲標(biāo)簽數(shù)據(jù)菠齿,其中我們主要考慮正樣本被錯(cuò)誤標(biāo)記為陰性的概率樱报。

Ghasemi等人提出了一種針對(duì)PU數(shù)據(jù)的主動(dòng)學(xué)習(xí)算法,該算法通過(guò)分別估計(jì)正點(diǎn)和未標(biāo)記點(diǎn)的概率密度泞当,然后計(jì)算信息量的期望值迹蛤,從而去除超參數(shù)并獲得更好的信息量度量。Plessis等人[33]提出了一種對(duì)成本敏感的分類(lèi)襟士,它利用非凸損失來(lái)防止目標(biāo)函數(shù)中出現(xiàn)多余的懲罰項(xiàng)盗飒。Sheieh等人[23]提出了一種PU數(shù)據(jù)的矩陣補(bǔ)全方法,可用于推薦任務(wù)陋桂。

相關(guān)鏈接:

訓(xùn)練數(shù)據(jù)\mathcal{D}包含N個(gè)樣本逆趣,\mathcal{D}=\{(x^{(1)},\tilde{y} ^{(1)}), ...,(x^{(N)},\tilde{y}^{(N)})\},其中\tilde{y}^{(N)}\in\{0,1\}是包含噪聲的二元的觀測(cè)標(biāo)簽嗜历。

考慮最經(jīng)典的邏輯回歸模型宣渗,最終 損失函數(shù)定義為:

考慮到噪聲標(biāo)簽的存在,需要設(shè)計(jì)方法來(lái)減緩噪聲的影響梨州,引入新的變量y^{(n)}來(lái)表示第n個(gè)樣本的真實(shí)標(biāo)簽痕囱,最終的觀測(cè)指標(biāo)概率分布如下所示:

其中p(\tilde{y}=k|y=j)即為標(biāo)簽翻轉(zhuǎn)概率,表示真實(shí)標(biāo)簽到觀測(cè)標(biāo)簽之間的概率暴匠。
基于以上公式鞍恢,進(jìn)行模型訓(xùn)練,通過(guò)最大化以上loss來(lái)學(xué)習(xí)分類(lèi)參數(shù)和標(biāo)簽噪聲概率:

在本文中,我們認(rèn)為隱式反饋的未標(biāo)記正樣本可以被錯(cuò)誤標(biāo)記為陰性樣本帮掉,從而探索推薦任務(wù)中的噪聲標(biāo)簽魯棒回歸弦悉,以提高采樣質(zhì)量。在現(xiàn)有的帶噪標(biāo)簽魯棒學(xué)習(xí)方法中蟆炊,對(duì)于某些j和k稽莉,所有樣本共享相同的標(biāo)簽翻轉(zhuǎn)概率p(\tilde{y}=k|y=j),而在本文中我們討論標(biāo)簽噪聲的概率因用戶(hù)而異涩搓, 可以表示為不同樣本的概率形式:

Method

1. Bayesian Point-wise Optimization

傳統(tǒng)的BPR結(jié)構(gòu)無(wú)法適用于noisy-label robust learning, 因?yàn)槠鋚airwise的結(jié)構(gòu)特性污秆。 所以本文作者先提出Point-wise的方法來(lái)作為優(yōu)化方法:定義二元交互矩陣來(lái)表示觀測(cè)結(jié)果:\tilde{\mathbf{R}} \in \mathbb{R}^{M\times N}, 矩陣元素為1即表示用戶(hù)與物品存在交互,反之為0.那么觀察到的交互記錄可以表示為\mathcal{R} = \{(u,i)|\tilde{\mathbf{R}}_{u,i}=1\}.

作者基于最大后驗(yàn)概率的思想來(lái)對(duì)模型進(jìn)行求解:

那么似然函數(shù)可以表示為:

以上的交互概率預(yù)測(cè)使用MF形式缩膝,同時(shí)再定義模型參數(shù)的先驗(yàn)分布符合正太分布:

最終的目標(biāo)函數(shù)為:

通過(guò)最大化以上的后驗(yàn)估計(jì)得到模型參數(shù)混狠。

2. NOISY-LABEL ROBUST SAMPLER

在BPO方法的基礎(chǔ)上,作者將noisy-label robust learning的方法加入優(yōu)化中:

首先疾层,根據(jù)上面的介紹将饺,我們需要設(shè)置噪聲標(biāo)簽概率,考慮到推薦上下文痛黎,具體的設(shè)置策略為:

  • p(\tilde{R}=1|R=0)=0 即實(shí)際為負(fù)樣本予弧,但用戶(hù)給了正反饋/交互的情況,作者假設(shè)該情況的概率為0湖饱,即這種用戶(hù)誤觸之類(lèi)的噪聲行為發(fā)生概率為0
  • p(\tilde{R}=0|R=0)=1 即實(shí)際為負(fù)樣本掖蛤,用戶(hù)也沒(méi)有交互的情況,作者假設(shè)該情況的概率為1
    p(\tilde{R}=0|R=1) 這就是假負(fù)樣本的情況
    p(\tilde{R}=1|R=1) 即真正樣本的情況
    p(\tilde{R}=0|R=1) + p(\tilde{R}=1|R=1) = 1

在推薦場(chǎng)景中井厌,項(xiàng)目被忽略的概率p(R)=0 | R=1)對(duì)用戶(hù)和物品敏感的蚓庭,即p(R)=0 | R=1)隨不同物品和不同用戶(hù)而變化。例如仅仆,熱門(mén)物品不太可能被錯(cuò)過(guò)器赞,用戶(hù)花更多的時(shí)間瀏覽物品,錯(cuò)過(guò)他們喜歡的項(xiàng)目的可能性就更小墓拜。
這還取決于用戶(hù)習(xí)慣和物品的搭配港柜。考慮到上述原因咳榜,文章提出學(xué)習(xí)了不同樣本的不同噪聲標(biāo)記概率夏醉,即,我們?cè)贜BPO中使用M×N概率矩陣τ亢∈ R M×N表示噪聲標(biāo)簽概率:


那么最終可以將似然函數(shù)表示為:
后驗(yàn)函數(shù)可以表示為:
上式最大的特點(diǎn)在于多了噪聲概率矩陣參數(shù)畔柔。

在noisy-label robust learning中常使用EM算法進(jìn)行優(yōu)化,但是對(duì)于大規(guī)模隱變量而言贸辈,EM比較低效释树;因此肠槽,文中提出使用SGD進(jìn)行優(yōu)化擎淤,根據(jù)實(shí)驗(yàn)結(jié)果之間進(jìn)行SGD往往是次優(yōu)的奢啥,作者根據(jù)EM的推導(dǎo)(EM也是通過(guò)不斷求解下界的極大化 來(lái)逼近求解對(duì)數(shù)似然函數(shù)的極大值),構(gòu)建目標(biāo)函數(shù)的下限:

上式基于琴生不等式來(lái)選取ln函數(shù)的下界嘴拢,在實(shí)際優(yōu)化中通過(guò)優(yōu)化上式進(jìn)行求解桩盲。

NBPO 優(yōu)化

  • 為了學(xué)習(xí)NBPO模型,我們?nèi)匀幻媾R一個(gè)關(guān)鍵問(wèn)題:當(dāng)使用最大似然估計(jì)進(jìn)行優(yōu)化時(shí)席吴,對(duì)數(shù)代理函數(shù)不適合噪聲標(biāo)簽魯棒推薦的情況赌结。
    可以看到兩個(gè)部分的變量是分開(kāi)的,即求解過(guò)程是獨(dú)立的孝冒,可以考慮移除ln函數(shù)柬姚,重新改造loss:
    在移除In函數(shù)后,sigmoid函數(shù)可能會(huì)出現(xiàn)梯度消失的問(wèn)題
    文中提出對(duì)于sigmoid函數(shù)項(xiàng)庄涡,在求導(dǎo)時(shí)使用Ln(sigmoid(x))進(jìn)行替代量承,可以理解為是一種特殊的梯度截?cái)喾椒ǎ罱K梯度計(jì)算方式如下:

NBPO實(shí)例

  • 以MF為例穴店,NBPO的具體模型可以如下所示
  • 其中對(duì)于噪聲概率矩陣同樣使用低秩矩陣分解的形式來(lái)獲取


  • 實(shí)際訓(xùn)練的時(shí)候同樣采取負(fù)采樣策略撕捍,選取負(fù)樣本,但采用point-wise的方式進(jìn)行訓(xùn)練

實(shí)驗(yàn)

  • 在兩個(gè)數(shù)據(jù)集上與經(jīng)典的MF方法進(jìn)行了對(duì)比
  • 其中的SOTA是ICML15提出的ShiftMC, 也是基于noisy-label的思路


總結(jié)

  • 本文針對(duì)隱式數(shù)據(jù)上的推薦任務(wù)泣洞,提出了一套新的優(yōu)化方法忧风,主要基于noisy-label roubst learning的方法來(lái)改造現(xiàn)有的BPR框架,已實(shí)現(xiàn)對(duì)未交互樣本的有效利用球凰。
  • 在論文寫(xiě)作和具體的公式推導(dǎo)細(xì)節(jié)上狮腿,本文有較多可借鑒之處。
  • 對(duì)于此方向呕诉,需要進(jìn)一步了解noisy-label robust learning研究領(lǐng)域的其他實(shí)現(xiàn)策略缘厢,來(lái)進(jìn)一步提出更fancy的優(yōu)化方法
  • 此外,對(duì)于該方法是否可以推廣應(yīng)用于更細(xì)分的推薦任務(wù)义钉,需要深入思考昧绣。

END

本人簡(jiǎn)書(shū)所有文章均為原創(chuàng),歡迎轉(zhuǎn)載捶闸,請(qǐng)注明文章出處 夜畴。百度和各類(lèi)采集站皆不可信,搜索請(qǐng)謹(jǐn)慎鑒別删壮。技術(shù)類(lèi)文章一般都有時(shí)效性贪绘,本人習(xí)慣不定期對(duì)自己的博文進(jìn)行修正和更新,因此請(qǐng)?jiān)L問(wèn)本人簡(jiǎn)書(shū)主頁(yè)查看最新信息http://www.reibang.com/u/40d14973d97c

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末央碟,一起剝皮案震驚了整個(gè)濱河市税灌,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖菱涤,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件苞也,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡粘秆,警方通過(guò)查閱死者的電腦和手機(jī)如迟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)攻走,“玉大人殷勘,你說(shuō)我怎么就攤上這事∥袈В” “怎么了玲销?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)摘符。 經(jīng)常有香客問(wèn)我贤斜,道長(zhǎng),這世上最難降的妖魔是什么议慰? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任蠢古,我火速辦了婚禮,結(jié)果婚禮上别凹,老公的妹妹穿的比我還像新娘草讶。我一直安慰自己,他們只是感情好炉菲,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布堕战。 她就那樣靜靜地躺著,像睡著了一般拍霜。 火紅的嫁衣襯著肌膚如雪嘱丢。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,679評(píng)論 1 305
  • 那天祠饺,我揣著相機(jī)與錄音越驻,去河邊找鬼。 笑死道偷,一個(gè)胖子當(dāng)著我的面吹牛缀旁,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播勺鸦,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼并巍,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了换途?” 一聲冷哼從身側(cè)響起懊渡,我...
    開(kāi)封第一講書(shū)人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤刽射,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后剃执,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體誓禁,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年忠蝗,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了现横。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片漓拾。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡阁最,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出骇两,到底是詐尸還是另有隱情速种,我是刑警寧澤,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布低千,位于F島的核電站配阵,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏示血。R本人自食惡果不足惜棋傍,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望难审。 院中可真熱鬧瘫拣,春花似錦、人聲如沸告喊。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)黔姜。三九已至拢切,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間秆吵,已是汗流浹背淮椰。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留纳寂,地道東北人主穗。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像烈疚,于是被迫代替她去往敵國(guó)和親黔牵。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容