[搜索多樣性] P-Companion: A Principled Framework for Diversified Complementary Product Recommendation ...

Introduction

互補(bǔ)商品推薦(Complementary Product Recommendataion, CPR)漠嵌,i2i問題。輸入的query是一個(gè)item饵婆,目標(biāo)是召回盡可能多種類的互補(bǔ)商品(例如手機(jī)和手機(jī)殼售貌,羽毛球拍和羽毛球)。

image.png

難點(diǎn):

  • 互補(bǔ)關(guān)系是非對稱關(guān)系啃憎,例如,手機(jī)殼->手機(jī)是正確的似炎,但是手機(jī)->手機(jī)殼是錯誤的辛萍。并且互補(bǔ)關(guān)系不等于相似,通過常見的相似度量是不能得到互補(bǔ)關(guān)系的
  • 多樣性:互補(bǔ)的推薦里面需要考慮多樣性
  • 冷啟動:推薦的常見問題羡藐,低資源的item效果差

之前的方法(矩陣分解/協(xié)同過濾/神經(jīng)網(wǎng)絡(luò)等)大多數(shù)是基于相似度的贩毕,無法解決這個(gè)問題。專門做互補(bǔ)商品推薦的工作有兩個(gè)仆嗦,Sceptre(KDD'15), PMSC(WSDM'18)辉阶。這兩個(gè)工作都存在兩個(gè)問題:

  • 分別使用co-view和co-purchase數(shù)據(jù)作為判斷相似商品和互補(bǔ)商品的依據(jù),但是實(shí)際上co-view和co-purchase是有重合的瘩扼,不同的類目重合度不一樣
  • 只在一個(gè)大類內(nèi)部做推薦(例如電子/母嬰)谆甜,但是事實(shí)上互補(bǔ)的商品經(jīng)常會跨類目。

Contribution:

  • 提出了一種新的構(gòu)建互補(bǔ)數(shù)據(jù)的模式
  • 提出了一個(gè)新的模型 P-companion邢隧,可以生成多樣化的互補(bǔ)商品推薦店印,并且可以處理冷啟動的問題
  • 效果:hit@10超過SOTA 7.1%

Preliminaries

Behaviour-based Product Graph (BPG)

  • 節(jié)點(diǎn):商品

  • 屬性:product catalog: title冈在、類目倒慧、短描述等文本信息

  • 邊:

  • co-review: Bcv

  • co-purchase: Bcp

  • purchase-after-review: Bpv,瀏覽了x包券,最終購買了y

這里有一個(gè)疑問纫谅,co-review和co-purchase這兩種邊為什么是有向的?這影響了接下來構(gòu)造數(shù)據(jù)的時(shí)候怎么能構(gòu)造出來非對稱的label

問題定義:給定BPG溅固,給定query item i和它對應(yīng)的類目 wi付秕,給定目標(biāo)互補(bǔ)商品的類目數(shù)k,生成互補(bǔ)商品集合侍郭。目標(biāo)是優(yōu)化co-purchase概率

image.png

Data Generating: Distant supervision label collection for CPR problem

  • 修改了對互補(bǔ)商品的生成規(guī)則:作者觀察到询吴,co-review和co-purchase整體上有20%的重合掠河,而且不同類目程度不同。符合人的直覺猛计,會同時(shí)購買兩件T恤唠摹,但是不會同時(shí)購買兩個(gè)電視。最終的互補(bǔ)商品集合如下奉瘤,人工評估這種方式的準(zhǔn)確率比只用cp高了30%
image.png
  • 打破了之前的類目限制:互補(bǔ)商品會出現(xiàn)跨一級類目的情況勾拉,例如,網(wǎng)球拍在Sports大類下面盗温,但是網(wǎng)球鞋在Shoes大類下面藕赞。33%的電子商品的co-purchase類目是 home improvement 和 office product
  • 最終生成的數(shù)據(jù)集:2.4kw 商品,3.5w 類目卖局,8kw 互補(bǔ)關(guān)系

Model

P-Companion:E2E模型斧蜕,分層多任務(wù)(預(yù)測類目&預(yù)測商品)聯(lián)合訓(xùn)練。主要有三個(gè)部分

  • Product2vec: 基于圖的商品表示學(xué)習(xí)(一跳的GAT)砚偶,尤其適合解決冷啟動問題
  • Complementary type transition: 預(yù)測互補(bǔ)商品的類目
  • complementary item prediction: 根據(jù)query商品和目標(biāo)類目惩激,預(yù)測互補(bǔ)商品
image.png

1. Product2vec

整體上是一個(gè)一跳的GAT,單獨(dú)訓(xùn)練蟹演。這里訓(xùn)練出來的商品向量應(yīng)該會用來初始化后面2&3中的商品向量风钻。

https://intranetproxy.alipay.com/skylark/lark/0/2021/png/268035/1611196704642-90994778-7801-4645-b111-3e89c05a5394.png

  • 商品初始表示:3層的網(wǎng)絡(luò)

    image.png

  • 鄰域選擇:根據(jù)BPG圖中邊的情況,把item之間的關(guān)系分成兩種:相似(substitute)和互補(bǔ)(complementary)酒请,這兩種會分別構(gòu)造鄰域作為正例和負(fù)例骡技。相似(左)和互補(bǔ)(右)的定義:

image.png

image.png
  • 訓(xùn)練目標(biāo):經(jīng)過相似商品子圖聚合后,新的商品表示應(yīng)該和初始表示相似羞反;經(jīng)過互補(bǔ)商品子圖聚合后布朦,新的表示應(yīng)該和初始表示不相似
image.png

2. Complementary Type Transition

這里就是一個(gè)比較簡單的分類任務(wù)的網(wǎng)絡(luò),每個(gè)類目有兩個(gè)向量表達(dá)昼窗,一個(gè)用來做query向量是趴,一個(gè)用來做context向量[圖片上傳失敗...(image-6f62bc-1616648172252)] ,這里的目的是解決前面提到的互補(bǔ)關(guān)系非對稱的問題澄惊。

image.png

3. Complementary Item Prediction

商品向量和target互補(bǔ)類目向量點(diǎn)乘唆途,把商品向量transfer到target互補(bǔ)類目空間,再計(jì)算和target item的距離掸驱。

image.png

image.png

訓(xùn)練數(shù)據(jù):和Product2vec相反肛搬,相似數(shù)據(jù)作為負(fù)例,互補(bǔ)數(shù)據(jù)作為正例毕贼,正負(fù)例比例1:1

Joint Training:預(yù)測商品和預(yù)測類目的loss加權(quán)求和温赔,通過α控制比重(實(shí)際取的是0.8)

inference:需要分2步進(jìn)行,先預(yù)測type鬼癣,然后取Top K陶贼,再預(yù)測商品

Experiment

Experiment Setup

  • Dataset:構(gòu)造方式見preliminaries
image.png
  • Baseline:

  • Co-purchase (CP): 直接把一起購買的商品作為CPR推薦的結(jié)果

  • Sceptre:根據(jù)商品的title/短描述/評論挖掘topic啤贩,然后通過LR預(yù)測substitute/complementary關(guān)系

  • PMSC:每個(gè)item分別有src embedding和tgt embedding兩個(gè)表示,分別在query和candidate context中使用拜秧。通過神經(jīng)網(wǎng)絡(luò)分類瓜晤。

  • JOIE:知識圖譜表示學(xué)習(xí)的一個(gè)模型,會用到實(shí)體對應(yīng)的type信息腹纳,這里把商品作為節(jié)點(diǎn)痢掠,把type改成是類目

Evaluation

image.png

目標(biāo)互補(bǔ)type數(shù)量的實(shí)驗(yàn),提升目標(biāo)type數(shù)量嘲恍,會同時(shí)提升多樣性和hit足画。

image.png

人工評測:0-3分,分越高表示推薦的結(jié)果越好佃牛,評測的人越想買淹辞。這個(gè)結(jié)果說明模型推薦的結(jié)果和實(shí)際上co-purchase數(shù)據(jù)很接近

image.png
image.png

Case study: CPR on cold-start items

image.png
image.png

Online 實(shí)驗(yàn)

base策略:co-purchase ,orders + 0.23%, GMV+ 0.18%

Conclusion

回顧一下這篇paper對于幾個(gè)challenge的解決方案:

  • 互補(bǔ)是非對稱關(guān)系俘侠,且不等于相似:1) 構(gòu)造數(shù)據(jù)方式調(diào)整象缀,提升互補(bǔ)關(guān)系label的準(zhǔn)確率;2) 每個(gè)類目有query表達(dá)和context表達(dá)兩種向量
  • 多樣性:hierarchical model爷速,先預(yù)測type央星,后預(yù)測item”苟可以人工指定type數(shù)量
  • 冷啟動:通過product2vec圖模型預(yù)訓(xùn)練商品向量

一些比較奇怪的點(diǎn):

  • 這篇論文里完全沒有用戶相關(guān)的建模莉给,只有通過泛化的用戶行為構(gòu)造的BPG上的邊,沒有個(gè)體用戶
  • 對于item只用了類目&文本特征(product catalog)和邊信息廉沮,完全沒考慮商品自身的效率指標(biāo)(例如orders等)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末颓遏,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子滞时,更是在濱河造成了極大的恐慌叁幢,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,284評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件坪稽,死亡現(xiàn)場離奇詭異曼玩,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)刽漂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,115評論 3 395
  • 文/潘曉璐 我一進(jìn)店門演训,熙熙樓的掌柜王于貴愁眉苦臉地迎上來弟孟,“玉大人贝咙,你說我怎么就攤上這事》髂迹” “怎么了庭猩?”我有些...
    開封第一講書人閱讀 164,614評論 0 354
  • 文/不壞的土叔 我叫張陵窟她,是天一觀的道長。 經(jīng)常有香客問我蔼水,道長震糖,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,671評論 1 293
  • 正文 為了忘掉前任趴腋,我火速辦了婚禮吊说,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘优炬。我一直安慰自己颁井,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,699評論 6 392
  • 文/花漫 我一把揭開白布蠢护。 她就那樣靜靜地躺著雅宾,像睡著了一般。 火紅的嫁衣襯著肌膚如雪葵硕。 梳的紋絲不亂的頭發(fā)上眉抬,一...
    開封第一講書人閱讀 51,562評論 1 305
  • 那天,我揣著相機(jī)與錄音懈凹,去河邊找鬼蜀变。 笑死,一個(gè)胖子當(dāng)著我的面吹牛介评,可吹牛的內(nèi)容都是我干的昏苏。 我是一名探鬼主播,決...
    沈念sama閱讀 40,309評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼威沫,長吁一口氣:“原來是場噩夢啊……” “哼贤惯!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起棒掠,我...
    開封第一講書人閱讀 39,223評論 0 276
  • 序言:老撾萬榮一對情侶失蹤孵构,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后烟很,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颈墅,經(jīng)...
    沈念sama閱讀 45,668評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,859評論 3 336
  • 正文 我和宋清朗相戀三年雾袱,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了恤筛。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,981評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡芹橡,死狀恐怖毒坛,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤煎殷,帶...
    沈念sama閱讀 35,705評論 5 347
  • 正文 年R本政府宣布屯伞,位于F島的核電站,受9級特大地震影響豪直,放射性物質(zhì)發(fā)生泄漏劣摇。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,310評論 3 330
  • 文/蒙蒙 一弓乙、第九天 我趴在偏房一處隱蔽的房頂上張望末融。 院中可真熱鬧,春花似錦暇韧、人聲如沸滑潘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,904評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽语卤。三九已至,卻和暖如春酪刀,著一層夾襖步出監(jiān)牢的瞬間粹舵,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,023評論 1 270
  • 我被黑心中介騙來泰國打工骂倘, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留眼滤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,146評論 3 370
  • 正文 我出身青樓历涝,卻偏偏與公主長得像诅需,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子荧库,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,933評論 2 355

推薦閱讀更多精彩內(nèi)容