用戶微觀行為在推薦系統(tǒng)中的應(yīng)用

業(yè)內(nèi)人士都清楚特征工程在推薦系統(tǒng)中的重要性。要想開發(fā)出高質(zhì)量的特征霹肝,必須要弄清楚其來源,用處塑煎,對(duì)用戶的刻畫等等方面沫换。這篇文章對(duì)于微觀行為特征的數(shù)據(jù)分析很詳細(xì),值得借鑒最铁。

論文題目:<<Micro Behaviors: A New Perspective in E-commerce
Recommender Systems>>
論文地址:http://184pc128.csie.ntnu.edu.tw/presentation/18-03-13/Micro%20Behaviors%20A%20New%20Perspective%20in%20Ecommerce%20Recommender%20Systems.pdf

摘要

現(xiàn)階段大部分傳統(tǒng)的推薦系統(tǒng)都側(cè)重于研究users與items之間的宏觀交互(Micro Interactions)讯赏,如消費(fèi)者的歷史點(diǎn)擊、購買等等冷尉。然而在這些宏觀行為下其實(shí)還存在著一些微觀行為(micro behaviors)漱挎。微觀行為主要分為三類:用戶如何定位到當(dāng)前商品;用戶對(duì)商品實(shí)施的具體行為(如用閱讀評(píng)論雀哨,加入購物車等等)以及用戶在商品上停留了多長時(shí)間磕谅。這些微小行為往往反映了用戶更深層次和更細(xì)粒度的興趣,對(duì)于提高推薦效果有重大的意義雾棺。然而現(xiàn)有的研究對(duì)于這類微觀行為的利用較為少見怜庸,本論文就針對(duì)以上提到的三種微觀行為進(jìn)行了研究,提出了一個(gè)對(duì)微觀行為進(jìn)行建模的推薦系統(tǒng)框架(RIB, Recommendation framework from the mIcro Behavior perspective).

1. 簡介

該論文中舉了如下的例子來說明用戶的微觀行為垢村,如圖1所示割疾。


圖1 用戶宏觀和微觀行為的例子

該圖展示了一個(gè)用戶在特定時(shí)間內(nèi)的足跡:

  • 首先該用戶通過搜索進(jìn)入了iPhone7的商品頁面,閱讀了產(chǎn)品的詳細(xì)信息和評(píng)論并加入了購物車嘉栓;
  • 然后又通過搜索進(jìn)入了iPhone6的商品頁面并閱讀了評(píng)論宏榕;
  • 接著又通過促銷頁面進(jìn)入了iPhone7商品頁并下了單;
  • 最后該用戶又從電商網(wǎng)站首頁進(jìn)入了Samsung Galaxy的商品頁侵佃。

圖1的上下兩部分分別展示了該用戶的宏觀行為和微觀行為麻昼,可以看出每個(gè)宏觀行為都是由一系列的微觀行為組成的。這些微觀行為體現(xiàn)了用戶的興趣強(qiáng)弱不同馋辈,例如用戶通過搜索頁面查看某商品抚芦,其興趣比通過主頁點(diǎn)擊查看商品更強(qiáng)。

2. 問題描述

假設(shè)P = \{p_1, p_2, ..., p_N\}, A = \{a_1, a_2, ..., a_M\}, D = \{d_1, d_2, ..., d_K\}分別是商品集合迈螟、用戶行為集合和停留時(shí)長集合叉抡。這里N商品池總數(shù),M是用戶可以采取的不同行為個(gè)數(shù)答毫,K是對(duì)停留時(shí)長進(jìn)行離散化之后的份數(shù)褥民。這樣一條樣本就可以由一個(gè)tuple(p_i, a_j, d_k)來表示,代表了該用戶在商品p_i上進(jìn)行了動(dòng)作a_j洗搂,并維持了d_k的時(shí)間消返。

在定義了樣本的數(shù)據(jù)結(jié)構(gòu)后载弄,推薦系統(tǒng)的任務(wù)就是利用用戶過往的行為來為其推薦下一個(gè)商品。

3. 微觀行為分析

3.1 微觀行為特征定義

論文采用了傳統(tǒng)的電商數(shù)據(jù)撵颊,將特征分為了以下幾個(gè)類型宇攻,如表1所示


表1 數(shù)據(jù)相關(guān)定義
  • Click Source(點(diǎn)擊源)
    用戶通過什么場景進(jìn)入到當(dāng)前的商品頁面,包括首頁(Home)倡勇,購物清單(ShopList) 逞刷,促銷(Sale),購物車(Cart)译隘,搜索列表(SearchList)等等。不同的點(diǎn)擊源代表了用戶興趣的強(qiáng)弱洛心,如通過首頁點(diǎn)擊的商品固耘,用戶往往只是想隨便看看;而通過搜索點(diǎn)擊的商品词身,用戶的購買意圖通常偏大厅目。
  • Browsing Module(瀏覽模塊)
    指用戶瀏覽了商品的哪一模塊,包括簡介(Brief Information)法严,評(píng)論(Detail_comments)损敷,商品參數(shù)(Detail_specifictaion),商品底部(Detail_bottom)等深啤。如果用戶只看了簡介拗馒,其購買意圖偏低;相反如果用戶閱讀了大量評(píng)論溯街,商品參數(shù)并滑到了商品底部诱桂,則其購買意圖更加強(qiáng)烈。
  • Cart and Order(加入購物車和下單)
    這兩者都是和購買強(qiáng)相關(guān)的特征呈昔。這里要注意商品性質(zhì)挥等,如果是消耗型商品如衛(wèi)生紙,食品等堤尾,用戶下單之后復(fù)購的概率更大肝劲;但如果是電子產(chǎn)品等則復(fù)購率較小。
  • Dwell time(停留時(shí)長)
    一般來說停留時(shí)間越長郭宝,用戶對(duì)該商品的興趣越大辞槐,越有可能發(fā)生購買行為。

3.2 微觀行為效用分析

本小節(jié)對(duì)于不同微觀行為見的關(guān)系進(jìn)行了數(shù)據(jù)分析粘室,結(jié)果如圖2-6所示催蝗。


圖2 下單 vs 其他微觀行為

圖3 點(diǎn)擊源 vs 瀏覽模塊

圖4 下單 vs 停留時(shí)長

圖5 停留時(shí)長 vs 點(diǎn)擊源

圖6 停留時(shí)長 vs 瀏覽模塊
  • Ordering
    為了研究下單與其他行為的關(guān)系,此處統(tǒng)計(jì)了轉(zhuǎn)化率和具體微觀行為見的關(guān)系育特,如圖2所示丙号。這里轉(zhuǎn)化率由式(1)計(jì)算先朦,即在該行為下的樣本中有多少是用戶最終購買的。
    Conversion\ rate = \frac{ \# \ behavior\ of\ a_i\ ended\ with\ ordering}{\# \ behaviors\ of\ a_i} \tag1
    統(tǒng)計(jì)結(jié)果如圖2和圖4所示犬缨。由圖2可以看到喳魏,“加入購物車(Cart)”這一行為對(duì)于轉(zhuǎn)化率的影響最大;除此之外怀薛,閱讀評(píng)論(Detail_comments)刺彩、閱讀參數(shù)(Detail_specification)、滑到商品底部(Detail_bottom)枝恋、通過購物車點(diǎn)擊商品(Cart2Product)以及通過促銷點(diǎn)擊商品(Sale2Product)這幾種行為對(duì)應(yīng)的轉(zhuǎn)化率也較高创倔,這也是符合我們直觀認(rèn)知的結(jié)果。
    圖4中焚碌,可以看到在一定范圍內(nèi)隨著停留時(shí)間的增加畦攘,轉(zhuǎn)化率也相應(yīng)增加;當(dāng)停留時(shí)長增加到一定范圍之外十电,轉(zhuǎn)化率會(huì)下降知押,這表明如果用戶在商品頁面停留過就其注意力和興趣可能會(huì)轉(zhuǎn)移到別處。
  • Dwell Time
    圖5中展示了停留時(shí)長與點(diǎn)擊來源(Click Source)的關(guān)系鹃骂√ǘⅲ可以看出沒停留時(shí)長與用戶的點(diǎn)擊來源也是相關(guān)的。例如用戶通過搜索發(fā)生的點(diǎn)擊畏线,其停留時(shí)長往往會(huì)更久静盅。圖6說明了停留時(shí)長與瀏覽模型(Browsing Module)之間的關(guān)系。停留時(shí)間越長寝殴,用戶越進(jìn)行閱讀評(píng)論等行為的可能性越大
  • Click Source
    圖3中給出了點(diǎn)擊來源和瀏覽模型間的關(guān)系温亲。與停留時(shí)長的結(jié)果類似,通過搜索發(fā)生的點(diǎn)擊行為杯矩,用戶產(chǎn)生閱讀評(píng)論栈虚、參數(shù)等行為的概率越高。

最后做個(gè)總結(jié):首先史隆,不同的微觀行為之間是相互關(guān)聯(lián)的魂务;然后不同的微觀行為是對(duì)于其他行為的影響是不同的。

4. RIB模型

模型結(jié)構(gòu)沒有特別創(chuàng)新的地方泌射,主要由Embedding Layer, RNN Layer, Attention Layer組成粘姜,如圖7所示。


圖7 模型結(jié)構(gòu)
  • Input Layer
    首先輸入數(shù)據(jù)由用戶un個(gè)微觀行為S_u=\{x_1, x_2, ..., x_n \}組成熔酷,這里每個(gè)x_i可以表示為
    x_t = (p_v, a_m, d_k)\tag2
    其中p_v, a_m, d_k都是one hot向量孤紧,作為embedding layer的輸入。
  • Embedidng Layer
    將輸入的用戶特征分別通過embedding操作轉(zhuǎn)化為低維向量拒秘,再將p_v, a_m, d_k轉(zhuǎn)化后的embedidng vector拼接起來作為后續(xù)的輸入号显。
  • RNN Layer
    論文中采用了GRU來刻畫用戶微觀行為序列的時(shí)序信息臭猜,具體過程就不展開了,有興趣的朋友可以參考論文4.2節(jié)押蚤。
  • Attention Layer
    這里使用了一個(gè)self attention結(jié)構(gòu)來刻畫不同微觀行為的作用蔑歌,同樣也不展開敘述。
  • Output Layer
    Loss函數(shù)選取了cross-entropy函數(shù)揽碘。

5. 總結(jié)

用戶的微觀行為往往可以更細(xì)致地刻畫用戶的興趣次屠。本論文總結(jié)了四種不同的微觀行為(點(diǎn)擊來源,瀏覽模塊雳刺,購物車&下單劫灶,停留時(shí)長),分析了它們的內(nèi)在聯(lián)系掖桦,并利用這些微觀行為構(gòu)建了基于embedding+RNN的推薦系統(tǒng)模型本昏。其中對(duì)于微觀序列的利用值得我們進(jìn)一步思考。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末滞详,一起剝皮案震驚了整個(gè)濱河市凛俱,隨后出現(xiàn)的幾起案子紊馏,更是在濱河造成了極大的恐慌料饥,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件朱监,死亡現(xiàn)場離奇詭異岸啡,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)赫编,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門巡蘸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人擂送,你說我怎么就攤上這事悦荒。” “怎么了嘹吨?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵搬味,是天一觀的道長。 經(jīng)常有香客問我蟀拷,道長碰纬,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任问芬,我火速辦了婚禮悦析,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘此衅。我一直安慰自己强戴,他們只是感情好亭螟,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著酌泰,像睡著了一般媒佣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上陵刹,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天默伍,我揣著相機(jī)與錄音,去河邊找鬼衰琐。 笑死也糊,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的羡宙。 我是一名探鬼主播狸剃,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼狗热!你這毒婦竟也來了钞馁?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤匿刮,失蹤者是張志新(化名)和其女友劉穎僧凰,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體熟丸,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡训措,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了光羞。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绩鸣。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖纱兑,靈堂內(nèi)的尸體忽然破棺而出呀闻,到底是詐尸還是另有隱情,我是刑警寧澤潜慎,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布捡多,位于F島的核電站,受9級(jí)特大地震影響勘纯,放射性物質(zhì)發(fā)生泄漏局服。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一驳遵、第九天 我趴在偏房一處隱蔽的房頂上張望淫奔。 院中可真熱鬧,春花似錦堤结、人聲如沸唆迁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽唐责。三九已至鳞溉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鼠哥,已是汗流浹背熟菲。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留朴恳,地道東北人抄罕。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像于颖,于是被迫代替她去往敵國和親呆贿。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355