業(yè)內(nèi)人士都清楚特征工程在推薦系統(tǒng)中的重要性。要想開發(fā)出高質(zhì)量的特征霹肝,必須要弄清楚其來源,用處塑煎,對(duì)用戶的刻畫等等方面沫换。這篇文章對(duì)于微觀行為特征的數(shù)據(jù)分析很詳細(xì),值得借鑒最铁。
論文題目:<<Micro Behaviors: A New Perspective in E-commerce
Recommender Systems>>
論文地址:http://184pc128.csie.ntnu.edu.tw/presentation/18-03-13/Micro%20Behaviors%20A%20New%20Perspective%20in%20Ecommerce%20Recommender%20Systems.pdf
摘要
現(xiàn)階段大部分傳統(tǒng)的推薦系統(tǒng)都側(cè)重于研究users與items之間的宏觀交互(Micro Interactions)讯赏,如消費(fèi)者的歷史點(diǎn)擊、購買等等冷尉。然而在這些宏觀行為下其實(shí)還存在著一些微觀行為(micro behaviors)漱挎。微觀行為主要分為三類:用戶如何定位到當(dāng)前商品;用戶對(duì)商品實(shí)施的具體行為(如用閱讀評(píng)論雀哨,加入購物車等等)以及用戶在商品上停留了多長時(shí)間磕谅。這些微小行為往往反映了用戶更深層次和更細(xì)粒度的興趣,對(duì)于提高推薦效果有重大的意義雾棺。然而現(xiàn)有的研究對(duì)于這類微觀行為的利用較為少見怜庸,本論文就針對(duì)以上提到的三種微觀行為進(jìn)行了研究,提出了一個(gè)對(duì)微觀行為進(jìn)行建模的推薦系統(tǒng)框架(RIB, Recommendation framework from the mIcro Behavior perspective).
1. 簡介
該論文中舉了如下的例子來說明用戶的微觀行為垢村,如圖1所示割疾。
該圖展示了一個(gè)用戶在特定時(shí)間內(nèi)的足跡:
- 首先該用戶通過搜索進(jìn)入了iPhone7的商品頁面,閱讀了產(chǎn)品的詳細(xì)信息和評(píng)論并加入了購物車嘉栓;
- 然后又通過搜索進(jìn)入了iPhone6的商品頁面并閱讀了評(píng)論宏榕;
- 接著又通過促銷頁面進(jìn)入了iPhone7商品頁并下了單;
- 最后該用戶又從電商網(wǎng)站首頁進(jìn)入了Samsung Galaxy的商品頁侵佃。
圖1的上下兩部分分別展示了該用戶的宏觀行為和微觀行為麻昼,可以看出每個(gè)宏觀行為都是由一系列的微觀行為組成的。這些微觀行為體現(xiàn)了用戶的興趣強(qiáng)弱不同馋辈,例如用戶通過搜索頁面查看某商品抚芦,其興趣比通過主頁點(diǎn)擊查看商品更強(qiáng)。
2. 問題描述
假設(shè)分別是商品集合迈螟、用戶行為集合和停留時(shí)長集合叉抡。這里
商品池總數(shù),
是用戶可以采取的不同行為個(gè)數(shù)答毫,
是對(duì)停留時(shí)長進(jìn)行離散化之后的份數(shù)褥民。這樣一條樣本就可以由一個(gè)tuple
來表示,代表了該用戶在商品
上進(jìn)行了動(dòng)作
洗搂,并維持了
的時(shí)間消返。
在定義了樣本的數(shù)據(jù)結(jié)構(gòu)后载弄,推薦系統(tǒng)的任務(wù)就是利用用戶過往的行為來為其推薦下一個(gè)商品。
3. 微觀行為分析
3.1 微觀行為特征定義
論文采用了傳統(tǒng)的電商數(shù)據(jù)撵颊,將特征分為了以下幾個(gè)類型宇攻,如表1所示
-
Click Source(點(diǎn)擊源)
用戶通過什么場景進(jìn)入到當(dāng)前的商品頁面,包括首頁(Home)倡勇,購物清單(ShopList) 逞刷,促銷(Sale),購物車(Cart)译隘,搜索列表(SearchList)等等。不同的點(diǎn)擊源代表了用戶興趣的強(qiáng)弱洛心,如通過首頁點(diǎn)擊的商品固耘,用戶往往只是想隨便看看;而通過搜索點(diǎn)擊的商品词身,用戶的購買意圖通常偏大厅目。 -
Browsing Module(瀏覽模塊)
指用戶瀏覽了商品的哪一模塊,包括簡介(Brief Information)法严,評(píng)論(Detail_comments)损敷,商品參數(shù)(Detail_specifictaion),商品底部(Detail_bottom)等深啤。如果用戶只看了簡介拗馒,其購買意圖偏低;相反如果用戶閱讀了大量評(píng)論溯街,商品參數(shù)并滑到了商品底部诱桂,則其購買意圖更加強(qiáng)烈。 -
Cart and Order(加入購物車和下單)
這兩者都是和購買強(qiáng)相關(guān)的特征呈昔。這里要注意商品性質(zhì)挥等,如果是消耗型商品如衛(wèi)生紙,食品等堤尾,用戶下單之后復(fù)購的概率更大肝劲;但如果是電子產(chǎn)品等則復(fù)購率較小。 -
Dwell time(停留時(shí)長)
一般來說停留時(shí)間越長郭宝,用戶對(duì)該商品的興趣越大辞槐,越有可能發(fā)生購買行為。
3.2 微觀行為效用分析
本小節(jié)對(duì)于不同微觀行為見的關(guān)系進(jìn)行了數(shù)據(jù)分析粘室,結(jié)果如圖2-6所示催蝗。
-
Ordering
為了研究下單與其他行為的關(guān)系,此處統(tǒng)計(jì)了轉(zhuǎn)化率和具體微觀行為見的關(guān)系育特,如圖2所示丙号。這里轉(zhuǎn)化率由式(1)計(jì)算先朦,即在該行為下的樣本中有多少是用戶最終購買的。
統(tǒng)計(jì)結(jié)果如圖2和圖4所示犬缨。由圖2可以看到喳魏,“加入購物車(Cart)”這一行為對(duì)于轉(zhuǎn)化率的影響最大;除此之外怀薛,閱讀評(píng)論(Detail_comments)刺彩、閱讀參數(shù)(Detail_specification)、滑到商品底部(Detail_bottom)枝恋、通過購物車點(diǎn)擊商品(Cart2Product)以及通過促銷點(diǎn)擊商品(Sale2Product)這幾種行為對(duì)應(yīng)的轉(zhuǎn)化率也較高创倔,這也是符合我們直觀認(rèn)知的結(jié)果。
圖4中焚碌,可以看到在一定范圍內(nèi)隨著停留時(shí)間的增加畦攘,轉(zhuǎn)化率也相應(yīng)增加;當(dāng)停留時(shí)長增加到一定范圍之外十电,轉(zhuǎn)化率會(huì)下降知押,這表明如果用戶在商品頁面停留過就其注意力和興趣可能會(huì)轉(zhuǎn)移到別處。 -
Dwell Time
圖5中展示了停留時(shí)長與點(diǎn)擊來源(Click Source)的關(guān)系鹃骂√ǘⅲ可以看出沒停留時(shí)長與用戶的點(diǎn)擊來源也是相關(guān)的。例如用戶通過搜索發(fā)生的點(diǎn)擊畏线,其停留時(shí)長往往會(huì)更久静盅。圖6說明了停留時(shí)長與瀏覽模型(Browsing Module)之間的關(guān)系。停留時(shí)間越長寝殴,用戶越進(jìn)行閱讀評(píng)論等行為的可能性越大 -
Click Source
圖3中給出了點(diǎn)擊來源和瀏覽模型間的關(guān)系温亲。與停留時(shí)長的結(jié)果類似,通過搜索發(fā)生的點(diǎn)擊行為杯矩,用戶產(chǎn)生閱讀評(píng)論栈虚、參數(shù)等行為的概率越高。
最后做個(gè)總結(jié):首先史隆,不同的微觀行為之間是相互關(guān)聯(lián)的魂务;然后不同的微觀行為是對(duì)于其他行為的影響是不同的。
4. RIB模型
模型結(jié)構(gòu)沒有特別創(chuàng)新的地方泌射,主要由Embedding Layer, RNN Layer, Attention Layer組成粘姜,如圖7所示。
-
Input Layer
首先輸入數(shù)據(jù)由用戶和
個(gè)微觀行為
組成熔酷,這里每個(gè)
可以表示為
其中都是one hot向量孤紧,作為embedding layer的輸入。
-
Embedidng Layer
將輸入的用戶特征分別通過embedding操作轉(zhuǎn)化為低維向量拒秘,再將轉(zhuǎn)化后的embedidng vector拼接起來作為后續(xù)的輸入号显。
-
RNN Layer
論文中采用了GRU來刻畫用戶微觀行為序列的時(shí)序信息臭猜,具體過程就不展開了,有興趣的朋友可以參考論文4.2節(jié)押蚤。 -
Attention Layer
這里使用了一個(gè)self attention結(jié)構(gòu)來刻畫不同微觀行為的作用蔑歌,同樣也不展開敘述。 -
Output Layer
Loss函數(shù)選取了cross-entropy函數(shù)揽碘。
5. 總結(jié)
用戶的微觀行為往往可以更細(xì)致地刻畫用戶的興趣次屠。本論文總結(jié)了四種不同的微觀行為(點(diǎn)擊來源,瀏覽模塊雳刺,購物車&下單劫灶,停留時(shí)長),分析了它們的內(nèi)在聯(lián)系掖桦,并利用這些微觀行為構(gòu)建了基于embedding+RNN的推薦系統(tǒng)模型本昏。其中對(duì)于微觀序列的利用值得我們進(jìn)一步思考。