用戶(hù)基本信息進(jìn)行推薦
有年齡评肆、性別损合、收入范圍、興趣愛(ài)好亲茅、星座回铛、生活區(qū)域等標(biāo)簽,那么標(biāo)簽完全相同的這一類(lèi)人就極有可能有相同的喜好(一般還會(huì)把行為加入一起來(lái)判斷相似性)比如一個(gè)用戶(hù)的標(biāo)簽組成為:20—35之間克锣、女性茵肃、低收入人群、愛(ài)寵人士袭祟、雙魚(yú)座……验残,最近剛好購(gòu)買(mǎi)了一袋X品牌的狗糧,那么則另外一個(gè)標(biāo)簽與她相符的人巾乳,也可能在某個(gè)時(shí)間段產(chǎn)生這個(gè)需求您没。
用戶(hù)行為數(shù)據(jù)進(jìn)行推薦
比如在電商的場(chǎng)景下,常見(jiàn)的用戶(hù)行為就會(huì)有瀏覽胆绊、搜索氨鹏、加購(gòu)、支付压状、評(píng)價(jià)仆抵、收藏、分享等等种冬,那么通過(guò)記錄這些用戶(hù)行為數(shù)據(jù)镣丑,我們就可以對(duì)應(yīng)進(jìn)行推薦了。
①基于搜索關(guān)鍵詞進(jìn)行推薦
對(duì)于一個(gè)新注冊(cè)的買(mǎi)家來(lái)購(gòu)物娱两,這時(shí)候大部分?jǐn)?shù)據(jù)都全無(wú)传轰,咋辦?因?yàn)檫@個(gè)買(mǎi)家除了具備一些基本的人群屬性外谷婆,購(gòu)物行為和購(gòu)物偏好方面是空的慨蛙。好,這時(shí)候我們可以根據(jù)他搜索的關(guān)鍵詞來(lái)進(jìn)行跟蹤推薦纪挎,依據(jù)搜索同樣關(guān)鍵詞的其他用戶(hù)最后達(dá)成的商品成交概率來(lái)進(jìn)行合理推薦期贫。
舉個(gè)例子:如連衣裙這個(gè)產(chǎn)品,在風(fēng)格上有韓版的异袄、歐美的通砍、田園風(fēng)格的等等。那么搜索引擎通過(guò)分析以前搜索“連衣裙”這個(gè)關(guān)鍵詞的其他消費(fèi)者烤蜕,發(fā)現(xiàn)70%以上的消費(fèi)者最終都購(gòu)買(mǎi)了“韓版”的封孙,那么韓版就是一個(gè)高概率成交風(fēng)格。所以讽营,展現(xiàn)這一類(lèi)型的商品在這個(gè)新用戶(hù)面前的虎忌。
②基于瀏覽記錄進(jìn)行推薦
對(duì)于淘寶這種大型系統(tǒng)來(lái)說(shuō),在整個(gè)網(wǎng)站中和app中的所有瀏覽記錄的時(shí)間脈絡(luò)橱鹏,它是全部有記錄膜蠢,完全能夠做到判斷你在何時(shí)看到什么商品,同時(shí)瀏覽的行為背后即代表這關(guān)注莉兰,表明用戶(hù)對(duì)此商品感興趣挑围,那么我們完全可以根據(jù)這一類(lèi)商品的相似度進(jìn)行關(guān)聯(lián)推薦,用戶(hù)所有瀏覽行為都是商品推薦的重要依據(jù)糖荒。
舉個(gè)例子:每次你搜索并且看完一些寶貝后杉辙,關(guān)閉淘寶,過(guò)一段時(shí)間再打開(kāi)淘寶捶朵,你就可以看到在“猜你喜歡”模塊中出現(xiàn)之前瀏覽過(guò)的同類(lèi)商品蜘矢。
③基于購(gòu)買(mǎi)記錄的推薦
其實(shí)這是很好理解的,因?yàn)槟阋呀?jīng)購(gòu)買(mǎi)了泉孩,所以這證明了你對(duì)產(chǎn)品的認(rèn)可硼端,甚至是對(duì)這個(gè)店鋪的認(rèn)可,尤其是在一些比如說(shuō)衣服寓搬、視頻珍昨、鞋子、寵物用品等復(fù)購(gòu)率較高的商品中句喷。如果你在這個(gè)店鋪里面買(mǎi)過(guò)镣典,那么你在搜索相關(guān)的關(guān)鍵詞的時(shí)候,這個(gè)店鋪符合要求的商品就會(huì)被優(yōu)先展現(xiàn)(尤其是新上架的商品)唾琼,方式是:購(gòu)買(mǎi)過(guò)的店鋪兄春。
舉個(gè)例子:淘寶中,你收藏的店鋪锡溯、瀏覽過(guò)的店鋪等等赶舆,都會(huì)以一種強(qiáng)個(gè)性化的方式得到優(yōu)先推薦哑姚,而且還會(huì)給你添上標(biāo)簽“購(gòu)買(mǎi)過(guò)的店鋪”。在絕大多數(shù)類(lèi)目里面芜茵,這種最高級(jí)別的推薦都是非常明顯的叙量。
喜好度評(píng)分、向量余弦公式
基于用戶(hù)的協(xié)同過(guò)濾(user-based CF)九串,通過(guò)用戶(hù)對(duì)不同類(lèi)型的商品的喜好度進(jìn)行評(píng)分绞佩,然后根據(jù)每類(lèi)商品的喜好度評(píng)分構(gòu)建一個(gè)多維向量,使用余弦公式有來(lái)評(píng)測(cè)用戶(hù)之間喜好度的相似性猪钮,基于此將其他相似用戶(hù)非常喜歡而該用戶(hù)還沒(méi)有了解的產(chǎn)品進(jìn)行推薦品山。這部分推薦本質(zhì)上是給用戶(hù)推薦其他相似用戶(hù)喜歡的內(nèi)容,一句話概括:和你類(lèi)似的人也喜歡這些商品烤低。
關(guān)于喜好度的計(jì)算肘交,先將用戶(hù)行為的權(quán)值定義清楚,假設(shè)定義如下:
搜索權(quán)值為1拂玻;
點(diǎn)擊流量權(quán)值為1酸些;
加購(gòu)權(quán)值為2;
咨詢(xún)權(quán)值為1檐蚜;
完成支付權(quán)值為3魄懂;
好評(píng)權(quán)值為2;
分享權(quán)值為3闯第;
那么在系統(tǒng)中加入埋點(diǎn)市栗,產(chǎn)生用戶(hù)行為數(shù)據(jù)之后,我們將可以獲得用戶(hù)關(guān)于某類(lèi)商品的喜好度具體分值咳短,加權(quán)平均后分值區(qū)間為【0,13】
在假設(shè)商城類(lèi)僅有5類(lèi)商品:
對(duì)食品類(lèi)目的商品喜好度(0~13分)
對(duì)家居類(lèi)目的商品喜好度(0~13分)
對(duì)玩具類(lèi)目的商品喜好度(0~13分)
對(duì)圖書(shū)類(lèi)目的商品喜好度(0~13分)
對(duì)游戲類(lèi)目的商品喜好度(0~13分)
一個(gè)用戶(hù)A:對(duì)食品的喜好度為3填帽,對(duì)家居的喜好度為1,對(duì)玩具的喜好度為4咙好,對(duì)圖書(shū)的喜好度為5篡腌,對(duì)游戲的喜好度為0,用戶(hù)A可以用向量表示為
一個(gè)用戶(hù)B:對(duì)食品的喜好度為3勾效,對(duì)家居的喜好度為4嘹悼,對(duì)玩具的喜好度為5层宫,對(duì)圖書(shū)的喜好度為0杨伙,對(duì)游戲的喜好度為2,用戶(hù)A可以用向量表示為
接下來(lái)就要使用的【余弦函數(shù)】了萌腿,這邊要和大家解釋一下向量的概念(可能很多人高中數(shù)學(xué)已經(jīng)忘記了)限匣,向量是空間中帶箭頭的線段,2個(gè)向量之間的夾角越小毁菱,表明它們的相似度越相近米死,多個(gè)屬性的向量表示為
锌历。
對(duì)于用戶(hù)A的對(duì)于所有類(lèi)目商品的喜好度向量
和用戶(hù)B的向量
而言,他們的在多維空間的夾角可以用向量余弦公式計(jì)算:
余弦值的值域在【-1,1】之間峦筒,0表示完全垂直90°辩涝,-1表示夾角180°,1表示夾角為0°勘天,系數(shù)越靠近1,向量夾角越小捉邢,兩件商品的相關(guān)性越高脯丝,。就剛才用戶(hù)A和用戶(hù)B的例子而言伏伐,我們可以知道他們的相似度為:
相似度系數(shù)推薦說(shuō)明:
非常相似:0.8—1.0宠进;
比較相似:0.6—0.8;
一般:0.4—0.6藐翎;
不太相似:? 0—0.4材蹬;
完全不相似:-1.0—0;
那么根據(jù)這個(gè)余弦值的結(jié)果吝镣,我們會(huì)發(fā)現(xiàn)用戶(hù)A和B在商品的喜好度上是比較相似的堤器,所以在給A推薦商品時(shí),我們就可以依照B喜歡的而A卻從未瀏覽過(guò)的商品進(jìn)行推薦末贾,或者是其他B喜歡的商品等闸溃。
總結(jié)
目前大部分推薦都是多重算法結(jié)合的,以上介紹為了邏輯清晰拱撵,所以都是單一說(shuō)明辉川,沒(méi)有進(jìn)行組合,而現(xiàn)實(shí)中可能會(huì)依據(jù)相同標(biāo)簽相似喜好度的人推薦同類(lèi)型的產(chǎn)品等拴测,接下來(lái)的【下篇】乓旗,我會(huì)重點(diǎn)為大家介紹關(guān)于區(qū)別于給用戶(hù)標(biāo)簽化的推薦方法,更高階的是給商品集索、服務(wù)屿愚、店鋪等全方位的標(biāo)簽化,同時(shí)還會(huì)介紹到標(biāo)簽的標(biāo)簽抄谐,比如標(biāo)簽的場(chǎng)景失效渺鹦,標(biāo)簽的熱度衰減等!