導(dǎo)讀:由于移動(dòng)互聯(lián)網(wǎng)時(shí)代用戶每時(shí)每刻都會(huì)產(chǎn)生海量信息,伴隨著大數(shù)據(jù)技術(shù)的快速發(fā)展急灭,使得企業(yè)能夠迎合用戶的痛點(diǎn)峻村,分析用戶喜好,進(jìn)行商品推薦忧勿。推薦系統(tǒng)誕生的益處:從用戶角度杉女,推薦系統(tǒng)可以緩解信息過載帶來(lái)的時(shí)間成本;從企業(yè)角度鸳吸,可以幫助企業(yè)進(jìn)行精準(zhǔn)營(yíng)銷熏挎,解決長(zhǎng)尾營(yíng)銷,最大化收益晌砾。因此推薦系統(tǒng)的好壞對(duì)于互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō)至關(guān)重要坎拐。
本次分享主要是以電商平臺(tái)為例,從以下幾個(gè)方面對(duì)推薦系統(tǒng)進(jìn)行解構(gòu):
01
推薦概述
1. 工作思路
對(duì)于電商平臺(tái)來(lái)講养匈,一套完整的電商流程應(yīng)該包含以下完整流程:
推薦系統(tǒng)作為電商平臺(tái)的一個(gè)子系統(tǒng)哼勇,其價(jià)值體現(xiàn)在商品與用戶的匹配上,而匹配的效率與質(zhì)量對(duì)于電商平臺(tái)至關(guān)重要呕乎。
2. 推薦系統(tǒng)面臨的挑戰(zhàn)
多場(chǎng)景积担、多目標(biāo)、考慮生態(tài)猬仁、場(chǎng)景間目標(biāo)的差異
電商推薦系統(tǒng)的優(yōu)化往往是多目標(biāo)的帝璧,這個(gè)體現(xiàn)在場(chǎng)景和優(yōu)化時(shí)效維度;在不同場(chǎng)景間湿刽, 推薦系統(tǒng)的目標(biāo)側(cè)重點(diǎn)也是不一樣的的烁,比如有的目標(biāo)是提高用戶在頁(yè)面的停留時(shí)間,有的是提高用戶短時(shí)間內(nèi)的消費(fèi)诈闺,比如猜你喜歡渴庆、購(gòu)物車、商品詳情頁(yè)的推薦坑位买雾。而從優(yōu)化的時(shí)效維度來(lái)看把曼,比如從短期來(lái)講,目標(biāo)有點(diǎn)擊率漓穿、轉(zhuǎn)化率和客單價(jià)等嗤军,從長(zhǎng)期來(lái)講,目標(biāo)需要考慮留存晃危、復(fù)購(gòu)等指標(biāo)叙赚。不僅如此,電商平臺(tái)需要兼顧用戶僚饭、商家震叮、平臺(tái)三者的利益,構(gòu)建長(zhǎng)期健康的生態(tài)鳍鸵。由于電商業(yè)務(wù)的購(gòu)物鏈路較長(zhǎng)苇瓣,往往用戶需要先瀏覽、點(diǎn)擊偿乖、加購(gòu)击罪、下單哲嘲、支付、履約配送媳禁、收貨眠副、評(píng)價(jià)/退貨等環(huán)節(jié)構(gòu)成,所以推薦系統(tǒng)往往需要將各個(gè)環(huán)節(jié)納入其中竣稽。當(dāng)然在其它業(yè)務(wù)類型的推薦系統(tǒng)中囱怕,也存在著鏈路長(zhǎng)的挑戰(zhàn)。如招聘行業(yè)的推薦系統(tǒng)毫别,給候選人推薦合適工作只是第一步娃弓,后面還會(huì)伴隨著長(zhǎng)時(shí)間的簡(jiǎn)歷投遞,招聘人員的審核和邀請(qǐng)岛宦,參加面試忘闻,最終入職或者進(jìn)行下一家的應(yīng)聘。社交場(chǎng)景也類似恋博,這種推薦系統(tǒng)存在這雙向匹配,比電商平臺(tái)的單項(xiàng)匹配鏈路更長(zhǎng)私恬,挑戰(zhàn)也更大债沮。
數(shù)據(jù)閉環(huán)
對(duì)于電商企業(yè)來(lái)說(shuō),數(shù)據(jù)是核心本鸣,是驅(qū)動(dòng)業(yè)務(wù)迭代的關(guān)鍵點(diǎn)疫衩,從用戶、商品荣德、商家維度闷煤,需要持續(xù)積累和采集。從用戶的角度涮瞻,存在瀏覽鲤拿、點(diǎn)擊、成交署咽、評(píng)價(jià)近顷、物流全鏈路閉環(huán)數(shù)據(jù)。從商品角度宁否,有潛力窒升、新品、老品慕匠、衰落饱须、下架等信息。從商家角度台谊,也有價(jià)值蓉媳、非價(jià)值和灰黑商家等譬挚。
3. 推薦系統(tǒng)中的關(guān)鍵因素建模
我們以電商推薦場(chǎng)景為例,用戶的行為旅程包括瀏覽督怜、點(diǎn)擊殴瘦、加購(gòu)、購(gòu)買以及長(zhǎng)期的復(fù)購(gòu)行為号杠,大致可以由下圖表示:
推薦系統(tǒng)首先需要在點(diǎn)擊(也即流量的轉(zhuǎn)化)這一環(huán)節(jié)進(jìn)行建模蚪腋,引導(dǎo)用戶進(jìn)入商品詳情頁(yè),同時(shí)對(duì)詳情頁(yè)的加購(gòu)/購(gòu)買建模姨蟋,依次引導(dǎo)后續(xù)行為屉凯。
另一個(gè)角度,從上面PPT下半部分的公式出發(fā)眼溶,產(chǎn)品運(yùn)營(yíng)可以被結(jié)構(gòu)為以上三個(gè)模塊悠砚,流量、轉(zhuǎn)化堂飞、x因素(回訪灌旧、復(fù)購(gòu))等;長(zhǎng)期來(lái)講绰筛, X因素非常關(guān)鍵枢泰,即復(fù)購(gòu)回訪的長(zhǎng)期價(jià)值,只有長(zhǎng)期生命周期價(jià)值高才能給企業(yè)帶來(lái)持久收益(n為時(shí)間/天铝噩,x的少許增長(zhǎng)可以帶來(lái)長(zhǎng)期巨大復(fù)利)衡蚂。
結(jié)合上述用戶旅程和公式拆解,如果想將V做大骏庸,自然的毛甲,我們需要構(gòu)建轉(zhuǎn)化率-訪購(gòu)率-毛GMV-凈GMV-留存率-復(fù)購(gòu)等關(guān)鍵節(jié)點(diǎn)的建模,并且這個(gè)也是推薦系統(tǒng)的觀測(cè)指標(biāo)具被。
在系統(tǒng)更大維度玻募,我們需要關(guān)注長(zhǎng)短期收益、用戶/商家個(gè)體滿意度和總體滿意度以及興趣探索成本一姿、流量效率與商品/商家成長(zhǎng)等維度补箍。
02
推薦系統(tǒng)拆解
1. 基本架構(gòu)
我這里拿一個(gè)前幾年我剛開始入門推薦系統(tǒng)時(shí)候的架構(gòu):
最開始的階段是召回過程,分為多個(gè)模塊啸蜜;實(shí)時(shí)模塊會(huì)拿到用戶實(shí)時(shí)的信息坑雅,比如用戶實(shí)時(shí)點(diǎn)擊、收藏衬横、加購(gòu)的商品裹粤,并獲取這些商品的相似商品;歷史模塊會(huì)獲取用戶的歷史信息,如歷史的購(gòu)買行為遥诉;畫像模塊則會(huì)獲取用戶的靜態(tài)信息和偏好標(biāo)簽拇泣,如用戶的設(shè)備型號(hào)、年齡矮锈、性別霉翔、類目偏好等;最后還會(huì)包括現(xiàn)在以及過去的熱門商品等苞笨。
在經(jīng)過這些召回的過程后债朵,我們會(huì)進(jìn)行一層過濾。比如曝光過濾瀑凝,即某個(gè)類目已經(jīng)曝光了一定次數(shù)序芦,但是用戶都沒有點(diǎn)擊,隱式表明用戶不感興趣粤咪。還有用戶購(gòu)買過濾谚中,即已經(jīng)購(gòu)買過的短期內(nèi)不再推薦。同時(shí)還有購(gòu)買率過濾寥枝、性別過濾等等宪塔。
經(jīng)過過濾階段后,我們可以對(duì)過濾后的商品進(jìn)行一定的預(yù)估囊拜。如點(diǎn)擊率蝌麸、轉(zhuǎn)化率預(yù)估等。同時(shí)可以考慮單價(jià)艾疟,多樣性以及新品率等影響進(jìn)行排序。隨后我們可以通過規(guī)則或者模型敢辩,將這些粗排后的物品統(tǒng)一得分進(jìn)行融合蔽莱,最后再經(jīng)過精排階段給出最終得分,這個(gè)階段還會(huì)增加一些業(yè)務(wù)規(guī)則進(jìn)行強(qiáng)控戚长,比如考慮多樣性的打散盗冷、出于運(yùn)營(yíng)需求的置頂?shù)取?/p>
上述是大致推薦系統(tǒng)的簡(jiǎn)單介紹,不同的業(yè)務(wù)和團(tuán)隊(duì)同廉,在構(gòu)建過程中也存在模塊的差異仪糖,推薦系統(tǒng)沒有特別強(qiáng)的標(biāo)準(zhǔn)存在。
2. 召回策略
主要策略包括:
①實(shí)時(shí)行為召回:在線實(shí)時(shí)捕捉用戶對(duì)商品的點(diǎn)擊迫肖,收藏锅劝,加購(gòu),購(gòu)買等反饋行 為蟆湖,并召回相似商品故爵,迅速抓住用戶的短期購(gòu)物需求。
②歷史行為召回:離線分析用戶對(duì)商品的歷史點(diǎn)擊隅津,收藏诬垂,加購(gòu)劲室,購(gòu)買等反饋行為,并召回相似商品结窘,兼顧用戶的長(zhǎng)期購(gòu)物需求很洋。
③?profile召回:從性別,年齡段隧枫,設(shè)備等多個(gè)維度喉磁,在線和離線同時(shí)對(duì)用戶進(jìn)行
畫像,并召回相對(duì)應(yīng)的熱門商品悠垛。不要小看這個(gè)召回线定,非常關(guān)鍵,往往新用戶需要用這些靜態(tài)信息和標(biāo)簽來(lái)做召回确买,往往可以快速圈定其圈層進(jìn)行精準(zhǔn)的探索和數(shù)據(jù)反饋斤讥,比如5-6線城市和北京西二旗的用戶往往大概率興趣差異較大。這層召回是全局熱門召回的更精細(xì)化拆解湾趾。
④?熱銷&趨勢(shì)召回:分析商品的長(zhǎng)期和短期銷量變化芭商,召回爆款和近期熱點(diǎn)商品。
召回模塊特別重要搀缠,因?yàn)檎倩氐膩?lái)源/相似分可以作為排序特征(推薦日志落盤-回看/溯源機(jī)制)
召回作為漏斗的頂部铛楣,好壞對(duì)漏斗底部(排序)的影響很大。
3. 排序策略
排序階段的影響因子較多艺普,可以作為特征簸州,也可以獨(dú)立在外作為排序因子存在。比如以下的一些因子:Ctr Cvr Price歧譬、Ctr Ts岸浑、Match Score、Trigger score time decay瑰步、Match type ctr cvr矢洲、Match type score、...
當(dāng)然針對(duì)不同的產(chǎn)品有不同的側(cè)重點(diǎn)缩焦,比如電商的內(nèi)容差異較大读虏,甚至同是內(nèi)容也會(huì)因?yàn)楫a(chǎn)品形態(tài)存在差異,比如快手的雙列可以考慮點(diǎn)擊率建模袁滥,而抖音單列下滑不需要考慮點(diǎn)擊率建模盖桥。甚至還需要考慮多樣性,驚喜性题翻,新穎性等更多的指標(biāo)葱轩。并且建模過程可以嘗試end2end或單獨(dú)建模的方式,這里面需要考慮的是稀疏性、正負(fù)比例靴拱、預(yù)估不準(zhǔn)等問題垃喊。
如果一個(gè)指標(biāo)不夠,還可以考慮多個(gè)指標(biāo)的結(jié)合袜炕,形成新的指標(biāo)本谜。如電商場(chǎng)景下,gmv這個(gè)指標(biāo)偎窘,可以用CTRα*CVRβ*Priceγ代表gmv乌助,那為什么還需要α、β陌知、γ呢他托?因?yàn)槿绻鹀tr和cvr估計(jì)是準(zhǔn)確的, α仆葡、β赏参、γ均為1的排序公式是可解釋的,你把這幾個(gè)指標(biāo)的分子分母拆開就看到了沿盅,相乘以后就是gmv把篓。但是由于模型各自的準(zhǔn)確率差異,導(dǎo)致了我們需要學(xué)習(xí)這幾個(gè)參數(shù)腰涧,理論上建模越準(zhǔn)確的指標(biāo)系數(shù)越大韧掩。而這三個(gè)系數(shù)如果相對(duì)穩(wěn)定可以通過離線統(tǒng)一參數(shù)學(xué)習(xí)的情況完成;如果不穩(wěn)定窖铡,可通過強(qiáng)化學(xué)習(xí)來(lái)解決這個(gè)超參的設(shè)定疗锐。
可參看下圖的電商場(chǎng)景建模的相關(guān)排序因子,當(dāng)然部分因子作為特征可納入排序模型费彼。
4. 排序階段還有一些常見的原則
① 針對(duì)不同的召回策略滑臊,主要秉持“短期行為優(yōu)先,兼顧長(zhǎng)期行為”敌买,“保證多樣性,避免過度個(gè)性化”原則阶界。算法上主要通過長(zhǎng)短期用戶行為密度建模虹钮,正負(fù)反饋反向調(diào)節(jié)等手段來(lái)實(shí)現(xiàn)。
② 不同排序因子(商家質(zhì)量/分發(fā)寬度及強(qiáng)度等等)可共用一套底層表征膘融。
③ 覆蓋率:通過類目芙粱,品牌,頻道氧映,場(chǎng)景等多粒度的打散重排春畔,最大化各個(gè)維度的個(gè)性化覆蓋率。
④ 疲勞度:通過引入一定的隨機(jī)因子,針對(duì)不同個(gè)性化程度律姨,建立合理的輪轉(zhuǎn)機(jī)制振峻,保證一定的新穎性。
⑤ 轉(zhuǎn)化能力:通過對(duì)用戶择份,商品扣孟,會(huì)場(chǎng)等多維度采集特征數(shù)據(jù),訓(xùn)練點(diǎn)擊轉(zhuǎn)化和交易轉(zhuǎn)化模型荣赶。大促期間 根據(jù)不同的階段凤价,采取差異化的處理策略。比如預(yù)熱期強(qiáng)化點(diǎn)擊轉(zhuǎn)化拔创,正式售賣期則強(qiáng)調(diào)交易轉(zhuǎn)化利诺。
5. 更加精細(xì)化的排序
① 考慮到召回和排序的壓力,可以再精排和召回中間加一層剩燥,少量核心特征+簡(jiǎn)單模型進(jìn)行粗排慢逾。
② 多過程建模:如直接購(gòu)買還是收藏比價(jià)使用模型判斷。舉個(gè)例子躏吊,在購(gòu)物車推薦中氛改,用模型來(lái)操控推薦策略。在購(gòu)物的流程中比伏,通過數(shù)據(jù)分析可以發(fā)現(xiàn)胜卤,有一部分用戶是希望通過加入購(gòu)物車來(lái)進(jìn)行比價(jià), 還有一部分用戶加入購(gòu)物車是直接購(gòu)買赁项。通過模型來(lái)判斷用戶的行為葛躏,比如用戶一直添加同類目的商品,那么比價(jià)的概率就高一些悠菜。如果判斷出用戶是直接購(gòu)買舰攒,那么就盡量推薦相關(guān)商品,如果是比價(jià)用戶悔醋,就推薦相似物品摩窃。
③ 粗粒度召回:離線產(chǎn)出不同類目下的精品數(shù)據(jù),作為召回補(bǔ)充和兜底
④ E&E探索解決低置信度預(yù)估模型問題
6. 模型演進(jìn)
模型的演進(jìn)路線可以由下圖表示:
而模型的時(shí)效性也從天級(jí)別芬骄,慢慢演化成小時(shí)(一天幾次)猾愿, 再演化成近實(shí)時(shí)級(jí)別,而目前主流的推薦系統(tǒng)都是實(shí)時(shí)級(jí)別账阻。
目前模型的演進(jìn)已經(jīng)進(jìn)入到深度學(xué)習(xí)時(shí)代蒂秘,各個(gè)大廠提出的新的深度學(xué)習(xí)架構(gòu)也層出不窮:
這里不對(duì)于模型具體結(jié)構(gòu)過過多展開,主要趨勢(shì)就是通過時(shí)序淘太、行為特征的使用姻僧,通過embedding规丽、LSTM、attention撇贺、tansformor等結(jié)構(gòu)提取特征信息赌莺,擬合用戶興趣,提高預(yù)測(cè)精度显熏。
7. 特征構(gòu)建
這里主要解構(gòu)一下電商推薦系統(tǒng)中特征的構(gòu)建方式:
初級(jí)的方式雄嚣,一般大家會(huì)對(duì)用戶和商品進(jìn)行一些用戶畫像,然后作為特征加入模型喘蟆。但是長(zhǎng)期來(lái)看缓升,匹配類的特征非常重要,比如待排序的商品和用戶歷史行為的一個(gè)關(guān)系蕴轨,上面提到的模型中港谊,DIN和DIEN都很好的使用了這種行為序列。匹配特征一般是與點(diǎn)擊特征結(jié)合在一起的橙弱,比如用戶對(duì)于某個(gè)商品的點(diǎn)擊歧寺,對(duì)于某個(gè)類別的點(diǎn)擊,某類用戶對(duì)于商品的點(diǎn)擊等等棘脐⌒笨穑可以總結(jié)為下圖:
8. 評(píng)估方式
針對(duì)于召回的評(píng)估方式,絕大部分都是通過命中率蛀缝、準(zhǔn)確率顷链、覆蓋率、F1-score等方式評(píng)估屈梁,參考下圖:
但是因?yàn)橥扑]系統(tǒng)是串聯(lián)的嗤练,我們往往需要考慮到前置模塊對(duì)后置模塊的影響,比如召回對(duì)于排序的影響在讶,下圖是LinkedIn的方式煞抬。
03
系統(tǒng)&全局生態(tài)
1. 推薦功能決策鏈路
做一個(gè)推薦功能之前,我們需要對(duì)這個(gè)產(chǎn)品功能的作用進(jìn)行一定的決策构哺,如:
推薦功能對(duì)該產(chǎn)品有無(wú)價(jià)值 ( 可以 )
價(jià)值多大 ( 值得 )
成本和收益 ( 現(xiàn)在 )
優(yōu)先級(jí) ( 怎樣 )
同時(shí)還要對(duì)推薦功能的工程上的要求進(jìn)行決策革答,如推薦系統(tǒng)的實(shí)時(shí)性做到毫秒級(jí)是否有必要。是否是毫秒級(jí)曙强,應(yīng)該以用戶的使用習(xí)慣來(lái)決定残拐,如80%的用戶其實(shí)都是秒級(jí)需求,沒有必要做到毫秒級(jí)的響應(yīng)旗扑。
2. 場(chǎng)景串聯(lián)與用戶旅程
不同的場(chǎng)景需要兼顧業(yè)務(wù)定位蹦骑,進(jìn)行場(chǎng)景間差異化慈省。場(chǎng)景單獨(dú)優(yōu)化時(shí)往往召回臀防、排序策略會(huì)趨同眠菇,帶來(lái)局部增益與全局增益最優(yōu)的沖突,解法往往是產(chǎn)品業(yè)務(wù)層的干預(yù)與算法場(chǎng)景通信兩種手段袱衷。
3. 方向&外圍
從系統(tǒng)和生態(tài)全局來(lái)看捎废,建設(shè)推薦系統(tǒng)既要考慮短期的gmv等指標(biāo),更要考慮長(zhǎng)期的發(fā)展 ( 回訪致燥、復(fù)購(gòu)登疗、netGMV ) 。因此需要從更多的層面考慮推薦系統(tǒng)的建設(shè)嫌蚤,如:
①?供應(yīng)商辐益、seller等級(jí)建設(shè),流量分配脱吱,運(yùn)營(yíng)機(jī)制智政。對(duì)于高登記的seller需要有更好的流量,但是對(duì)于等級(jí)較低的seller,也應(yīng)該分配流量箱蝠,幫助其提高等級(jí)续捂。
②商品理解&建設(shè): 良好的后備力量。每個(gè)商品都有生命周期宦搬,雖然可能舊款的商品質(zhì)量很高牙瓢,但是我們?cè)谕扑]的時(shí)候也要對(duì)新品進(jìn)行流量分配,進(jìn)行新品測(cè)試间校、流量扶持矾克。
③?智能投放: 低延時(shí)、高效率展現(xiàn)撇簿。在考慮商品的流量分配時(shí)聂渊,還需要對(duì)用戶的意圖、興趣四瘫、負(fù)反饋汉嗽、視覺窄化進(jìn)行考慮,不能不顧用戶的體驗(yàn)找蜜。
④?生態(tài)多目標(biāo)饼暑,包括用戶體驗(yàn),如回訪洗做、活躍度弓叛、復(fù)購(gòu)率、分群傾斜等诚纸,也包括商家層級(jí)撰筷、價(jià)值、收益畦徘、良性競(jìng)爭(zhēng)等目標(biāo)毕籽,同時(shí)還需兼顧平臺(tái)收益抬闯。在增長(zhǎng)過程中,一定需要兼顧上述若干指標(biāo)关筒,若置之不理溶握,則最終用戶、商家都會(huì)流失蒸播,最終讓產(chǎn)品僵化睡榆。
4.?生態(tài)多目標(biāo)
從推薦系統(tǒng)的構(gòu)建之初,我們就需要從以下角度去關(guān)注系統(tǒng)袍榆,設(shè)定合理的目標(biāo)和觀測(cè)指標(biāo)胀屿。不能什么都是先污染后治理,兩眼一抹黑包雀。在增長(zhǎng)過程中碉纳,一定需要兼顧上述若干指標(biāo),若置之不理馏艾,則最終用戶劳曹、商家都會(huì)流失,最終使產(chǎn)品僵化琅摩。從用戶體驗(yàn)角度铁孵,我們需要關(guān)注回訪、活躍度房资、復(fù)購(gòu)率蜕劝、分群傾斜等;從商家角度轰异,需要考慮商家層級(jí)岖沛、價(jià)值、收益搭独、良性競(jìng)爭(zhēng)婴削;最后我們還需要關(guān)注平臺(tái)收益。
04
話題探討
下面我們?cè)谥饌€(gè)結(jié)合業(yè)務(wù)展開一些相關(guān)探討牙肝,這些探討想要讓大家了解到推薦系統(tǒng)構(gòu)建過程中唉俗,對(duì)業(yè)務(wù)拆解的重要性。
1. 分群
根據(jù)用戶的活躍度及行為密度進(jìn)行分群配椭,并對(duì)分群后的用戶投放對(duì)應(yīng)的熱銷進(jìn)行兜底補(bǔ)足虫溜,或者作為主召回源。其中用戶行為較多(交互過的物料個(gè)數(shù)和品類/主題較多)時(shí)股缸,作為兜底召回做補(bǔ)足衡楞;而部分用戶行為過少(新用戶或剛進(jìn)入APP行為數(shù)較少的),可以作為主召回策略敦姻,這時(shí)候可以做更精細(xì)化地?cái)?shù)據(jù)集瘾境。
比如針對(duì)國(guó)家/地區(qū)坎背、性別、設(shè)備這些新用戶也可收集的靜態(tài)標(biāo)簽分別做熱銷數(shù)據(jù)寄雀;比如印度、男性陨献、IOS 的用戶A和印度盒犹、女性、Android用戶B眨业,使用的熱銷列表是不一樣的急膀。其實(shí)其它分群策略也非常有用,比如購(gòu)買力分群龄捡、興趣分群卓嫂;群體對(duì)類目的強(qiáng)偏好和弱偏好均可以在推薦中使用。強(qiáng)偏好基本就是喜歡看聘殖、喜歡買什么品類就具有這類偏好晨雳;弱偏好就是某類人群從來(lái)不會(huì)交互或者交互過低的類目,利用統(tǒng)計(jì)概率進(jìn)行顯著性檢驗(yàn)奸腺,可以挑出群體顯著不關(guān)心的品類餐禁,在推薦過程中少推薦或不推薦。
2. 電商同店鋪用戶行為
做一下分析突照,看一下進(jìn)入店鋪?lái)?yè)的用戶后續(xù)的行為帮非,可以酌情加重同店鋪商品trigger的權(quán)重(實(shí)時(shí)獲取)讹蘑,往往很多店鋪有包郵門檻末盔,這時(shí)候同店鋪召回是滿足包郵訴求。
同店x2i(i2i座慰、c2i陨舱、b2i等)可以做一個(gè)很好的實(shí)時(shí)上下文強(qiáng)化,這里trigger數(shù)量和召回?cái)?shù)量都需要進(jìn)行控制版仔。
考慮在rank的時(shí)候?qū)γ總€(gè)召回源和召回分?jǐn)?shù)進(jìn)行埋點(diǎn)隅忿,在訓(xùn)練模型是考慮進(jìn)行,這樣就可以進(jìn)行很好的多召回源融合邦尊,當(dāng)然這個(gè)不是同店的情形也可以用背桐。
3. 購(gòu)物車推薦策略
在購(gòu)物車場(chǎng)景,通過數(shù)據(jù)分析你會(huì)發(fā)現(xiàn)用戶加購(gòu)商品基本有2種用戶蝉揍,一種是對(duì)比链峭,另一種是馬上要買了再湊個(gè)單。這時(shí)候引入意圖建模又沾,通過實(shí)時(shí)的數(shù)據(jù)收集弊仪,對(duì)于用戶加入購(gòu)物車的商品進(jìn)行意圖預(yù)測(cè)熙卡,然后在i2i召回策略中使用不同的召回控制,比如召回相似和相關(guān)搭配励饵。
這里推薦的策略可以考慮用加權(quán)融合的方式驳癌,對(duì)于相似和相關(guān)搭配召回源,根據(jù)預(yù)測(cè)的意圖強(qiáng)弱進(jìn)行比例調(diào)整役听;如果有埋點(diǎn)支持颓鲜,還可以結(jié)合實(shí)時(shí)埋點(diǎn),在排序?qū)涌紤]上述融合典予。
05
總結(jié)
需要明確的是甜滨,業(yè)務(wù)效果好的并不一定是復(fù)雜算法, 建立推薦系統(tǒng)需要遵循“假設(shè)->分析->策略->效果”的流程。在出現(xiàn)的badcase中瘤袖,需要回顧案發(fā)現(xiàn)場(chǎng)衣摩,在產(chǎn)品增加埋點(diǎn),跟著數(shù)據(jù)走(實(shí)時(shí)) 捂敌。迭代模型需要跟著業(yè)務(wù)走艾扮,在badcase中發(fā)現(xiàn)新的思路。系統(tǒng)化地思考全局收益占婉、場(chǎng)景串聯(lián)栏渺、局部與全局最優(yōu)的情況。最重要的是合理的指標(biāo)锐涯,從健康生態(tài)系統(tǒng)的定義出發(fā)磕诊。以上就是此次分享的主要內(nèi)容,謝謝大家閱讀纹腌。