當(dāng)年打開(kāi)天貓的那一刻淘太,它為你完成了華麗的變身,成為世上獨(dú)一無(wú)二的“天貓”,這就是智能推薦的力量蒲牧。今天撇贺,來(lái)自阿里巴巴搜索推薦事業(yè)部的算法工程師陳啟偉為你介紹天貓如何玩轉(zhuǎn)首頁(yè)個(gè)性化推薦,揭開(kāi)搜索推薦的神秘面紗冰抢。
天貓首頁(yè)作為用戶打開(kāi)手機(jī)天貓App的第一印象松嘶,所推薦的商品極大地決定了用戶接下來(lái)的行為,對(duì)用戶流量的承接與分發(fā)挎扰、提升用戶購(gòu)物體驗(yàn)和呈現(xiàn)天貓貨品的性價(jià)比翠订、品質(zhì)感及品牌力起到至關(guān)重要的作用,成為提升天貓用戶體驗(yàn)的關(guān)鍵環(huán)節(jié)之一遵倦。
1尽超、場(chǎng)景介紹
天貓首頁(yè)的場(chǎng)景主要包括大促會(huì)場(chǎng)入口和日常頻道兩大類,如圖1所示梧躺。其中左圖為大促會(huì)場(chǎng)入口似谁,包括主會(huì)場(chǎng)入口和行業(yè)會(huì)場(chǎng)入口;主會(huì)場(chǎng)入口通過(guò)為用戶推薦7個(gè)商品(3個(gè)在中間動(dòng)態(tài)輪播)給大促主會(huì)場(chǎng)進(jìn)行引流掠哥,引流 UV 達(dá)數(shù)千萬(wàn)以上巩踏;行業(yè)會(huì)場(chǎng)入口通過(guò)為用戶推薦4個(gè)個(gè)性化會(huì)場(chǎng)和商品為數(shù)萬(wàn)的會(huì)場(chǎng)引流。右圖為日常頻道续搀,包括限時(shí)搶購(gòu)塞琼、天貓好物、聚劃算禁舷、天貓閃降和精選頻道彪杉;首頁(yè)通過(guò)個(gè)性化推薦商品為各個(gè)特色的頻道引流,通過(guò)各個(gè)頻道來(lái)培養(yǎng)用戶心智榛了,讓用戶在天貓逛起來(lái)在讶。
過(guò)去的首頁(yè)推薦更多的是在相關(guān)性推薦的單一數(shù)據(jù)目標(biāo)上進(jìn)行優(yōu)化,如今天貓首頁(yè)的推薦系統(tǒng)不僅僅考慮推薦結(jié)果的相關(guān)性霜大,還在推薦結(jié)果的發(fā)現(xiàn)性构哺、多樣性等方面上做了更深度的優(yōu)化,"效率和體驗(yàn)并重"成為天貓首頁(yè)新的優(yōu)化目標(biāo)战坤。Graph Embedding曙强、Transformer、深度學(xué)習(xí)途茫、知識(shí)圖譜等新的技術(shù)已先后在天貓首頁(yè)的推薦系統(tǒng)成功落地碟嘴,為場(chǎng)景帶來(lái)了兩位數(shù)的點(diǎn)擊率提升和兩位數(shù)的疲勞度下降。
2囊卜、推薦框架
天貓首頁(yè)的個(gè)性化推薦系統(tǒng)可以分為召回娜扇、排序和機(jī)制三個(gè)模塊错沃。其中,召回模塊主要是從全量的商品素材中檢索出用戶感興趣的 TopK 個(gè)候選商品雀瓢,排序模塊專注于用戶對(duì)商品的 CTR 預(yù)估枢析,機(jī)制模塊負(fù)責(zé)后期的流量調(diào)控、體驗(yàn)優(yōu)化刃麸、策略調(diào)控等和最終的商品排序醒叁。整個(gè)推薦系統(tǒng)采用 Graph Embedding、Transformer泊业、深度學(xué)習(xí)把沼、知識(shí)圖譜、用戶體驗(yàn)建模等新的技術(shù)構(gòu)建起來(lái)吁伺,后面章節(jié)將介紹這個(gè)推薦系統(tǒng)的關(guān)鍵技術(shù)點(diǎn)饮睬。
3、召回
3.1 Ranki2i
Item-CF 是目前應(yīng)用最廣泛的召回算法箱蝠,其原理是根據(jù)兩個(gè)商品被同時(shí)點(diǎn)擊的頻率來(lái)計(jì)算兩個(gè)商品之間的相似度 simScore续捂,得到 i2i 表垦垂;然后通過(guò)用戶的 trigger 去查詢 i2i 表宦搬,擴(kuò)展用戶感興趣的商品。Item-CF 的基本算法雖然簡(jiǎn)單劫拗,但是要獲得更好的效果间校,往往需要根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行調(diào)優(yōu)。清除爬蟲页慷、刷單等噪聲數(shù)據(jù)憔足,合理選擇計(jì)算商品之間相似度的數(shù)據(jù)的時(shí)間窗口,引入時(shí)間衰減酒繁,只考慮同一個(gè)類目下商品對(duì)滓彰,歸一化、截?cái)嘀萏弧⒋蛏⒌炔呗詫?duì)優(yōu)化 Item-CF 的效果都有很大的幫助揭绑。
Ranki2i 是一種改進(jìn)的 Item-CF 算法,其在 item-CF 得到的兩個(gè)商品之間的相似度 simScore 的基礎(chǔ)上再乘以該 trigger item 所召回的該 target item 在過(guò)去一段時(shí)間內(nèi)的 ctr (注意 ctr 的計(jì)算需要進(jìn)行適當(dāng)?shù)钠交?郎哭,對(duì) i2i 的 simScore 進(jìn)行修正他匪,使得 i2i 表不僅考慮了兩個(gè)商品的點(diǎn)擊共現(xiàn)性,還考慮了召回商品的點(diǎn)擊率夸研。
我們基于全網(wǎng)的點(diǎn)擊數(shù)據(jù)和天貓首頁(yè)場(chǎng)景內(nèi)的日志來(lái)計(jì)算 Ranki2i 表邦蜜,并部署在檢索系統(tǒng) Basic Engine 上,對(duì)每個(gè)訪問(wèn)天貓首頁(yè)的用戶亥至,從基礎(chǔ)特征服務(wù)系統(tǒng) ABFS 中獲取用戶的 trigger悼沈,并以此查詢 Ranki2i 表來(lái)召回用戶感興趣的商品贱迟。
經(jīng)典 Item-CF 類算法直接根據(jù)兩個(gè)商品被同時(shí)點(diǎn)擊的頻率來(lái)計(jì)算兩個(gè)商品之間的相似度,在尋找用戶點(diǎn)擊商品的相似絮供、相關(guān)以及搭配商品上都有很大的優(yōu)勢(shì)关筒,且其具有簡(jiǎn)單、性能高等特點(diǎn)杯缺,已成為目前應(yīng)用使用最為廣泛的召回算法蒸播。然而由于經(jīng)典 Item-CF 類算法的召回結(jié)果的候選集限定在用戶的歷史行為類目中,并且算法難以結(jié)合商品的 Side Information萍肆,導(dǎo)致其推薦結(jié)果存在發(fā)現(xiàn)性弱袍榆、對(duì)長(zhǎng)尾商品的效果差等問(wèn)題,容易導(dǎo)致推薦系統(tǒng)出現(xiàn)“越推越窄”的問(wèn)題塘揣,從而制約了推薦系統(tǒng)的可持續(xù)發(fā)展包雀。為了跟精準(zhǔn)地給用戶推薦心儀的商品,同時(shí)維護(hù)推薦系統(tǒng)的可持續(xù)發(fā)展亲铡,解決推薦系統(tǒng)的發(fā)現(xiàn)性推薦和長(zhǎng)尾推薦等問(wèn)題才写,我們團(tuán)隊(duì)提出了 S3Graph Embeeding 算法和 MIND 算法。
3.2 S3 Graph Embedding
Graph Embedding 是一種將復(fù)雜網(wǎng)絡(luò)投影到低維空間的機(jī)器學(xué)習(xí)技術(shù)奖蔓,典型的做法是將網(wǎng)絡(luò)中的節(jié)點(diǎn)做向量化表達(dá)赞草,使節(jié)點(diǎn)間的向量相似度接近原始節(jié)點(diǎn)間在網(wǎng)絡(luò)結(jié)構(gòu)、近鄰關(guān)系吆鹤、Meta信息等多維度上的相似性厨疙。
我們團(tuán)隊(duì)提出的 S3 Graph Embeeding 算法利用全網(wǎng)以十億的用戶對(duì)十億規(guī)模的商品的序列化點(diǎn)擊行為構(gòu)建千億規(guī)模的 Graph,結(jié)合深度隨機(jī)游走技術(shù)對(duì)用戶行為進(jìn)行"虛擬采樣"疑务,并引入商品的 Side Information 增加泛化學(xué)習(xí)能力沾凄,將全網(wǎng)的商品進(jìn)行 embedding,統(tǒng)一成同一維度的向量表示知允。該向量被直接用在 Item-CF 中商品相似度的計(jì)算中撒蟀,相比經(jīng)典 Item-CF 以共同點(diǎn)擊次數(shù)來(lái)衡量商品相似度的做法,該算法不需要兩個(gè)商品被同時(shí)點(diǎn)擊過(guò)也能計(jì)算出商品間的相似度温鸽,并且引入 Side Information 的使其能更好的處理長(zhǎng)尾的商品和冷啟動(dòng)的商品保屯。
我們基于 Behemoth X2Vec 平臺(tái),利用全網(wǎng)的點(diǎn)擊數(shù)據(jù)和商品 Side Information 構(gòu)建全網(wǎng)商品的 embedding嗤朴,并以此來(lái)計(jì)算 Graph Embedding i2i 表配椭,部署在Basic Engine 上,對(duì)每個(gè)訪問(wèn)天貓首頁(yè)的用戶雹姊,從 ABFS 中獲取用戶的 trigger股缸,并以此查詢 Graph Embedding i2i 表來(lái)召回用戶感興趣的商品。
3.3 MIND
Multi-Interest Network with Dynamic Routing (MIND) 是我們團(tuán)隊(duì)提出的一種向量召回的方法吱雏,其通過(guò)構(gòu)建多個(gè)和商品向量在統(tǒng)一的向量空間的用戶興趣向量來(lái)表示用戶的多個(gè)興趣敦姻,然后通過(guò)這多個(gè)興趣向量去檢索出TopK個(gè)與其近鄰的商品向量瘾境,得到 TopK個(gè) 用戶感興趣的商品。
傳統(tǒng) DeepMatch 方法為每個(gè)用戶生成一個(gè)興趣向量镰惦,但在實(shí)際的購(gòu)物場(chǎng)景中迷守,用戶的興趣是多樣的,不同興趣之間甚至可能是不相關(guān)的旺入,比如用戶可能同時(shí)期望購(gòu)買服裝兑凿、化妝品、零食茵瘾,而一個(gè)長(zhǎng)度有限的向量很難表示用戶這樣的多個(gè)興趣礼华。我們的 MIND 模型通過(guò) Dynamic Routing 的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣拗秘,來(lái)提升召回的豐富度和準(zhǔn)確度圣絮。
圖4. MIND模型
我們基于實(shí)時(shí)排序服務(wù) RTP 和召回引擎 Basic Engine(BE) 開(kāi)發(fā)了一整套 MIND 在線服務(wù)體系。對(duì)每個(gè)訪問(wèn)場(chǎng)景的用戶雕旨,先通過(guò)部署在 RTP 中的 MIND 模型的 Multi-interest Extractor Layer 提取出用戶的多個(gè)興趣向量扮匠,然后利用這些興趣向量在 Basic Engine 中通過(guò) aitheta 檢索引擎召回用戶感興趣的商品。
3.4 Retargeting
Retargering 是一種將用戶點(diǎn)擊凡涩、收藏或加購(gòu)的商品再次推薦給用戶的一種推薦策略棒搜。在電商的推薦系統(tǒng)中,用戶的行為包含瀏覽突照、點(diǎn)擊帮非、收藏氧吐、加購(gòu)和下單等行為讹蘑,我們當(dāng)然希望用戶每一個(gè)行為流最終都能到達(dá)轉(zhuǎn)化的環(huán)節(jié),但是事實(shí)并非如此筑舅。當(dāng)用戶產(chǎn)生了下單行為的某些上游行為時(shí)座慰,會(huì)有相當(dāng)一部分用戶因?yàn)楦鞣N原因沒(méi)有最終達(dá)成交易,但是用戶當(dāng)時(shí)沒(méi)有產(chǎn)生下單行為并不代表用戶對(duì)當(dāng)前商品不感興趣翠拣,當(dāng)用戶再次來(lái)到天貓時(shí)版仔,我們根據(jù)用戶之前產(chǎn)生的先驗(yàn)行為理解并識(shí)別用戶的真正意圖,將符合用戶意圖的商品再次推薦給用戶误墓,引導(dǎo)用戶沿著行為流向下游蛮粮,最終達(dá)到下單這個(gè)最終的行為。
Retargering 的召回策略更多是在大促促成交的場(chǎng)景下使用谜慌,其召回量更需要嚴(yán)格控制然想。
3.5 Crowd-based Filtering
上述的召回策略都能跟著用戶的歷史行為等信息召回用戶感興趣的商品,但是對(duì)于未登錄用戶或是冷啟動(dòng)的用戶欣范,這些召回策略所能召回的商品是有限的变泄。Crowd-based Filtering 是一種替補(bǔ)的召回策略令哟,是一種基于人群屬性來(lái)推薦的方法,其通過(guò)將用戶按照性別妨蛹、年齡段屏富、收貨城市等粗粒度的屬性劃分為若干個(gè)人群,然后為基于每個(gè)人群的行為數(shù)據(jù)挑選出該人群點(diǎn)擊率高的 TopK 個(gè)商品作為該人群感興趣的商品蛙卤。
3.6 融合與調(diào)制
為了結(jié)合不同召回策略的優(yōu)點(diǎn)狠半,同時(shí)提高候選集的多樣性和覆蓋率,我們將以上召回策略召回的商品融合在一起颤难。融合的過(guò)程中根據(jù)各個(gè)召回策略召回結(jié)果的歷史表現(xiàn)和流量調(diào)控的需求典予,對(duì)各個(gè)召回算法的召回比例進(jìn)行適當(dāng)?shù)恼{(diào)制。
4乐严、 排序
4.1 排序特征
排序特征在排序的效果中起到了非常重要的作用瘤袖,天貓首頁(yè)推薦系統(tǒng)排序模型的特征可以抽象為五類:
- User Profile Features:用戶側(cè)的基礎(chǔ)特征,如用戶的性別昂验、年齡捂敌、城市、購(gòu)買力等既琴。
- Item Features:商品側(cè)的特征占婉,如商品 ID、類目 ID甫恩、店鋪 ID逆济、標(biāo)簽等。
- Context Features:上下文特征磺箕,如 match_type奖慌、位置、頁(yè)碼等松靡。
- Cross Features:交叉特征简僧,如用戶側(cè)特征與商品側(cè)特征的交叉等。
- Sequence Item Features:用戶對(duì)商品的行為特征雕欺,如用戶點(diǎn)擊的商品序列岛马、點(diǎn)擊的類目序列及相應(yīng)的 Positional Bias。
4.2 排序樣本
排序樣本的選取也會(huì)影響排序模型的效果屠列。排序的樣本來(lái)自于場(chǎng)景產(chǎn)生的曝光和點(diǎn)擊日志啦逆,對(duì)場(chǎng)景日志進(jìn)行有效的清洗去噪,準(zhǔn)實(shí)時(shí)計(jì)算場(chǎng)景活躍用戶笛洛、黑名單用戶夏志,保留對(duì)場(chǎng)景有感知的部分用戶,過(guò)濾數(shù)據(jù)中混雜的刷單爬蟲等作弊行為數(shù)據(jù)撞蜂,過(guò)濾大促0點(diǎn)下單和紅包雨等異常時(shí)段用戶的非正常行為日志等對(duì)提升模型效果有一定的幫助盲镶。
4.3 排序模型
4.3.1 經(jīng)典 Deep 排序模型
Google 提出的 WDL 模型奠定了目前 Deep 排序模型的基本框架侥袜。
DeepFM/PNN/DCN/DeepResNet 等模型把傳統(tǒng)離散 LR 中特征工程的經(jīng)驗(yàn)搬到DL 中來(lái),用人工構(gòu)建的代數(shù)式先驗(yàn)來(lái)幫助模型建立對(duì)某種認(rèn)知模式的預(yù)設(shè)溉贿,幫助模型更好的建模枫吧。DIN 等模型引入了用戶行為數(shù)據(jù),通過(guò) Attention 來(lái)捕捉了用戶興趣的多樣性以及與預(yù)測(cè)目標(biāo)的局部相關(guān)性宇色,對(duì)大規(guī)模離散用戶行為數(shù)據(jù)的進(jìn)行建模九杂。
4.3.2 BST
類似 DeepFM/PNN/DCN/DeepResNet 等模型更多的在探索如何更好的利用 id features 和 bias features 去逼近 id features 和 bias features 所能達(dá)到的模型上限,很少探索如何有效利用 seq features宣蠕;DIN 等模型在這些模型的基礎(chǔ)上進(jìn)行 seq features 建模的探索例隆,其用打分 item對(duì)seq features 做 attention 后對(duì)其進(jìn)行weighted sum pooling,雖然可以很好地表達(dá)打分 item 和用戶行為序列的相關(guān)性抢蚀,但不能抽象用戶行為序列內(nèi)部的相關(guān)性镀层。
為了解決 WDL 和 DIN 等模型存在的上述問(wèn)題,受 Transformer 在 NLP 任務(wù)中有效地處理詞序列的啟發(fā)皿曲,我們提出了 Behavior Sequence Transformer (BST) 模型唱逢,該模型用 Transformer 來(lái)建模用戶的行為序列,學(xué)習(xí)用戶行為序列內(nèi)部的相關(guān)性及其與打分 item 之間的相關(guān)性屋休。
BST 模型的結(jié)構(gòu)如圖5所示坞古,模型將用戶行為序列(包括打分 item)、用戶側(cè)特征劫樟、商品側(cè)特征痪枫、上下文特征、交叉特征作為輸入叠艳;首先通過(guò) Embedding 技術(shù)將其 embeds 為低維稠密向量奶陈;為了更好的學(xué)習(xí)用戶行為序列內(nèi)部的相關(guān)性及其與打分item之間的相關(guān)性,通過(guò) Transformer 來(lái)學(xué)習(xí)每個(gè)用戶行為序列的深度表示虑绵;然后將用戶側(cè)特征尿瞭、商品側(cè)特征、上下文特征翅睛、交叉特征和 Transformer 層的輸出concat 在一起得到樣本的特征表示向量,并利用三層的 MLP 網(wǎng)絡(luò)來(lái)進(jìn)一步學(xué)習(xí)特征表示向量更抽象的表達(dá)和特征之間的交叉關(guān)系黑竞;最后通過(guò) Sigmoid 計(jì)算模型的輸出捕发。
模型通過(guò) Transformer 來(lái)建模用戶行為序列,首先通過(guò) Self-Attention 學(xué)習(xí)用戶行為序列內(nèi)部之間的相關(guān)性及其與打分 item 之間的相關(guān)性很魂≡幔考慮向量的物理意義,使用內(nèi)積來(lái)計(jì)算attention遏匆,這樣兩個(gè) item 越相近法挨,內(nèi)積越大谁榜,attention 增益越大。并采用 Mutil-Head Attention 的方式凡纳,有效的將序列特征放到多個(gè)平行的空間進(jìn)行計(jì)算窃植,提升模型的容錯(cuò)性與精準(zhǔn)度。
其中荐糜,為投影矩陣巷怜,E 是用戶行為序列與當(dāng)前打分Q進(jìn)行拼接后的 Embedding 表示,暴氏,h 是 head 數(shù)延塑。
為了進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的非線性表示能力,將 Self-Attention 的輸出做一層 Point-wise Feed-Forward Networks (FFN) 答渔。
我們基于實(shí)時(shí)排序服務(wù) RTP关带,在 GPU 集群上部署了量化后的 BST 模型,對(duì)于每一個(gè)打分 item 列表沼撕,RTP 將其拆分后并行打分豫缨,實(shí)時(shí)預(yù)測(cè)用戶對(duì)打分 item 列表中每一個(gè)item的點(diǎn)擊率。
5端朵、機(jī)制
5.1 視覺(jué)體驗(yàn)優(yōu)化
5.1.1 基于知識(shí)圖譜的標(biāo)準(zhǔn)類目擴(kuò)展
受種種因素制約好芭,淘寶天貓商品類目體系過(guò)于細(xì)致,不符合推薦場(chǎng)景中用戶對(duì)商品的主觀分類冲呢。我們與知識(shí)圖譜團(tuán)隊(duì)合作舍败,建立了標(biāo)準(zhǔn)類目體系,從語(yǔ)義層面出發(fā)敬拓,結(jié)合場(chǎng)景的特點(diǎn)邻薯,將相近的葉子類目進(jìn)行不同程度的聚合,分別應(yīng)用在購(gòu)買類目過(guò)濾和類目打散時(shí)的類目擴(kuò)展乘凸。
5.1.2 基于圖像指紋的相似圖片檢測(cè)系統(tǒng)
淘寶商品素材浩如煙海厕诡,相似的展示圖片層出不窮。這種相似經(jīng)常超越圖片所屬商品本身的屬性营勤,通過(guò)商品本身的標(biāo)題灵嫌、類目等語(yǔ)義信息已無(wú)法識(shí)別這種相似,為此我們團(tuán)隊(duì)研發(fā)了相似圖片檢測(cè)系統(tǒng)葛作,從圖形本身出發(fā)來(lái)檢測(cè)商品素材圖片之間的相似度寿羞。
同圖檢測(cè)系統(tǒng)以 CNN 作為分類器,識(shí)別商品素材圖片所屬的葉子類目赂蠢,將最后隱藏層向量作為圖像特征向量绪穆,并通過(guò)向量的相似度來(lái)計(jì)算商品之間的相似度。為了加速向量相似度的計(jì)算,我們使用 SimHash 算法將圖像特征向量進(jìn)一步轉(zhuǎn)化成高維圖像指紋玖院,將計(jì)算兩個(gè)特征向量距離的問(wèn)題轉(zhuǎn)化成計(jì)算兩個(gè)圖像指紋漢明距離的問(wèn)題, 在精度損失可接受的范圍內(nèi)極大地降低了計(jì)算復(fù)雜度菠红。
5.1.3 多維度打散
天貓首頁(yè)由大促會(huì)場(chǎng)入口和日常頻道構(gòu)成,大促會(huì)場(chǎng)入口包括主會(huì)場(chǎng)入口和行業(yè)會(huì)場(chǎng)入口难菌,日常頻道包括限時(shí)搶購(gòu)试溯、天貓好物、聚劃算扔傅、天貓閃降和一些精選精選頻道耍共,每一個(gè)頻道的商品素材都是獨(dú)立的,存在一定的重復(fù)猎塞,如果不加限制试读,各個(gè)頻道之間容易出現(xiàn)相似的推薦結(jié)果,這在“寸土寸金”的首頁(yè)荠耽,無(wú)疑是一種浪費(fèi)钩骇,也會(huì)傷害用戶體驗(yàn),不利于導(dǎo)購(gòu)心智的培養(yǎng)铝量。為此倘屹,我們?cè)O(shè)計(jì)了多種打散方案,從多個(gè)維度(商品/標(biāo)準(zhǔn)類目/品牌/會(huì)場(chǎng)/相似圖片等)對(duì)首頁(yè)各個(gè)頻道推薦的素材進(jìn)行聯(lián)合打散慢叨,讓推薦的結(jié)果更具多樣性纽匙。
5.2 模板式實(shí)時(shí)曝光過(guò)濾
由于天貓首頁(yè)在手機(jī)天貓的首屏,用戶每次打開(kāi) APP 都會(huì)獲得曝光拍谐,其中就包含了很多無(wú)效的曝光烛缔,如用戶直接進(jìn)入搜索頻道、進(jìn)入購(gòu)物車或者大促期間來(lái)?yè)尲t包雨搶券等轩拨,這些無(wú)效曝光中用戶對(duì)該場(chǎng)景是無(wú)心智的践瓷。常見(jiàn)的將對(duì)用戶偽曝光的商品記錄下來(lái)并利用其來(lái)進(jìn)行實(shí)時(shí)曝光過(guò)濾的方法對(duì)首頁(yè)這種無(wú)效曝光率很高的場(chǎng)景來(lái)說(shuō)“太嚴(yán)格”了,會(huì)使得推薦的效果大打折扣亡蓉。為此晕翠,我們?cè)O(shè)計(jì)了一種模板式實(shí)時(shí)曝光過(guò)濾的方法。一次推薦給用戶出多個(gè)模板砍濒,并記錄用戶上次看到的第 i 個(gè)模板淋肾,然后在本次給用戶展現(xiàn)第 i+1個(gè)模板。如果用戶產(chǎn)生新的行為梯影,模板的推薦內(nèi)容也會(huì)隨之進(jìn)行更新巫员。
5.3 用戶及類目個(gè)性化的購(gòu)買過(guò)濾
”買了還推“是過(guò)去推薦系統(tǒng)經(jīng)常被詬病的吐槽點(diǎn),要解決該問(wèn)題就需要對(duì)用戶購(gòu)買的類目進(jìn)行合理的過(guò)濾甲棍。然而由于每個(gè)葉子類目的購(gòu)買周期不同,不同用戶對(duì)類目的購(gòu)買周期也不同,因此設(shè)計(jì)購(gòu)買過(guò)濾時(shí)還需要關(guān)注不同用戶對(duì)不同類目過(guò)購(gòu)買過(guò)濾的個(gè)性化需求感猛。購(gòu)買過(guò)濾作為所有推薦場(chǎng)景都會(huì)面對(duì)的基礎(chǔ)問(wèn)題七扰,我們與工程團(tuán)隊(duì)合作推出了統(tǒng)一的全域購(gòu)買過(guò)濾服務(wù),為每一個(gè)類目定制一個(gè)購(gòu)買屏蔽周期陪白,根據(jù)用戶最近一段時(shí)間內(nèi)購(gòu)買的行為為每個(gè)用戶維護(hù)一個(gè)實(shí)時(shí)的購(gòu)買過(guò)濾類目颈走,同時(shí)考慮到如果該用戶在購(gòu)買屏蔽周期內(nèi)又主動(dòng)在該類目上發(fā)生了多次點(diǎn)擊行為,說(shuō)明用戶對(duì)該類目仍感興趣咱士,有購(gòu)買的可能立由,則該類目會(huì)被"解禁"。天貓首頁(yè)接入購(gòu)買過(guò)濾服務(wù)之后序厉,"買了還推"的問(wèn)題也得到了大大的改善锐膜。
6、總結(jié)
本文從算法的角度介紹了天貓首頁(yè)的推薦系統(tǒng)弛房,從召回道盏、排序、推薦機(jī)制三個(gè)方面講解了我們?nèi)绾卫?Graph Embedding文捶、Transformer荷逞、深度學(xué)習(xí)、知識(shí)圖譜粹排、用戶體驗(yàn)建模等多項(xiàng)技術(shù)來(lái)構(gòu)建先進(jìn)的推薦系統(tǒng)种远。當(dāng)然,完整的推薦系統(tǒng)是一個(gè)復(fù)雜系統(tǒng)顽耳,構(gòu)建一個(gè)"懂你"的天貓首頁(yè)還離不開(kāi)產(chǎn)品坠敷、工程、運(yùn)營(yíng)等同學(xué)的合作和幫助斧抱。在個(gè)性化推薦的道路上常拓,我們將繼續(xù)不斷積累和打磨,深耕技術(shù)辉浦,創(chuàng)造更好的個(gè)性化服務(wù)弄抬,也相信個(gè)性化推薦的未來(lái)會(huì)更好。