當(dāng)你打開(kāi)天貓的那一刻,推薦系統(tǒng)做了哪些工作泽本?

當(dāng)年打開(kāi)天貓的那一刻淘太,它為你完成了華麗的變身,成為世上獨(dú)一無(wú)二的“天貓”,這就是智能推薦的力量蒲牧。今天撇贺,來(lái)自阿里巴巴搜索推薦事業(yè)部的算法工程師陳啟偉為你介紹天貓如何玩轉(zhuǎn)首頁(yè)個(gè)性化推薦,揭開(kāi)搜索推薦的神秘面紗冰抢。

天貓首頁(yè)作為用戶打開(kāi)手機(jī)天貓App的第一印象松嘶,所推薦的商品極大地決定了用戶接下來(lái)的行為,對(duì)用戶流量的承接與分發(fā)挎扰、提升用戶購(gòu)物體驗(yàn)和呈現(xiàn)天貓貨品的性價(jià)比翠订、品質(zhì)感及品牌力起到至關(guān)重要的作用,成為提升天貓用戶體驗(yàn)的關(guān)鍵環(huán)節(jié)之一遵倦。

1尽超、場(chǎng)景介紹

天貓首頁(yè)的場(chǎng)景主要包括大促會(huì)場(chǎng)入口和日常頻道兩大類,如圖1所示梧躺。其中左圖為大促會(huì)場(chǎng)入口似谁,包括主會(huì)場(chǎng)入口和行業(yè)會(huì)場(chǎng)入口;主會(huì)場(chǎng)入口通過(guò)為用戶推薦7個(gè)商品(3個(gè)在中間動(dòng)態(tài)輪播)給大促主會(huì)場(chǎng)進(jìn)行引流掠哥,引流 UV 達(dá)數(shù)千萬(wàn)以上巩踏;行業(yè)會(huì)場(chǎng)入口通過(guò)為用戶推薦4個(gè)個(gè)性化會(huì)場(chǎng)和商品為數(shù)萬(wàn)的會(huì)場(chǎng)引流。右圖為日常頻道续搀,包括限時(shí)搶購(gòu)塞琼、天貓好物、聚劃算禁舷、天貓閃降和精選頻道彪杉;首頁(yè)通過(guò)個(gè)性化推薦商品為各個(gè)特色的頻道引流,通過(guò)各個(gè)頻道來(lái)培養(yǎng)用戶心智榛了,讓用戶在天貓逛起來(lái)在讶。

過(guò)去的首頁(yè)推薦更多的是在相關(guān)性推薦的單一數(shù)據(jù)目標(biāo)上進(jìn)行優(yōu)化,如今天貓首頁(yè)的推薦系統(tǒng)不僅僅考慮推薦結(jié)果的相關(guān)性霜大,還在推薦結(jié)果的發(fā)現(xiàn)性构哺、多樣性等方面上做了更深度的優(yōu)化,"效率和體驗(yàn)并重"成為天貓首頁(yè)新的優(yōu)化目標(biāo)战坤。Graph Embedding曙强、Transformer、深度學(xué)習(xí)途茫、知識(shí)圖譜等新的技術(shù)已先后在天貓首頁(yè)的推薦系統(tǒng)成功落地碟嘴,為場(chǎng)景帶來(lái)了兩位數(shù)的點(diǎn)擊率提升和兩位數(shù)的疲勞度下降。

2囊卜、推薦框架

天貓首頁(yè)的個(gè)性化推薦系統(tǒng)可以分為召回娜扇、排序和機(jī)制三個(gè)模塊错沃。其中,召回模塊主要是從全量的商品素材中檢索出用戶感興趣的 TopK 個(gè)候選商品雀瓢,排序模塊專注于用戶對(duì)商品的 CTR 預(yù)估枢析,機(jī)制模塊負(fù)責(zé)后期的流量調(diào)控、體驗(yàn)優(yōu)化刃麸、策略調(diào)控等和最終的商品排序醒叁。整個(gè)推薦系統(tǒng)采用 Graph Embedding、Transformer泊业、深度學(xué)習(xí)把沼、知識(shí)圖譜、用戶體驗(yàn)建模等新的技術(shù)構(gòu)建起來(lái)吁伺,后面章節(jié)將介紹這個(gè)推薦系統(tǒng)的關(guān)鍵技術(shù)點(diǎn)饮睬。


圖2. 天貓首頁(yè)推薦系統(tǒng)框架

3、召回

3.1 Ranki2i
Item-CF 是目前應(yīng)用最廣泛的召回算法箱蝠,其原理是根據(jù)兩個(gè)商品被同時(shí)點(diǎn)擊的頻率來(lái)計(jì)算兩個(gè)商品之間的相似度 simScore续捂,得到 i2i 表垦垂;然后通過(guò)用戶的 trigger 去查詢 i2i 表宦搬,擴(kuò)展用戶感興趣的商品。Item-CF 的基本算法雖然簡(jiǎn)單劫拗,但是要獲得更好的效果间校,往往需要根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行調(diào)優(yōu)。清除爬蟲页慷、刷單等噪聲數(shù)據(jù)憔足,合理選擇計(jì)算商品之間相似度的數(shù)據(jù)的時(shí)間窗口,引入時(shí)間衰減酒繁,只考慮同一個(gè)類目下商品對(duì)滓彰,歸一化、截?cái)嘀萏弧⒋蛏⒌炔呗詫?duì)優(yōu)化 Item-CF 的效果都有很大的幫助揭绑。

Ranki2i 是一種改進(jìn)的 Item-CF 算法,其在 item-CF 得到的兩個(gè)商品之間的相似度 simScore 的基礎(chǔ)上再乘以該 trigger item 所召回的該 target item 在過(guò)去一段時(shí)間內(nèi)的 ctr (注意 ctr 的計(jì)算需要進(jìn)行適當(dāng)?shù)钠交?郎哭,對(duì) i2i 的 simScore 進(jìn)行修正他匪,使得 i2i 表不僅考慮了兩個(gè)商品的點(diǎn)擊共現(xiàn)性,還考慮了召回商品的點(diǎn)擊率夸研。

我們基于全網(wǎng)的點(diǎn)擊數(shù)據(jù)和天貓首頁(yè)場(chǎng)景內(nèi)的日志來(lái)計(jì)算 Ranki2i 表邦蜜,并部署在檢索系統(tǒng) Basic Engine 上,對(duì)每個(gè)訪問(wèn)天貓首頁(yè)的用戶亥至,從基礎(chǔ)特征服務(wù)系統(tǒng) ABFS 中獲取用戶的 trigger悼沈,并以此查詢 Ranki2i 表來(lái)召回用戶感興趣的商品贱迟。

經(jīng)典 Item-CF 類算法直接根據(jù)兩個(gè)商品被同時(shí)點(diǎn)擊的頻率來(lái)計(jì)算兩個(gè)商品之間的相似度,在尋找用戶點(diǎn)擊商品的相似絮供、相關(guān)以及搭配商品上都有很大的優(yōu)勢(shì)关筒,且其具有簡(jiǎn)單、性能高等特點(diǎn)杯缺,已成為目前應(yīng)用使用最為廣泛的召回算法蒸播。然而由于經(jīng)典 Item-CF 類算法的召回結(jié)果的候選集限定在用戶的歷史行為類目中,并且算法難以結(jié)合商品的 Side Information萍肆,導(dǎo)致其推薦結(jié)果存在發(fā)現(xiàn)性弱袍榆、對(duì)長(zhǎng)尾商品的效果差等問(wèn)題,容易導(dǎo)致推薦系統(tǒng)出現(xiàn)“越推越窄”的問(wèn)題塘揣,從而制約了推薦系統(tǒng)的可持續(xù)發(fā)展包雀。為了跟精準(zhǔn)地給用戶推薦心儀的商品,同時(shí)維護(hù)推薦系統(tǒng)的可持續(xù)發(fā)展亲铡,解決推薦系統(tǒng)的發(fā)現(xiàn)性推薦和長(zhǎng)尾推薦等問(wèn)題才写,我們團(tuán)隊(duì)提出了 S3Graph Embeeding 算法和 MIND 算法。

3.2 S3 Graph Embedding
Graph Embedding 是一種將復(fù)雜網(wǎng)絡(luò)投影到低維空間的機(jī)器學(xué)習(xí)技術(shù)奖蔓,典型的做法是將網(wǎng)絡(luò)中的節(jié)點(diǎn)做向量化表達(dá)赞草,使節(jié)點(diǎn)間的向量相似度接近原始節(jié)點(diǎn)間在網(wǎng)絡(luò)結(jié)構(gòu)、近鄰關(guān)系吆鹤、Meta信息等多維度上的相似性厨疙。

我們團(tuán)隊(duì)提出的 S3 Graph Embeeding 算法利用全網(wǎng)以十億的用戶對(duì)十億規(guī)模的商品的序列化點(diǎn)擊行為構(gòu)建千億規(guī)模的 Graph,結(jié)合深度隨機(jī)游走技術(shù)對(duì)用戶行為進(jìn)行"虛擬采樣"疑务,并引入商品的 Side Information 增加泛化學(xué)習(xí)能力沾凄,將全網(wǎng)的商品進(jìn)行 embedding,統(tǒng)一成同一維度的向量表示知允。該向量被直接用在 Item-CF 中商品相似度的計(jì)算中撒蟀,相比經(jīng)典 Item-CF 以共同點(diǎn)擊次數(shù)來(lái)衡量商品相似度的做法,該算法不需要兩個(gè)商品被同時(shí)點(diǎn)擊過(guò)也能計(jì)算出商品間的相似度温鸽,并且引入 Side Information 的使其能更好的處理長(zhǎng)尾的商品和冷啟動(dòng)的商品保屯。


圖3. Graph Embedding

我們基于 Behemoth X2Vec 平臺(tái),利用全網(wǎng)的點(diǎn)擊數(shù)據(jù)和商品 Side Information 構(gòu)建全網(wǎng)商品的 embedding嗤朴,并以此來(lái)計(jì)算 Graph Embedding i2i 表配椭,部署在Basic Engine 上,對(duì)每個(gè)訪問(wèn)天貓首頁(yè)的用戶雹姊,從 ABFS 中獲取用戶的 trigger股缸,并以此查詢 Graph Embedding i2i 表來(lái)召回用戶感興趣的商品。

3.3 MIND
Multi-Interest Network with Dynamic Routing (MIND) 是我們團(tuán)隊(duì)提出的一種向量召回的方法吱雏,其通過(guò)構(gòu)建多個(gè)和商品向量在統(tǒng)一的向量空間的用戶興趣向量來(lái)表示用戶的多個(gè)興趣敦姻,然后通過(guò)這多個(gè)興趣向量去檢索出TopK個(gè)與其近鄰的商品向量瘾境,得到 TopK個(gè) 用戶感興趣的商品。

傳統(tǒng) DeepMatch 方法為每個(gè)用戶生成一個(gè)興趣向量镰惦,但在實(shí)際的購(gòu)物場(chǎng)景中迷守,用戶的興趣是多樣的,不同興趣之間甚至可能是不相關(guān)的旺入,比如用戶可能同時(shí)期望購(gòu)買服裝兑凿、化妝品、零食茵瘾,而一個(gè)長(zhǎng)度有限的向量很難表示用戶這樣的多個(gè)興趣礼华。我們的 MIND 模型通過(guò) Dynamic Routing 的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣拗秘,來(lái)提升召回的豐富度和準(zhǔn)確度圣絮。


20190603105303164.png

圖4. MIND模型
我們基于實(shí)時(shí)排序服務(wù) RTP 和召回引擎 Basic Engine(BE) 開(kāi)發(fā)了一整套 MIND 在線服務(wù)體系。對(duì)每個(gè)訪問(wèn)場(chǎng)景的用戶雕旨,先通過(guò)部署在 RTP 中的 MIND 模型的 Multi-interest Extractor Layer 提取出用戶的多個(gè)興趣向量扮匠,然后利用這些興趣向量在 Basic Engine 中通過(guò) aitheta 檢索引擎召回用戶感興趣的商品。

3.4 Retargeting

Retargering 是一種將用戶點(diǎn)擊凡涩、收藏或加購(gòu)的商品再次推薦給用戶的一種推薦策略棒搜。在電商的推薦系統(tǒng)中,用戶的行為包含瀏覽突照、點(diǎn)擊帮非、收藏氧吐、加購(gòu)和下單等行為讹蘑,我們當(dāng)然希望用戶每一個(gè)行為流最終都能到達(dá)轉(zhuǎn)化的環(huán)節(jié),但是事實(shí)并非如此筑舅。當(dāng)用戶產(chǎn)生了下單行為的某些上游行為時(shí)座慰,會(huì)有相當(dāng)一部分用戶因?yàn)楦鞣N原因沒(méi)有最終達(dá)成交易,但是用戶當(dāng)時(shí)沒(méi)有產(chǎn)生下單行為并不代表用戶對(duì)當(dāng)前商品不感興趣翠拣,當(dāng)用戶再次來(lái)到天貓時(shí)版仔,我們根據(jù)用戶之前產(chǎn)生的先驗(yàn)行為理解并識(shí)別用戶的真正意圖,將符合用戶意圖的商品再次推薦給用戶误墓,引導(dǎo)用戶沿著行為流向下游蛮粮,最終達(dá)到下單這個(gè)最終的行為。

Retargering 的召回策略更多是在大促促成交的場(chǎng)景下使用谜慌,其召回量更需要嚴(yán)格控制然想。

3.5 Crowd-based Filtering

上述的召回策略都能跟著用戶的歷史行為等信息召回用戶感興趣的商品,但是對(duì)于未登錄用戶或是冷啟動(dòng)的用戶欣范,這些召回策略所能召回的商品是有限的变泄。Crowd-based Filtering 是一種替補(bǔ)的召回策略令哟,是一種基于人群屬性來(lái)推薦的方法,其通過(guò)將用戶按照性別妨蛹、年齡段屏富、收貨城市等粗粒度的屬性劃分為若干個(gè)人群,然后為基于每個(gè)人群的行為數(shù)據(jù)挑選出該人群點(diǎn)擊率高的 TopK 個(gè)商品作為該人群感興趣的商品蛙卤。

3.6 融合與調(diào)制

為了結(jié)合不同召回策略的優(yōu)點(diǎn)狠半,同時(shí)提高候選集的多樣性和覆蓋率,我們將以上召回策略召回的商品融合在一起颤难。融合的過(guò)程中根據(jù)各個(gè)召回策略召回結(jié)果的歷史表現(xiàn)和流量調(diào)控的需求典予,對(duì)各個(gè)召回算法的召回比例進(jìn)行適當(dāng)?shù)恼{(diào)制。

4乐严、 排序

4.1 排序特征

排序特征在排序的效果中起到了非常重要的作用瘤袖,天貓首頁(yè)推薦系統(tǒng)排序模型的特征可以抽象為五類:

  • User Profile Features:用戶側(cè)的基礎(chǔ)特征,如用戶的性別昂验、年齡捂敌、城市、購(gòu)買力等既琴。
  • Item Features:商品側(cè)的特征占婉,如商品 ID、類目 ID甫恩、店鋪 ID逆济、標(biāo)簽等。
  • Context Features:上下文特征磺箕,如 match_type奖慌、位置、頁(yè)碼等松靡。
  • Cross Features:交叉特征简僧,如用戶側(cè)特征與商品側(cè)特征的交叉等。
  • Sequence Item Features:用戶對(duì)商品的行為特征雕欺,如用戶點(diǎn)擊的商品序列岛马、點(diǎn)擊的類目序列及相應(yīng)的 Positional Bias。

4.2 排序樣本

排序樣本的選取也會(huì)影響排序模型的效果屠列。排序的樣本來(lái)自于場(chǎng)景產(chǎn)生的曝光和點(diǎn)擊日志啦逆,對(duì)場(chǎng)景日志進(jìn)行有效的清洗去噪,準(zhǔn)實(shí)時(shí)計(jì)算場(chǎng)景活躍用戶笛洛、黑名單用戶夏志,保留對(duì)場(chǎng)景有感知的部分用戶,過(guò)濾數(shù)據(jù)中混雜的刷單爬蟲等作弊行為數(shù)據(jù)撞蜂,過(guò)濾大促0點(diǎn)下單和紅包雨等異常時(shí)段用戶的非正常行為日志等對(duì)提升模型效果有一定的幫助盲镶。

4.3 排序模型

4.3.1 經(jīng)典 Deep 排序模型

Google 提出的 WDL 模型奠定了目前 Deep 排序模型的基本框架侥袜。

DeepFM/PNN/DCN/DeepResNet 等模型把傳統(tǒng)離散 LR 中特征工程的經(jīng)驗(yàn)搬到DL 中來(lái),用人工構(gòu)建的代數(shù)式先驗(yàn)來(lái)幫助模型建立對(duì)某種認(rèn)知模式的預(yù)設(shè)溉贿,幫助模型更好的建模枫吧。DIN 等模型引入了用戶行為數(shù)據(jù),通過(guò) Attention 來(lái)捕捉了用戶興趣的多樣性以及與預(yù)測(cè)目標(biāo)的局部相關(guān)性宇色,對(duì)大規(guī)模離散用戶行為數(shù)據(jù)的進(jìn)行建模九杂。

4.3.2 BST

類似 DeepFM/PNN/DCN/DeepResNet 等模型更多的在探索如何更好的利用 id features 和 bias features 去逼近 id features 和 bias features 所能達(dá)到的模型上限,很少探索如何有效利用 seq features宣蠕;DIN 等模型在這些模型的基礎(chǔ)上進(jìn)行 seq features 建模的探索例隆,其用打分 item對(duì)seq features 做 attention 后對(duì)其進(jìn)行weighted sum pooling,雖然可以很好地表達(dá)打分 item 和用戶行為序列的相關(guān)性抢蚀,但不能抽象用戶行為序列內(nèi)部的相關(guān)性镀层。

為了解決 WDL 和 DIN 等模型存在的上述問(wèn)題,受 Transformer 在 NLP 任務(wù)中有效地處理詞序列的啟發(fā)皿曲,我們提出了 Behavior Sequence Transformer (BST) 模型唱逢,該模型用 Transformer 來(lái)建模用戶的行為序列,學(xué)習(xí)用戶行為序列內(nèi)部的相關(guān)性及其與打分 item 之間的相關(guān)性屋休。


圖5. BST模型

BST 模型的結(jié)構(gòu)如圖5所示坞古,模型將用戶行為序列(包括打分 item)、用戶側(cè)特征劫樟、商品側(cè)特征痪枫、上下文特征、交叉特征作為輸入叠艳;首先通過(guò) Embedding 技術(shù)將其 embeds 為低維稠密向量奶陈;為了更好的學(xué)習(xí)用戶行為序列內(nèi)部的相關(guān)性及其與打分item之間的相關(guān)性,通過(guò) Transformer 來(lái)學(xué)習(xí)每個(gè)用戶行為序列的深度表示虑绵;然后將用戶側(cè)特征尿瞭、商品側(cè)特征、上下文特征翅睛、交叉特征和 Transformer 層的輸出concat 在一起得到樣本的特征表示向量,并利用三層的 MLP 網(wǎng)絡(luò)來(lái)進(jìn)一步學(xué)習(xí)特征表示向量更抽象的表達(dá)和特征之間的交叉關(guān)系黑竞;最后通過(guò) Sigmoid 計(jì)算模型的輸出捕发。

模型通過(guò) Transformer 來(lái)建模用戶行為序列,首先通過(guò) Self-Attention 學(xué)習(xí)用戶行為序列內(nèi)部之間的相關(guān)性及其與打分 item 之間的相關(guān)性很魂≡幔考慮向量的物理意義,使用內(nèi)積來(lái)計(jì)算attention遏匆,這樣兩個(gè) item 越相近法挨,內(nèi)積越大谁榜,attention 增益越大。并采用 Mutil-Head Attention 的方式凡纳,有效的將序列特征放到多個(gè)平行的空間進(jìn)行計(jì)算窃植,提升模型的容錯(cuò)性與精準(zhǔn)度。


20190603105347202.png

其中荐糜,為投影矩陣巷怜,E 是用戶行為序列與當(dāng)前打分Q進(jìn)行拼接后的 Embedding 表示,暴氏,h 是 head 數(shù)延塑。

為了進(jìn)一步增強(qiáng)網(wǎng)絡(luò)的非線性表示能力,將 Self-Attention 的輸出做一層 Point-wise Feed-Forward Networks (FFN) 答渔。

我們基于實(shí)時(shí)排序服務(wù) RTP关带,在 GPU 集群上部署了量化后的 BST 模型,對(duì)于每一個(gè)打分 item 列表沼撕,RTP 將其拆分后并行打分豫缨,實(shí)時(shí)預(yù)測(cè)用戶對(duì)打分 item 列表中每一個(gè)item的點(diǎn)擊率。

5端朵、機(jī)制

5.1 視覺(jué)體驗(yàn)優(yōu)化

5.1.1 基于知識(shí)圖譜的標(biāo)準(zhǔn)類目擴(kuò)展

受種種因素制約好芭,淘寶天貓商品類目體系過(guò)于細(xì)致,不符合推薦場(chǎng)景中用戶對(duì)商品的主觀分類冲呢。我們與知識(shí)圖譜團(tuán)隊(duì)合作舍败,建立了標(biāo)準(zhǔn)類目體系,從語(yǔ)義層面出發(fā)敬拓,結(jié)合場(chǎng)景的特點(diǎn)邻薯,將相近的葉子類目進(jìn)行不同程度的聚合,分別應(yīng)用在購(gòu)買類目過(guò)濾和類目打散時(shí)的類目擴(kuò)展乘凸。


圖6. 標(biāo)準(zhǔn)類目體系

5.1.2 基于圖像指紋的相似圖片檢測(cè)系統(tǒng)

淘寶商品素材浩如煙海厕诡,相似的展示圖片層出不窮。這種相似經(jīng)常超越圖片所屬商品本身的屬性营勤,通過(guò)商品本身的標(biāo)題灵嫌、類目等語(yǔ)義信息已無(wú)法識(shí)別這種相似,為此我們團(tuán)隊(duì)研發(fā)了相似圖片檢測(cè)系統(tǒng)葛作,從圖形本身出發(fā)來(lái)檢測(cè)商品素材圖片之間的相似度寿羞。

同圖檢測(cè)系統(tǒng)以 CNN 作為分類器,識(shí)別商品素材圖片所屬的葉子類目赂蠢,將最后隱藏層向量作為圖像特征向量绪穆,并通過(guò)向量的相似度來(lái)計(jì)算商品之間的相似度。為了加速向量相似度的計(jì)算,我們使用 SimHash 算法將圖像特征向量進(jìn)一步轉(zhuǎn)化成高維圖像指紋玖院,將計(jì)算兩個(gè)特征向量距離的問(wèn)題轉(zhuǎn)化成計(jì)算兩個(gè)圖像指紋漢明距離的問(wèn)題, 在精度損失可接受的范圍內(nèi)極大地降低了計(jì)算復(fù)雜度菠红。


圖7. 同圖檢測(cè)系統(tǒng)

5.1.3 多維度打散

天貓首頁(yè)由大促會(huì)場(chǎng)入口和日常頻道構(gòu)成,大促會(huì)場(chǎng)入口包括主會(huì)場(chǎng)入口和行業(yè)會(huì)場(chǎng)入口难菌,日常頻道包括限時(shí)搶購(gòu)试溯、天貓好物、聚劃算扔傅、天貓閃降和一些精選精選頻道耍共,每一個(gè)頻道的商品素材都是獨(dú)立的,存在一定的重復(fù)猎塞,如果不加限制试读,各個(gè)頻道之間容易出現(xiàn)相似的推薦結(jié)果,這在“寸土寸金”的首頁(yè)荠耽,無(wú)疑是一種浪費(fèi)钩骇,也會(huì)傷害用戶體驗(yàn),不利于導(dǎo)購(gòu)心智的培養(yǎng)铝量。為此倘屹,我們?cè)O(shè)計(jì)了多種打散方案,從多個(gè)維度(商品/標(biāo)準(zhǔn)類目/品牌/會(huì)場(chǎng)/相似圖片等)對(duì)首頁(yè)各個(gè)頻道推薦的素材進(jìn)行聯(lián)合打散慢叨,讓推薦的結(jié)果更具多樣性纽匙。

5.2 模板式實(shí)時(shí)曝光過(guò)濾

由于天貓首頁(yè)在手機(jī)天貓的首屏,用戶每次打開(kāi) APP 都會(huì)獲得曝光拍谐,其中就包含了很多無(wú)效的曝光烛缔,如用戶直接進(jìn)入搜索頻道、進(jìn)入購(gòu)物車或者大促期間來(lái)?yè)尲t包雨搶券等轩拨,這些無(wú)效曝光中用戶對(duì)該場(chǎng)景是無(wú)心智的践瓷。常見(jiàn)的將對(duì)用戶偽曝光的商品記錄下來(lái)并利用其來(lái)進(jìn)行實(shí)時(shí)曝光過(guò)濾的方法對(duì)首頁(yè)這種無(wú)效曝光率很高的場(chǎng)景來(lái)說(shuō)“太嚴(yán)格”了,會(huì)使得推薦的效果大打折扣亡蓉。為此晕翠,我們?cè)O(shè)計(jì)了一種模板式實(shí)時(shí)曝光過(guò)濾的方法。一次推薦給用戶出多個(gè)模板砍濒,并記錄用戶上次看到的第 i 個(gè)模板淋肾,然后在本次給用戶展現(xiàn)第 i+1個(gè)模板。如果用戶產(chǎn)生新的行為梯影,模板的推薦內(nèi)容也會(huì)隨之進(jìn)行更新巫员。

5.3 用戶及類目個(gè)性化的購(gòu)買過(guò)濾

”買了還推“是過(guò)去推薦系統(tǒng)經(jīng)常被詬病的吐槽點(diǎn),要解決該問(wèn)題就需要對(duì)用戶購(gòu)買的類目進(jìn)行合理的過(guò)濾甲棍。然而由于每個(gè)葉子類目的購(gòu)買周期不同,不同用戶對(duì)類目的購(gòu)買周期也不同,因此設(shè)計(jì)購(gòu)買過(guò)濾時(shí)還需要關(guān)注不同用戶對(duì)不同類目過(guò)購(gòu)買過(guò)濾的個(gè)性化需求感猛。購(gòu)買過(guò)濾作為所有推薦場(chǎng)景都會(huì)面對(duì)的基礎(chǔ)問(wèn)題七扰,我們與工程團(tuán)隊(duì)合作推出了統(tǒng)一的全域購(gòu)買過(guò)濾服務(wù),為每一個(gè)類目定制一個(gè)購(gòu)買屏蔽周期陪白,根據(jù)用戶最近一段時(shí)間內(nèi)購(gòu)買的行為為每個(gè)用戶維護(hù)一個(gè)實(shí)時(shí)的購(gòu)買過(guò)濾類目颈走,同時(shí)考慮到如果該用戶在購(gòu)買屏蔽周期內(nèi)又主動(dòng)在該類目上發(fā)生了多次點(diǎn)擊行為,說(shuō)明用戶對(duì)該類目仍感興趣咱士,有購(gòu)買的可能立由,則該類目會(huì)被"解禁"。天貓首頁(yè)接入購(gòu)買過(guò)濾服務(wù)之后序厉,"買了還推"的問(wèn)題也得到了大大的改善锐膜。

6、總結(jié)
本文從算法的角度介紹了天貓首頁(yè)的推薦系統(tǒng)弛房,從召回道盏、排序、推薦機(jī)制三個(gè)方面講解了我們?nèi)绾卫?Graph Embedding文捶、Transformer荷逞、深度學(xué)習(xí)、知識(shí)圖譜粹排、用戶體驗(yàn)建模等多項(xiàng)技術(shù)來(lái)構(gòu)建先進(jìn)的推薦系統(tǒng)种远。當(dāng)然,完整的推薦系統(tǒng)是一個(gè)復(fù)雜系統(tǒng)顽耳,構(gòu)建一個(gè)"懂你"的天貓首頁(yè)還離不開(kāi)產(chǎn)品坠敷、工程、運(yùn)營(yíng)等同學(xué)的合作和幫助斧抱。在個(gè)性化推薦的道路上常拓,我們將繼續(xù)不斷積累和打磨,深耕技術(shù)辉浦,創(chuàng)造更好的個(gè)性化服務(wù)弄抬,也相信個(gè)性化推薦的未來(lái)會(huì)更好。

原文鏈接

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末宪郊,一起剝皮案震驚了整個(gè)濱河市掂恕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌弛槐,老刑警劉巖懊亡,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異乎串,居然都是意外死亡店枣,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)鸯两,“玉大人闷旧,你說(shuō)我怎么就攤上這事【疲” “怎么了忙灼?”我有些...
    開(kāi)封第一講書人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)钝侠。 經(jīng)常有香客問(wèn)我该园,道長(zhǎng),這世上最難降的妖魔是什么帅韧? 我笑而不...
    開(kāi)封第一講書人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任里初,我火速辦了婚禮,結(jié)果婚禮上弱匪,老公的妹妹穿的比我還像新娘青瀑。我一直安慰自己,他們只是感情好萧诫,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布斥难。 她就那樣靜靜地躺著,像睡著了一般帘饶。 火紅的嫁衣襯著肌膚如雪哑诊。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,198評(píng)論 1 299
  • 那天及刻,我揣著相機(jī)與錄音镀裤,去河邊找鬼。 笑死缴饭,一個(gè)胖子當(dāng)著我的面吹牛暑劝,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播颗搂,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼担猛,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了丢氢?” 一聲冷哼從身側(cè)響起傅联,我...
    開(kāi)封第一講書人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎疚察,沒(méi)想到半個(gè)月后蒸走,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡貌嫡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年比驻,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了该溯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡嫁艇,死狀恐怖朗伶,靈堂內(nèi)的尸體忽然破棺而出弦撩,到底是詐尸還是另有隱情步咪,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布益楼,位于F島的核電站猾漫,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏感凤。R本人自食惡果不足惜悯周,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望陪竿。 院中可真熱鬧禽翼,春花似錦、人聲如沸族跛。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)礁哄。三九已至长酗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間桐绒,已是汗流浹背夺脾。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留茉继,地道東北人咧叭。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像烁竭,于是被迫代替她去往敵國(guó)和親菲茬。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 作者 | HCY崇遠(yuǎn) 01 前言 本文源自于前陣子連續(xù)更新的推薦系統(tǒng)系列颖变,前段時(shí)間給朋友整理一個(gè)關(guān)于推薦系統(tǒng)相關(guān)的...
    daos閱讀 5,655評(píng)論 0 77
  • 太長(zhǎng)不讀版:由推薦系統(tǒng)帶來(lái)的推薦服務(wù)基本上已經(jīng)滲透到我們生活的方方面面生均,本文作為淺談推薦系統(tǒng)的基礎(chǔ)篇,主要從下面幾...
    stayrascal閱讀 31,573評(píng)論 5 60
  • 這篇文章的技術(shù)難度會(huì)低一些腥刹,主要是對(duì)推薦系統(tǒng)所涉及到的各部分內(nèi)容進(jìn)行介紹马胧,以及給出一些推薦系統(tǒng)的常用算法,比起技術(shù)...
    我偏笑_NSNirvana閱讀 12,081評(píng)論 5 89
  • 最近新上映的《我不是藥神》特別的火呀衔峰,朋友圈每天都有不同的人曬自己去看了電影佩脊,有時(shí)候也會(huì)有人曬看完后的感受等等蛙粘。我...
    我是一小白白閱讀 128評(píng)論 0 0
  • 最近膜拜起順風(fēng)車師傅,因?yàn)榻裉煸缟先烁袊@威彰,覺(jué)得滴滴肯定得罪誰(shuí)了(生意不好做)出牧,果不其然,是有那么點(diǎn)捕風(fēng)捉影的意思歇盼。...
    一個(gè)不愛(ài)吃甜品的檸檬精閱讀 380評(píng)論 1 0