本文中尿庐,筆者以各個(gè)領(lǐng)域頭部產(chǎn)品為例玩祟,對(duì)互聯(lián)網(wǎng)常見的業(yè)務(wù)形態(tài)中的推薦應(yīng)用進(jìn)行分析。推薦策略的制定即為解決場(chǎng)景下的各種推薦需求制定解決方案欲鹏,因此本文將從每個(gè)場(chǎng)景下用戶醋虏、物品和上下文的特性入手擎淤,組織和整理推薦策略情景下需要重點(diǎn)解決的問題。
目錄
資訊內(nèi)容平臺(tái)推薦——以今日頭條為例
電商二手交易平臺(tái)推薦——以閑魚為例
O2O外賣平臺(tái)推薦——以餓了么為例
資訊內(nèi)容平臺(tái)推薦——以今日頭條為例
1. 平臺(tái)特性和推薦場(chǎng)景
內(nèi)容的形式和類目多樣:今日頭條是一個(gè)綜合內(nèi)容平臺(tái),圖文至会、視頻犬辰、UGC小視頻惹资、問答撮慨、微頭條,每種物品類型有自己的特征损晤,同時(shí)各個(gè)類型下的內(nèi)容又分屬多個(gè)類目软棺、多個(gè)層級(jí)的頻道。在推薦時(shí)尤勋,一方面需要考慮如何提取不同內(nèi)容類型的特征做好推薦喘落,另一方面也需要做好不同類型內(nèi)容的混排和頻控策略。例如最冰,問答卡片推薦的目標(biāo)不僅是吸引點(diǎn)擊和閱讀瘦棋,還要吸引用戶生產(chǎn)內(nèi)容。因此暖哨,問答卡片的推薦需要點(diǎn)擊回答率赌朋、答案數(shù)量等特征,并與用戶的長期、重度興趣相聯(lián)系箕慧。此外服球,問答卡片的展示比例、位置等都要根據(jù)用戶的行為特征和內(nèi)容特征進(jìn)行個(gè)性化颠焦,如對(duì)產(chǎn)出型的用戶增加低回答內(nèi)容的展示、對(duì)閱讀型用戶增加高質(zhì)量問答的展示往枣,等等伐庭。
資訊平臺(tái)的價(jià)值塑造:作為資訊內(nèi)容平臺(tái),今日頭條需要出于內(nèi)容生態(tài)和社會(huì)責(zé)任的考量分冈,打壓低俗內(nèi)容圾另、標(biāo)題黨、低質(zhì)內(nèi)容雕沉,進(jìn)行重要新聞的置頂集乔、加權(quán)、強(qiáng)插等坡椒,以及對(duì)時(shí)效性低扰路、重復(fù)內(nèi)容進(jìn)行降權(quán),人工干預(yù)策略必不可少倔叼。如此才能夠在個(gè)性化推送的同時(shí)汗唱,維護(hù)資訊平臺(tái)核心的信息價(jià)值。
推薦場(chǎng)景:今日頭條的使用場(chǎng)景主要包括日常上班途中丈攒、空閑時(shí)間在首頁和興趣頻道瀏覽個(gè)性化資訊哩罪;有特定閱讀目的時(shí)在頻道頁、搜索瀏覽目標(biāo)主題資訊巡验;閱讀完感興趣的資訊后在app閑逛际插。新用戶、偶爾喚醒的沉睡用戶則往往是期待或預(yù)判了產(chǎn)品的價(jià)值显设,然后主要通過主頁個(gè)性化feed進(jìn)行感知框弛,因此相對(duì)于個(gè)性化推薦更需求高質(zhì)量新熱資訊。
2. 特征構(gòu)建
為了適應(yīng)平臺(tái)特性和推薦場(chǎng)景的多樣化敷硅,今日頭條在特征構(gòu)建上有如下特色:
語義標(biāo)簽類特征:今日頭條將其分為分類特征功咒、概念特征、實(shí)體特征三類绞蹦。分類特征要盡可能覆蓋所有內(nèi)容力奋;實(shí)體特征要求精準(zhǔn),能明確區(qū)分究竟指代哪一個(gè)人或物幽七,但不要求覆蓋全面景殷;概念特征則負(fù)責(zé)解決比較精確又屬于抽象概念的語義。構(gòu)建語義標(biāo)簽體系,主要是基于今日頭條作為一個(gè)內(nèi)容平臺(tái)猿挚,內(nèi)容體量龐大咐旧、類型豐富,需要對(duì)內(nèi)容賦予粒度不同的標(biāo)簽绩蜻,以滿足各種推薦場(chǎng)景和推薦解釋的需要铣墨。
文本相似度特征:今日頭條建立了細(xì)化的文本相似度特征體系,從相似文章的主題办绝、行文伊约、主體等內(nèi)容進(jìn)行相似度計(jì)算。今日頭條用戶反饋的最大問題之一就是推薦內(nèi)容重復(fù)孕蝉,但用戶對(duì)重復(fù)的定義卻不盡相同屡律,因此需要根據(jù)用戶特征從多個(gè)維度衡量文本的相似度。例如降淮,有人覺得新聞主體人物維度的重復(fù)就是重復(fù)超埋,而對(duì)于恨不得把所有偶像文章都看一遍的粉絲而言,可能要行文內(nèi)容的重復(fù)才叫重復(fù)佳鳖。
3. 策略制定
今日頭條的策略設(shè)計(jì)霍殴,同樣要適應(yīng)平臺(tái)特征和推薦場(chǎng)景:
過濾噪聲:資訊平臺(tái)上,為了賺取點(diǎn)擊腋颠,充斥著大量的標(biāo)題黨繁成。對(duì)于用戶來說,點(diǎn)擊標(biāo)題黨內(nèi)容將造成期望與現(xiàn)實(shí)的落差淑玫,極大地?fù)p害用戶對(duì)產(chǎn)品的價(jià)值判斷和使用體驗(yàn)巾腕。因此,對(duì)諸如標(biāo)題黨一類的噪聲進(jìn)行過濾對(duì)今日頭條十分重要絮蒿。過濾策略如:過濾點(diǎn)擊后停留時(shí)間短尊搬、文本識(shí)別出標(biāo)題黨特征的內(nèi)容,以及對(duì)多發(fā)標(biāo)題黨文章的賬號(hào)進(jìn)行過濾和降權(quán)土涝。
熱點(diǎn)懲罰:資訊平臺(tái)和許多內(nèi)容量佛寿、用戶量大的平臺(tái)一樣,在用戶和物品的數(shù)據(jù)上呈現(xiàn)長尾分布但壮。因此冀泻,會(huì)出現(xiàn)少部分被大量用戶產(chǎn)生行為的熱門文章,影響用戶個(gè)性化偏好的識(shí)別蜡饵,進(jìn)而影響推薦的準(zhǔn)確性弹渔。因此,需要對(duì)熱門文章上的用戶行為做降權(quán)處理溯祸。
時(shí)間衰減:用戶肢专、內(nèi)容的特征都是隨著時(shí)間變化的舞肆。特別是對(duì)于資訊平臺(tái)的用戶和內(nèi)容來說,用戶的口味相對(duì)廣泛博杖、跟隨熱點(diǎn)椿胯,內(nèi)容更新頻率快、熱度變化快剃根,因此哩盲,對(duì)于用戶和內(nèi)容來說,新近的行為更能夠反映此時(shí)的特征狈醉,策略應(yīng)當(dāng)有所偏向种冬。
懲罰展現(xiàn):用戶的負(fù)反饋往往以隱性方式呈現(xiàn),需要捕捉舔糖。對(duì)于資訊內(nèi)容平臺(tái)來說,用戶的不感興趣往往通過展示不點(diǎn)擊來體現(xiàn)莺匠。因此金吗,需要對(duì)未被點(diǎn)擊的展示內(nèi)容相關(guān)特征進(jìn)行降權(quán)。在制定具體策略時(shí)趣竣,為了使負(fù)反饋?zhàn)R別更加準(zhǔn)確摇庙,要結(jié)合場(chǎng)景的上下文預(yù)先判斷未點(diǎn)擊內(nèi)容的展示數(shù)量、集中程度等遥缕。
參考文獻(xiàn):《今日頭條算法原理》原文鏈接
電商二手交易平臺(tái)推薦——以閑魚為例
1. 平臺(tái)特性和推薦場(chǎng)景
商品時(shí)效性強(qiáng)卫袒、個(gè)性化強(qiáng):閑魚作為一個(gè)二手商品交易平臺(tái),站內(nèi)的商品主要來自個(gè)人賣家单匣,形成了商品的孤品屬性夕凝,庫存量往往非常有限,一旦被賣掉就會(huì)被下架户秤,因此閑魚商品的時(shí)效性極強(qiáng)码秉,生命周期短,對(duì)數(shù)據(jù)的實(shí)時(shí)性要求高鸡号。此外转砖,閑魚上的許多商品出自個(gè)人賣家,類目豐富多樣鲸伴,且商品信息缺乏結(jié)構(gòu)化府蔗、規(guī)范化的信息,現(xiàn)有的電商商品標(biāo)簽特征體系很難涵蓋完全汞窗。
商品價(jià)值的主觀性:二手商品的新舊程度姓赤、功能損耗、價(jià)值描述等杉辙,都是賣家根據(jù)自己的主觀意愿對(duì)商品進(jìn)行鑒定模捂,很難客觀和規(guī)范的衡量產(chǎn)品的價(jià)值捶朵。而對(duì)于買家,商品的價(jià)值同樣是主觀的狂男。因此综看,二手商品的價(jià)格特征相對(duì)于普通電商商品更能夠反應(yīng)買家和賣家個(gè)性化的偏好。
推薦場(chǎng)景:閑魚商品的推薦場(chǎng)景以首頁的推薦流為主岖食,此外還有各種小池子推薦红碑、商品相關(guān)推薦等。由于二手商品的多樣泡垃、龐雜等和較高的時(shí)效性析珊,閑魚商品往往需要小池子推薦,以特定的商品類目蔑穴、購物場(chǎng)景等進(jìn)行劃分忠寻,以整合商品信息、增加長尾曝光存和,提高商品分發(fā)的效率奕剃。
2. 特征構(gòu)建
二手商品標(biāo)簽體系構(gòu)建:二手商品的信息結(jié)構(gòu)化程度低,因此需要大量結(jié)構(gòu)化工作的投入捐腿。目前纵朋,閑魚通過在商品發(fā)布的各個(gè)環(huán)節(jié)都提供了同款關(guān)聯(lián)的入口,通過同款信息的匹配和映射實(shí)現(xiàn)商品信息的結(jié)構(gòu)化茄袖,如對(duì)發(fā)布時(shí)的信息和圖片進(jìn)行相似度檢測(cè)操软、圖像識(shí)別、引導(dǎo)用戶關(guān)聯(lián)等宪祥,并利用已有的電商數(shù)據(jù)體系聂薪。對(duì)于非標(biāo)品,則可以從用戶需求倒推品山,通過搜索推薦等導(dǎo)購場(chǎng)景反向分析可以拿到當(dāng)前買家關(guān)心的品類和屬性胆建,從而補(bǔ)齊缺失數(shù)據(jù)。
3. 策略制定
小商品池推薦:如前文所述肘交,閑魚平臺(tái)商品具有多樣笆载、個(gè)性、非標(biāo)準(zhǔn)化涯呻,因此為幫助用戶更好的交易凉驻,減少在交易過程中的信息不對(duì)稱,增加商品的曝光复罐,需要根據(jù)人工規(guī)則預(yù)先篩選出一部分商品再進(jìn)行推薦涝登,在閑魚中以頻道導(dǎo)購的形式展示給用戶。小商品池具有實(shí)時(shí)性效诅,要求商品可以實(shí)時(shí)的流入胀滚、流出小商品池趟济,從而為用戶提供最新的優(yōu)質(zhì)商品;此外也具有更強(qiáng)的多樣性咽笼,不同于普通的頻道分類導(dǎo)購聚合同一類目的商品顷编,二手商品小池子的聚合更適合購物場(chǎng)景、購物群體下多品類商品的聚合剑刑,因此媳纬,對(duì)于不同品類商品的篩選、占比和排布需要策略設(shè)計(jì)施掏。
實(shí)時(shí)商品推薦:閑魚平臺(tái)上钮惠,二手商品的流入、流出十分頻繁七芭,新增商品需要實(shí)時(shí)更新數(shù)據(jù)素挽,更需要在行為數(shù)據(jù)較少的情況下進(jìn)行實(shí)時(shí)推薦。因此狸驳,可以對(duì)新發(fā)布商品在小池子中進(jìn)行一定時(shí)間內(nèi)的提權(quán)毁菱,以增加曝光促進(jìn)教育,以及收集更多數(shù)據(jù)進(jìn)行更精準(zhǔn)的推薦锌历。
參考文獻(xiàn):《推薦算法在閑魚小商品池的探索與實(shí)踐》,原文鏈接
O2O外賣平臺(tái)推薦——以餓了么為例
1. 平臺(tái)特性和推薦場(chǎng)景
用戶峦筒、物品多樣:餓了么推薦平臺(tái)作為流量分發(fā)的中樞究西,連接著用戶(流量)、商家(供給)和平臺(tái)本身物喷。對(duì)于用戶主要是提供良好的決策體驗(yàn)卤材,并優(yōu)化整個(gè)鏈路的體驗(yàn);對(duì)于商家側(cè)則要帶來精準(zhǔn)的流量和訂單的提升峦失,并提升商家的曝光效率扇丛,幫助商家在平臺(tái)上成長;對(duì)于平臺(tái)而言尉辑,核心是提供流量變現(xiàn)帆精、交易價(jià)值以及建設(shè)好健康的流量生態(tài),服務(wù)于平臺(tái)的長期目標(biāo)隧魄。餓了么的核心流量分發(fā)入口是搜索推薦卓练,場(chǎng)景覆蓋90%以上的用戶。這些流量的來源平臺(tái)多樣购啄,有餓了么襟企、支付寶、手淘狮含、小程序/H5等顽悼,且去向類目豐富曼振,除了美食還有商超、鮮花蔚龙、生鮮冰评、醫(yī)藥等。
區(qū)域分異府蛇,情況復(fù)雜:外賣業(yè)務(wù)的流量成點(diǎn)狀區(qū)域分布集索,每個(gè)區(qū)域的城市發(fā)展階段、商戶分布特征汇跨、外賣消費(fèi)特征务荆、流量分布不同。因此需要對(duì)流量進(jìn)行人工調(diào)控穷遂,以為結(jié)合地區(qū)特征制定差異化的策略函匕。
時(shí)間敏感:外賣用戶時(shí)間敏感,尤其是用餐高峰期蚪黑。外賣業(yè)務(wù)的流程與傳統(tǒng)電商相比盅惜,核心區(qū)別點(diǎn)在于商家出餐和及時(shí)配送過程。下單后的出餐與配送時(shí)間是用戶體驗(yàn)的重要要素忌穿。因此抒寂,除了根據(jù)用戶對(duì)于商家的喜好以及轉(zhuǎn)化衡量推薦質(zhì)量,還需要考慮配送時(shí)長掠剑,以發(fā)現(xiàn)用戶體驗(yàn)層面的問題屈芜。
峰值效應(yīng)與資源約束:高峰時(shí)段是普通時(shí)段的幾十倍,給工程帶來挑戰(zhàn)的同時(shí)朴译,高峰期用戶行為分布變化較快井佑,也對(duì)快速捕捉用戶行為提出了較高的要求。同時(shí)眠寿,餐廳躬翁、騎手、運(yùn)營資源都在固定時(shí)間比較有限盯拱,如何在多重約束的情況下綜合優(yōu)化用戶體驗(yàn)也是挑戰(zhàn)盒发。
3. 策略制定
市場(chǎng)機(jī)制:目的是效率最大化。推薦算法的目標(biāo)可以拆解為分配流量狡逢、內(nèi)容供給迹辐、促進(jìn)轉(zhuǎn)化和實(shí)現(xiàn)交易。其中甚侣,推薦對(duì)提高轉(zhuǎn)化效率起關(guān)鍵作用明吩,可進(jìn)一步將推薦解決方案拆解為點(diǎn)擊、轉(zhuǎn)化殷费、客單價(jià)印荔、單筆收益低葫、決策效率、就餐體驗(yàn)仍律、等待時(shí)間等模型的構(gòu)建和組合嘿悬,以實(shí)現(xiàn)優(yōu)化目標(biāo)。而優(yōu)化目標(biāo)的制定也根據(jù)產(chǎn)品特性和實(shí)際的測(cè)量效果有所調(diào)整和偏重水泉,經(jīng)歷轉(zhuǎn)化率善涨、訪購率、毛GMV草则、凈GMV钢拧、凈GMV+UE的變化。
調(diào)控手段:目的是效率最大化基礎(chǔ)上的流量再分配炕横。如果單純以最大化單日GMV為目標(biāo)源内,會(huì)存在流量分布的馬太效應(yīng)以及新店成長問題。而調(diào)控手段則主要解決長期平臺(tái)生態(tài)問題份殿,包括多個(gè)方面的平衡膜钓,如:用戶對(duì)商家、商品的偏好以及總體滿意度方面的平衡卿嘲;當(dāng)天立即下單轉(zhuǎn)化的需求和對(duì)用戶興趣探索成本的平衡颂斜;自然流量效率和商家在平臺(tái)成長或賦能線下商家間的平衡;平臺(tái)短期收益和長期生態(tài)間的平衡拾枣;不同業(yè)務(wù)線間流量平衡焚鲜、短期平臺(tái)廣告收入與平臺(tái)轉(zhuǎn)化間的平衡,等等放前。此外,基于算法模型產(chǎn)生的數(shù)據(jù)層面的最佳結(jié)果糯彬,并不一定符合人的認(rèn)知凭语。例如,基于ctr預(yù)估的邏輯會(huì)展示更多用戶已經(jīng)點(diǎn)擊和購買的商戶撩扒,不易滿足探索嘗鮮型用戶的需求似扔,不利于拓展推薦結(jié)果的多樣性。
因此搓谆,可以從以下方面進(jìn)行人工的調(diào)控手段:
商戶類型打散和強(qiáng)插炒辉。為防止同類商戶扎堆,人為設(shè)置同類型商戶連續(xù)出現(xiàn)的最大值泉手,并強(qiáng)插非相關(guān)商戶和食物以拓展興趣黔寇。
商戶質(zhì)量重排。為保證前排推薦商戶的質(zhì)量斩萌,對(duì)應(yīng)影響質(zhì)量的關(guān)鍵因素缝裤,例如食物數(shù)量屏轰、分值進(jìn)行低質(zhì)降權(quán)和沉底。
重排力度和優(yōu)先級(jí)設(shè)置憋飞。不同區(qū)域商戶特征差異大霎苗,對(duì)于連鎖店聚集的地域,如公司辦公區(qū)域周邊榛做,加強(qiáng)商戶名稱唁盏、類型的打散;不同重排策略的先后順序和優(yōu)先級(jí)也會(huì)影響到重排結(jié)果检眯,越靠后的重排策略優(yōu)先級(jí)越高厘擂。
參考文獻(xiàn):《餓了么推薦系統(tǒng):從0到1》原文鏈接
《外賣推薦算法中有哪些機(jī)制與手段?》原文鏈接
To be continued...
本人對(duì)行業(yè)和業(yè)務(wù)理解有限轰传,歡迎大家評(píng)論驴党、私信提出意見建議~