前言:
畢業(yè)半年,在一家電商公司從事推薦的產(chǎn)品工作苦银。上班的這半年從對(duì)推薦系統(tǒng)的了解只有“亞馬遜上面的看了該商品的用戶還看了”和“淘寶上面的猜你喜歡”之外一無(wú)所知的菜鳥(niǎo)命雀,到如今的略懂舔示。感覺(jué)是時(shí)候?qū)懸粚?xiě)東西,整理一下自己的思路逞频。
推薦系統(tǒng)經(jīng)過(guò)這么多年的發(fā)展,已經(jīng)是一個(gè)很完善的系統(tǒng)栋齿。本系列文章會(huì)從推薦系統(tǒng)的后臺(tái)管理系統(tǒng)苗胀,推薦系統(tǒng)的前端展示及交互設(shè)計(jì)襟诸,推薦系統(tǒng)如何跟業(yè)務(wù)需求場(chǎng)景結(jié)合,以及對(duì)目前主流的推薦算法綜述這幾方面來(lái)介紹一下推薦系統(tǒng)的全貌基协。由于本人剛參加工作不久歌亲,也不是科班出身,更是第一次嘗試寫(xiě)這一類的博客澜驮。所以有什么寫(xiě)的不好或者不準(zhǔn)確的地方陷揪,歡迎讀者和同行進(jìn)行指正,本人萬(wàn)分感謝杂穷。
正文:
本篇文章作為該系列的第一篇文章悍缠,主要介紹一下推薦系統(tǒng)的后臺(tái)管理系統(tǒng)。以本人接觸到后臺(tái)系統(tǒng)的為樣本耐量,向大家介紹一下推薦后臺(tái)管理系統(tǒng)必須具備的一些功能飞蚓。首先給大家看一張推薦后臺(tái)的功能體系概覽圖:
一般的推薦后臺(tái)管理系統(tǒng)會(huì)涉及一下幾個(gè)基本功能:①推薦效果數(shù)據(jù)②推薦算法管理③分析工具。下面我就分模塊的介紹一下
一廊蜒、推薦效果數(shù)據(jù)
彼得德魯克有一句名言:“如果你無(wú)法衡量它趴拧,那么你就無(wú)法改進(jìn)它”。這句話用在推薦系統(tǒng)真的是再適合不過(guò)劲藐,推薦系統(tǒng)是一個(gè)典型的數(shù)據(jù)驅(qū)動(dòng)型的產(chǎn)品八堡。在這一前提下,所有有關(guān)于推薦系統(tǒng)的決策都需要以數(shù)據(jù)作為依據(jù)聘芜。在推薦效果數(shù)據(jù)功能下又分為(1)關(guān)鍵指標(biāo)數(shù)據(jù)功能(2)推薦系統(tǒng)性能數(shù)據(jù)
(1)關(guān)鍵數(shù)據(jù)指標(biāo)功能
a.展位層次
關(guān)鍵數(shù)據(jù)指標(biāo)功能是指兄渺,對(duì)于一個(gè)推薦的展位,對(duì)于考核該展位效果的指標(biāo)數(shù)據(jù)汰现,比如在電商行業(yè)中最關(guān)心的CVR挂谍,CVR、千次展示GMV以及其他關(guān)鍵指標(biāo)瞎饲。通過(guò)檢測(cè)這些指標(biāo)口叙,可以很清晰的知道哪一些展位對(duì)于公司的利潤(rùn)貢獻(xiàn)是最大的。在關(guān)鍵指標(biāo)的基礎(chǔ)上嗅战,加上時(shí)間維度妄田,就可以清晰的檢測(cè)到某一具體展位在本時(shí)間區(qū)間之內(nèi)的關(guān)鍵指標(biāo)的變化情況,直接反饋了這段時(shí)間內(nèi)工程師們對(duì)該展位下算法的優(yōu)化是否是有效的(排除促銷等外部因素干擾)驮捍,如果是有效的疟呐,提升的幅度有多少勾效;如果是不利的酗失,就可以針對(duì)行的進(jìn)行排查優(yōu)化。
b.策略層次
上面介紹的是關(guān)于對(duì)于展位級(jí)的數(shù)據(jù)的檢測(cè)应媚,但是在推薦系統(tǒng)中珊泳,經(jīng)常會(huì)進(jìn)行A/B測(cè)試鲁冯,也就是在同一個(gè)展位下部署多個(gè)不同的策略拷沸,通過(guò)分流來(lái)比較策略之間的效果好壞,這個(gè)時(shí)候就不能單單對(duì)這個(gè)展位進(jìn)行數(shù)據(jù)的監(jiān)測(cè)薯演,而是應(yīng)該將監(jiān)測(cè)的粒度細(xì)化到展位下策略的維度撞芍,通過(guò)對(duì)同一展位下多個(gè)策略,比較他們?cè)诮y(tǒng)一口徑下的指標(biāo)效果涣仿,這樣就可以很直觀的判斷出該展位下多個(gè)策略的優(yōu)劣勤庐。這一數(shù)據(jù)也直接地為策略的上下線以及流量的切分比例提供強(qiáng)有力的決策依據(jù)。同樣的好港,對(duì)于策略層級(jí)的數(shù)據(jù)監(jiān)測(cè)也應(yīng)該提供展示時(shí)間區(qū)間內(nèi)變化趨勢(shì)的功能愉镰。
(2)性能方面
目前,推薦系統(tǒng)是很少作為一個(gè)獨(dú)立的產(chǎn)品出現(xiàn)的钧汹,主要是結(jié)合其他的業(yè)務(wù)形態(tài)丈探,比如新聞,視頻拔莱,音樂(lè)碗降,商品等。所以推薦系統(tǒng)基本上在數(shù)據(jù)流上面是會(huì)進(jìn)行跨部門的傳輸塘秦,這個(gè)時(shí)候就需要對(duì)推薦系統(tǒng)的數(shù)據(jù)流的各個(gè)環(huán)節(jié)進(jìn)行監(jiān)控讼渊。包括各個(gè)接口的響應(yīng)時(shí)間,響應(yīng)率尊剔,超時(shí)率爪幻,整體服務(wù)的性能效率分布情況等。這些對(duì)于研發(fā)工程師及架構(gòu)工程師有著很大的參考意義须误,一般而言推薦系統(tǒng)的響應(yīng)時(shí)間基本上決定于最慢的那一個(gè)接口的相應(yīng)時(shí)間挨稿,這是典型的木桶短板效應(yīng)。通過(guò)性能的監(jiān)控可以幫助研發(fā)工程定位問(wèn)題的范圍京痢,進(jìn)而針對(duì)性的優(yōu)化推薦系統(tǒng)的瓶頸奶甘。
二、算法管理
(1)算法的測(cè)試與發(fā)布
算法工程師在開(kāi)發(fā)算法的過(guò)程中祭椰,有時(shí)候需要在測(cè)試環(huán)境中模擬一下線上的情況臭家,并以此不斷的優(yōu)化算法。但是由于通常的數(shù)據(jù)庫(kù)都是命令行的展現(xiàn)效果方淤,沒(méi)能很好的模擬展示線上的效果侣监,所以需要開(kāi)發(fā)一個(gè)供算法工程師模擬線上效果的可視化的環(huán)境,便于測(cè)試臣淤。
(2)算法A/B測(cè)試管理
該功能與上文提到的展位下多策略部署功能是一致的。對(duì)于某一展位窃爷,可能有多個(gè)策略邑蒋,這個(gè)時(shí)候就需要后臺(tái)管理系統(tǒng)提供一個(gè)可供配置的功能姓蜂,以便于我們?cè)谡刮幌虏渴鹦虏呗院蛯?duì)策略進(jìn)行流量權(quán)重的調(diào)整。
三医吊、展位管理
(1)展位算法接入
如上文所說(shuō)钱慢,推薦系統(tǒng)本身不能獨(dú)立存在,一般是結(jié)合具體的業(yè)務(wù)形態(tài)出現(xiàn)的卿堂。那么在業(yè)務(wù)方出現(xiàn)新的需求或者在原有的業(yè)務(wù)基礎(chǔ)上挖掘出新的展位時(shí)束莫,我們就需要通過(guò)管理系統(tǒng)新增一個(gè)推薦展位,并為其配備相應(yīng)的推薦算法草描。在配置時(shí)需要設(shè)置該推薦展位的位置览绿,終端屬性,等其他必須的缺省屬性穗慕。這個(gè)受到不同業(yè)務(wù)形態(tài)的影響饿敲,所以各個(gè)公司應(yīng)該都有不同的配置項(xiàng)。
(2)展位前端效果設(shè)置
對(duì)于推薦系統(tǒng)最終的效果的影響因素逛绵,知乎有人評(píng)論道:60%取決于UI效果怀各,30%取決于數(shù)據(jù)處理,只有10%取決于算法术浪。雖然不能確定這個(gè)說(shuō)法是否正確瓢对,但是由此可見(jiàn)前端UI對(duì)于推薦效果有著舉足輕重的影響。所以后臺(tái)管理系統(tǒng)應(yīng)該支持對(duì)于前端展位樣式的選擇和配置胰苏,這一方面硕蛹,淘寶可以說(shuō)是做的比較好的,如下圖:
淘寶為首頁(yè)的推薦展位設(shè)計(jì)了多種的展示模板碟联,包括推薦槽位的大小妓美,個(gè)數(shù),樣式都進(jìn)行了設(shè)置鲤孵。業(yè)務(wù)方可以根據(jù)自己的需求進(jìn)行個(gè)性化配置壶栋。并且淘寶支持業(yè)務(wù)人工干預(yù),即該模塊支持推薦數(shù)據(jù)/運(yùn)營(yíng)數(shù)據(jù)的人工培植普监。
四贵试、分析工具
上文說(shuō)了這么多關(guān)于后天管理系統(tǒng)的功能,有面向業(yè)務(wù)人員凯正,有面向算法人員毙玻,有面向研發(fā)人員,但是分析人員呢廊散?所以分析工具就是面向分析人員的功能
(1)時(shí)間趨勢(shì)桑滩,同環(huán)比
分析工具中的報(bào)表功能,支持在某一時(shí)間區(qū)間內(nèi)允睹,對(duì)某一展位的某一關(guān)鍵指標(biāo)進(jìn)行展示运准,由此精細(xì)化的分析推薦效果變化趨勢(shì)幌氮,當(dāng)然也支持雙指標(biāo)和多指標(biāo)的同時(shí)檢測(cè)。由于分析人員使用該功能的目的是進(jìn)行分析報(bào)告的制作胁澳,所以支持圖表下載功能也是必須的该互。
(2)推薦效果分布情況
這一功能主要是對(duì)于由推薦系統(tǒng)創(chuàng)造的業(yè)務(wù)收入的分布情況,在電商行業(yè)可能就是品類的分布情況韭畸,在新聞資訊行業(yè)可能就是新聞?lì)l道的分布情況宇智,在視頻行業(yè)可能就是視頻類型的分布等等。這一功能的主要目的是預(yù)測(cè)該行業(yè)下細(xì)分項(xiàng)目的流行趨勢(shì)胰丁。為排行版等場(chǎng)景提供支持随橘。
總結(jié)
以上就是接觸推薦后臺(tái)的半年來(lái)的大致了解,當(dāng)然只是一個(gè)很膚淺的解讀隘马。算是一個(gè)推薦系統(tǒng)入門者對(duì)于整個(gè)推薦系統(tǒng)中一個(gè)小版塊的解讀吧太防。文中凡有撰寫(xiě)不當(dāng)及表述不清楚的地方,歡迎各位讀者提出指正酸员,再次先謝謝大家蜒车。個(gè)性化推薦是時(shí)代的趨勢(shì),相信推薦系統(tǒng)也會(huì)有一個(gè)美好的明天吧幔嗦。最后附上個(gè)人的微信號(hào)二維碼酿愧,歡迎有興趣一起探討關(guān)于個(gè)性化推薦領(lǐng)域的小伙伴騷擾~