前言:
畢業(yè)半年捎迫,在一家電商公司從事推薦的產(chǎn)品工作诈泼。上班的這半年從對推薦系統(tǒng)的了解只有“亞馬遜上面的看了該商品的用戶還看了”和“淘寶上面的猜你喜歡”之外一無所知的菜鳥析命,到如今的略懂尿庐。感覺是時候?qū)懸粚憱|西,整理一下自己的思路腹缩。
推薦系統(tǒng)經(jīng)過這么多年的發(fā)展,已經(jīng)是一個很完善的系統(tǒng)空扎。本系列文章會從推薦系統(tǒng)的后臺管理系統(tǒng)藏鹊,推薦系統(tǒng)的前端展示及交互設(shè)計,推薦系統(tǒng)如何跟業(yè)務(wù)需求場景結(jié)合转锈,以及對目前主流的推薦算法綜述這幾方面來介紹一下推薦系統(tǒng)的全貌盘寡。由于本人剛參加工作不久,也不是科班出身撮慨,更是第一次嘗試寫這一類的博客竿痰。所以有什么寫的不好或者不準確的地方脆粥,歡迎讀者和同行進行指正,本人萬分感謝影涉。
正文:
本篇文章作為該系列的第一篇文章冠绢,主要介紹一下推薦系統(tǒng)的后臺管理系統(tǒng)。以本人接觸到后臺系統(tǒng)的為樣本常潮,向大家介紹一下推薦后臺管理系統(tǒng)必須具備的一些功能弟胀。首先給大家看一張推薦后臺的功能體系概覽圖:
一般的推薦后臺管理系統(tǒng)會涉及一下幾個基本功能:①推薦效果數(shù)據(jù)②推薦算法管理③分析工具。下面我就分模塊的介紹一下
一喊式、推薦效果數(shù)據(jù)
彼得德魯克有一句名言:“如果你無法衡量它孵户,那么你就無法改進它”。這句話用在推薦系統(tǒng)真的是再適合不過岔留,推薦系統(tǒng)是一個典型的數(shù)據(jù)驅(qū)動型的產(chǎn)品夏哭。在這一前提下,所有有關(guān)于推薦系統(tǒng)的決策都需要以數(shù)據(jù)作為依據(jù)献联。在推薦效果數(shù)據(jù)功能下又分為(1)關(guān)鍵指標數(shù)據(jù)功能(2)推薦系統(tǒng)性能數(shù)據(jù)
(1)關(guān)鍵數(shù)據(jù)指標功能
a.展位層次
關(guān)鍵數(shù)據(jù)指標功能是指竖配,對于一個推薦的展位,對于考核該展位效果的指標數(shù)據(jù)里逆,比如在電商行業(yè)中最關(guān)心的CVR进胯,CVR、千次展示GMV以及其他關(guān)鍵指標原押。通過檢測這些指標胁镐,可以很清晰的知道哪一些展位對于公司的利潤貢獻是最大的。在關(guān)鍵指標的基礎(chǔ)上诸衔,加上時間維度盯漂,就可以清晰的檢測到某一具體展位在本時間區(qū)間之內(nèi)的關(guān)鍵指標的變化情況,直接反饋了這段時間內(nèi)工程師們對該展位下算法的優(yōu)化是否是有效的(排除促銷等外部因素干擾)笨农,如果是有效的就缆,提升的幅度有多少;如果是不利的谒亦,就可以針對行的進行排查優(yōu)化竭宰。
b.策略層次
上面介紹的是關(guān)于對于展位級的數(shù)據(jù)的檢測,但是在推薦系統(tǒng)中诊霹,經(jīng)常會進行A/B測試羞延,也就是在同一個展位下部署多個不同的策略,通過分流來比較策略之間的效果好壞脾还,這個時候就不能單單對這個展位進行數(shù)據(jù)的監(jiān)測伴箩,而是應該將監(jiān)測的粒度細化到展位下策略的維度,通過對同一展位下多個策略鄙漏,比較他們在統(tǒng)一口徑下的指標效果嗤谚,這樣就可以很直觀的判斷出該展位下多個策略的優(yōu)劣棺蛛。這一數(shù)據(jù)也直接地為策略的上下線以及流量的切分比例提供強有力的決策依據(jù)。同樣的巩步,對于策略層級的數(shù)據(jù)監(jiān)測也應該提供展示時間區(qū)間內(nèi)變化趨勢的功能旁赊。
(2)性能方面
目前,推薦系統(tǒng)是很少作為一個獨立的產(chǎn)品出現(xiàn)的椅野,主要是結(jié)合其他的業(yè)務(wù)形態(tài)终畅,比如新聞,視頻竟闪,音樂离福,商品等。所以推薦系統(tǒng)基本上在數(shù)據(jù)流上面是會進行跨部門的傳輸炼蛤,這個時候就需要對推薦系統(tǒng)的數(shù)據(jù)流的各個環(huán)節(jié)進行監(jiān)控妖爷。包括各個接口的響應時間,響應率理朋,超時率絮识,整體服務(wù)的性能效率分布情況等。這些對于研發(fā)工程師及架構(gòu)工程師有著很大的參考意義嗽上,一般而言推薦系統(tǒng)的響應時間基本上決定于最慢的那一個接口的相應時間次舌,這是典型的木桶短板效應。通過性能的監(jiān)控可以幫助研發(fā)工程定位問題的范圍炸裆,進而針對性的優(yōu)化推薦系統(tǒng)的瓶頸垃它。
二、算法管理
(1)算法的測試與發(fā)布
算法工程師在開發(fā)算法的過程中烹看,有時候需要在測試環(huán)境中模擬一下線上的情況,并以此不斷的優(yōu)化算法洛史。但是由于通常的數(shù)據(jù)庫都是命令行的展現(xiàn)效果惯殊,沒能很好的模擬展示線上的效果,所以需要開發(fā)一個供算法工程師模擬線上效果的可視化的環(huán)境也殖,便于測試土思。
(2)算法A/B測試管理
該功能與上文提到的展位下多策略部署功能是一致的。對于某一展位忆嗜,可能有多個策略己儒,這個時候就需要后臺管理系統(tǒng)提供一個可供配置的功能,以便于我們在展位下部署新策略和對策略進行流量權(quán)重的調(diào)整捆毫。
三闪湾、展位管理
(1)展位算法接入
如上文所說,推薦系統(tǒng)本身不能獨立存在绩卤,一般是結(jié)合具體的業(yè)務(wù)形態(tài)出現(xiàn)的途样。那么在業(yè)務(wù)方出現(xiàn)新的需求或者在原有的業(yè)務(wù)基礎(chǔ)上挖掘出新的展位時江醇,我們就需要通過管理系統(tǒng)新增一個推薦展位,并為其配備相應的推薦算法何暇。在配置時需要設(shè)置該推薦展位的位置陶夜,終端屬性,等其他必須的缺省屬性裆站。這個受到不同業(yè)務(wù)形態(tài)的影響条辟,所以各個公司應該都有不同的配置項。
(2)展位前端效果設(shè)置
對于推薦系統(tǒng)最終的效果的影響因素宏胯,知乎有人評論道:60%取決于UI效果羽嫡,30%取決于數(shù)據(jù)處理,只有10%取決于算法胳嘲。雖然不能確定這個說法是否正確厂僧,但是由此可見前端UI對于推薦效果有著舉足輕重的影響。所以后臺管理系統(tǒng)應該支持對于前端展位樣式的選擇和配置了牛,這一方面颜屠,淘寶可以說是做的比較好的,如下圖:
淘寶為首頁的推薦展位設(shè)計了多種的展示模板鹰祸,包括推薦槽位的大小甫窟,個數(shù),樣式都進行了設(shè)置蛙婴。業(yè)務(wù)方可以根據(jù)自己的需求進行個性化配置粗井。并且淘寶支持業(yè)務(wù)人工干預,即該模塊支持推薦數(shù)據(jù)/運營數(shù)據(jù)的人工培植街图。
四浇衬、分析工具
上文說了這么多關(guān)于后天管理系統(tǒng)的功能,有面向業(yè)務(wù)人員餐济,有面向算法人員耘擂,有面向研發(fā)人員,但是分析人員呢絮姆?所以分析工具就是面向分析人員的功能
(1)時間趨勢醉冤,同環(huán)比
分析工具中的報表功能,支持在某一時間區(qū)間內(nèi)篙悯,對某一展位的某一關(guān)鍵指標進行展示蚁阳,由此精細化的分析推薦效果變化趨勢,當然也支持雙指標和多指標的同時檢測鸽照。由于分析人員使用該功能的目的是進行分析報告的制作螺捐,所以支持圖表下載功能也是必須的。
(2)推薦效果分布情況
這一功能主要是對于由推薦系統(tǒng)創(chuàng)造的業(yè)務(wù)收入的分布情況,在電商行業(yè)可能就是品類的分布情況归粉,在新聞資訊行業(yè)可能就是新聞頻道的分布情況椿疗,在視頻行業(yè)可能就是視頻類型的分布等等。這一功能的主要目的是預測該行業(yè)下細分項目的流行趨勢糠悼。為排行版等場景提供支持届榄。
總結(jié)
以上就是接觸推薦后臺的半年來的大致了解,當然只是一個很膚淺的解讀倔喂。算是一個推薦系統(tǒng)入門者對于整個推薦系統(tǒng)中一個小版塊的解讀吧铝条。文中凡有撰寫不當及表述不清楚的地方,歡迎各位讀者提出指正席噩,再次先謝謝大家班缰。個性化推薦是時代的趨勢,相信推薦系統(tǒng)也會有一個美好的明天吧悼枢。最后附上個人的微信號二維碼埠忘,歡迎有興趣一起探討關(guān)于個性化推薦領(lǐng)域的小伙伴騷擾~
作者:菜菜粽餅
鏈接:http://www.reibang.com/p/f1ce923d09a0
來源:簡書
簡書著作權(quán)歸作者所有,任何形式的轉(zhuǎn)載都請聯(lián)系作者獲得授權(quán)并注明出處馒索。