問題描述
在有限的device屏幕下,做下面各種沖突的平衡躬柬。
- accurate v.s. diverse查乒;
- 推薦算法 v.s. 重定向策略(比如繼續(xù)看、重看)姆另;
- 關(guān)注深度 v.s. 關(guān)注廣度喇肋;
- 用戶自身風(fēng)格的延續(xù) v.s. 幫助用戶發(fā)現(xiàn)新的興趣;
解決方法
傳統(tǒng)方法
一般傳統(tǒng)方法使用規(guī)則模版來實現(xiàn)迹辐。比如填坑法蝶防,什么坑放什么內(nèi)容是模版定義的,每個坑里面具體放什么內(nèi)容列表是由算法產(chǎn)生明吩。但是间学,這樣的做法會帶來一個問題:不便于業(yè)務(wù)發(fā)展,比如UI改版沒有什么依據(jù)印荔,全憑個人主觀論斷低葫。
機器方法
算法自動生成整個頁面也可以分成兩種,一種簡單粗放仍律,一種更加細(xì)致一些嘿悬。
簡單粗放的方法就是row-ranking,使用算法自動展示不同策略水泉,一個個的排列起來善涨,完成page生成。這種方法簡單直接草则,但是可能會出現(xiàn)多樣性問題钢拧。也就是將相似策略的結(jié)果一起都推薦給了用戶。
更加細(xì)致一點地方法就是使用stage-wise方法來取代row-ranking炕横。在選擇策略時源内,需要考慮該策略和前后策略的相關(guān)性等。具體來說份殿,可以使用貪心算法來進行簡單處理:
- 定義一個明確的score function膜钓;
- 選擇一個策略,使得該score function最大卿嘲;
- 在選擇一個策略颂斜,重新計算已有策略的score,使得score function最大腔寡;
- repeat 3直到策略足夠焚鲜。
另外掌唾,還可以使用機器學(xué)習(xí)的方法放前。機器學(xué)習(xí)方法的難點如下:
- 定義一個明確的score function忿磅;
- 如果克服presentation bias的問題,注意這里不僅僅是position bias凭语;
多樣性機器學(xué)習(xí)算法且看下回分解葱她,參考論文如下。
http://www.wsdm2009.org/papers/p5-agrawal.pdf
A/B實驗的指標(biāo)
定義Recall@m-by-n: 也就是m個策略似扔,每個策略出n個結(jié)果的recall吨些。
參考資料
Learning a Personalized Homepage: http://techblog.netflix.com/2015_04_01_archive.html