多路召回策略澈段,是指采用不同的策略、特征或簡(jiǎn)單模型舰攒,分別召回一部分候選集败富,然后將候選集合并在一起用于后續(xù)排序模型使用。多路召回通常需要在計(jì)算速度和召回率之間權(quán)衡選擇摩窃,簡(jiǎn)單的召回策略可以快速召回候選集兽叮,不同角度設(shè)計(jì)的召回策略可以盡量滿足召回率。多路召回中偶芍,每個(gè)策略之間毫不相關(guān)充择,一般可以寫并發(fā)多線程同時(shí)進(jìn)行德玫。
此次多路召回策略包含:
-
Youtube DNN召回
YoutubeDNN召回可直接獲取用戶召回的候選文章列表匪蟀,原理及應(yīng)用可看:- 重讀Youtube深度學(xué)習(xí)推薦系統(tǒng)論文,字字珠璣宰僧,驚為神文 (zhihu.com)
- YouTube深度學(xué)習(xí)推薦系統(tǒng)的十大工程問(wèn)題 (zhihu.com)
- https://zhuanlan.zhihu.com/p/52169807 (YouTubeDNN原理)
- https://zhuanlan.zhihu.com/p/26306795 (Word2Vec知乎眾贊文章) --- word2vec放到排序中的w2v的介紹部分
-
基于文章的召回
根據(jù)物品相似度材彪,對(duì)用戶推薦與其歷史閱讀文章相似的文章- 基于關(guān)聯(lián)規(guī)則物品協(xié)同過(guò)濾
- 物品embedding相似度召回
-
基于用戶的召回
根據(jù)用戶相似度,對(duì)用戶推薦與該用戶相似的用戶群閱讀的文章- 基于關(guān)聯(lián)規(guī)則用戶協(xié)同過(guò)濾(太吃內(nèi)存沒(méi)有運(yùn)行)
- 用戶embedding相似度召回(使用YoutubeDNN訓(xùn)練得到的embedding)
文章冷啟動(dòng)召回
冷啟動(dòng)做法:1.基于embedding召回部分與用戶歷史相似的文章
2.采用文章字?jǐn)?shù)琴儿,文章主題段化,閱讀時(shí)間等規(guī)則過(guò)濾
冷啟動(dòng)問(wèn)題可分成三類:文章冷啟動(dòng)、用戶冷啟動(dòng)造成、系統(tǒng)冷啟動(dòng)
多路召回合并:對(duì)不同召回策略取得的候選集合合并時(shí)显熏,可通過(guò)召回策略評(píng)估結(jié)果調(diào)整召回策略的權(quán)重。