Hulu推薦系統(tǒng)—工業(yè)界推薦系統(tǒng)

這次Hulu講工業(yè)界的推薦系統(tǒng),主講人好像是個(gè)萌妹子婆誓。這講主要是如何把模型運(yùn)用到真實(shí)的推薦系統(tǒng)中扩淀。

工業(yè)界推薦系統(tǒng)是為了什么计露?

1 推薦系統(tǒng)可以應(yīng)用在不同的場景下

2 推薦系統(tǒng)是為了處理信息過載著榴,把用戶感興趣的信息呈現(xiàn)在用戶面前

3 推薦系統(tǒng)服務(wù)已經(jīng)成為互聯(lián)網(wǎng)公司(Tik Tok, Hulu,amazon等)比較重要的服務(wù)

工業(yè)界推薦系統(tǒng)的流程

推薦系統(tǒng)的服務(wù)化

輸入:用戶添履,上下文信息,商品列表脑又,歷史記錄暮胧,和其他的特征

處理過程:轉(zhuǎn)化輸入成特征,調(diào)用推薦模型已經(jīng)其他模型(熱門榜單问麸,廣告推薦等)往衷,商品數(shù)據(jù)是從數(shù)據(jù)儲存中粗篩得到,

輸出:有順序的前幾個(gè)商品類別

推薦系統(tǒng)的自我維護(hù):

收集并且生成訓(xùn)練數(shù)據(jù)集

訓(xùn)練模型并且更新參數(shù)


2013 Netflix推薦系統(tǒng)?

2013年Netfilx提出的推薦系統(tǒng)分三部分組成:Online,Nearline和Offline口叙。Online部分是最接近用戶的部分炼绘,可以得到最新鮮的數(shù)據(jù)嗅战,它可以快速調(diào)用模型并給予結(jié)果妄田;它對于每個(gè)請求都是即來即算,需要對模型有快速的計(jì)算速度和可靠性;它的缺點(diǎn)是沒法使用復(fù)雜的模型驮捍。Offline部分可以通過hadoop等大數(shù)據(jù)處理軟件對于數(shù)據(jù)進(jìn)行更新并儲存疟呐;它對于及時(shí)性要求比較低,它可以做一些比較重的計(jì)算东且。Nearline時(shí)間和性能介于Offine和Online之間启具。Nearline處理時(shí)間,并且同步計(jì)算到用戶事件珊泳;它通常被用來做上下文無關(guān)的計(jì)算鲁冯。

從使用場景出發(fā)

因?yàn)橥扑]算法的使用場景的不同拷沸,所以我們設(shè)計(jì)的推薦算法的也有所不同。

目前薯演,使用場景可以分為新聞推薦撞芍,視頻推薦(長視頻,短視頻跨扮,直播)和商品推薦

根據(jù)不同的商業(yè)目標(biāo)序无,可以分為CTR+轉(zhuǎn)化率(alibaba.com電商網(wǎng)站)和觀看時(shí)間(Youtube視頻網(wǎng)站)

在設(shè)計(jì)推薦算法的時(shí)候,還要考慮響應(yīng)時(shí)間衡创,最多請求次數(shù)和內(nèi)存占用等細(xì)節(jié)帝嗡。

在不同的應(yīng)用場景下,對于推薦模型會(huì)有不同的問題

短視頻(抖音璃氢、快手):

大多數(shù)視頻都是用戶生成哟玷;內(nèi)容生命周期比較短峦失;大多數(shù)視頻是冷啟動(dòng)內(nèi)容

PGC長視頻(Hulu坯认,Netflix):

用戶的決定成本是相對高;標(biāo)題黨問題

推薦算法結(jié)構(gòu)

模型設(shè)計(jì)

推薦算法結(jié)構(gòu)方灾,主要分為召回算法和排序算法塘秦。召回算法會(huì)從所有可能的商品中召回上百或者上千件讼渊,召回的結(jié)果多準(zhǔn)確性要求低;排序算法會(huì)排序相關(guān)商品尊剔,在排序基礎(chǔ)上可能會(huì)有再排序可能使冷門得到曝光等等爪幻。


Youtube召回模型

通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到用戶的特征,然后使用最近鄰算法在視頻庫中選取前N個(gè)視頻輸出须误。


Youtube排序模型

Youtube的目標(biāo)是為了人們花更長時(shí)間在觀看視頻上挨稿。Ranker模型是對用戶和待排序的視頻打分,之后輸出前幾個(gè)視頻作為推薦內(nèi)容京痢。

在特征工程的時(shí)候奶甘,需要了解數(shù)據(jù)是否可以被得到;數(shù)據(jù)是否完整祭椰;數(shù)據(jù)的可靠性臭家。

模型訓(xùn)練

Offline訓(xùn)練(全局訓(xùn)練)

使用全部數(shù)據(jù)進(jìn)行模型訓(xùn)練,缺點(diǎn)是更新比較慢并且延遲比較高方淤;钉赁、

增量訓(xùn)練

基于更新模型上,通過批量訓(xùn)練携茂,進(jìn)行更新你踩。優(yōu)點(diǎn)是速度比全局訓(xùn)練要快,缺點(diǎn)是比較難找到全局最優(yōu)點(diǎn)。

在線學(xué)習(xí)

在線學(xué)習(xí)方法更加激進(jìn)带膜,容易陷入局部最優(yōu)吩谦,但是更適用于強(qiáng)化學(xué)習(xí)。

另外方法

對于模型進(jìn)行拆分膝藕,然后使用多種模型結(jié)合

評價(jià)指標(biāo)

離線評估的意義:

離線評估過程比較簡單;在線流量比較寶貴

離線評價(jià)指標(biāo):

Recall@K;AUC;mAP(mean average precision);NDCG(normalized discounted cumulative gain)

在線評估的意義:

一些商業(yè)指標(biāo)只能在線上計(jì)算逮京;不是所有算法都可以通過離線評估了;在線環(huán)境很難在線下保存;離線評估有時(shí)候有偏束莫。

在線評估方法:

A/B測試懒棉;interleaving

在線評價(jià)指標(biāo):

商業(yè)指標(biāo)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市览绿,隨后出現(xiàn)的幾起案子策严,更是在濱河造成了極大的恐慌,老刑警劉巖饿敲,帶你破解...
    沈念sama閱讀 216,544評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件妻导,死亡現(xiàn)場離奇詭異,居然都是意外死亡怀各,警方通過查閱死者的電腦和手機(jī)倔韭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,430評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瓢对,“玉大人寿酌,你說我怎么就攤上這事∷队迹” “怎么了醇疼?”我有些...
    開封第一講書人閱讀 162,764評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長法焰。 經(jīng)常有香客問我秧荆,道長,這世上最難降的妖魔是什么埃仪? 我笑而不...
    開封第一講書人閱讀 58,193評論 1 292
  • 正文 為了忘掉前任乙濒,我火速辦了婚禮,結(jié)果婚禮上卵蛉,老公的妹妹穿的比我還像新娘颁股。我一直安慰自己,他們只是感情好毙玻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,216評論 6 388
  • 文/花漫 我一把揭開白布豌蟋。 她就那樣靜靜地躺著廊散,像睡著了一般桑滩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,182評論 1 299
  • 那天运准,我揣著相機(jī)與錄音幌氮,去河邊找鬼。 笑死胁澳,一個(gè)胖子當(dāng)著我的面吹牛该互,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播韭畸,決...
    沈念sama閱讀 40,063評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼宇智,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了胰丁?” 一聲冷哼從身側(cè)響起随橘,我...
    開封第一講書人閱讀 38,917評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎锦庸,沒想到半個(gè)月后机蔗,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,329評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡甘萧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,543評論 2 332
  • 正文 我和宋清朗相戀三年萝嘁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扬卷。...
    茶點(diǎn)故事閱讀 39,722評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡牙言,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出怪得,到底是詐尸還是另有隱情嬉挡,我是刑警寧澤,帶...
    沈念sama閱讀 35,425評論 5 343
  • 正文 年R本政府宣布汇恤,位于F島的核電站庞钢,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏因谎。R本人自食惡果不足惜基括,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,019評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望财岔。 院中可真熱鬧风皿,春花似錦、人聲如沸匠璧。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,671評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽夷恍。三九已至魔眨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背遏暴。 一陣腳步聲響...
    開封第一講書人閱讀 32,825評論 1 269
  • 我被黑心中介騙來泰國打工侄刽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人朋凉。 一個(gè)月前我還...
    沈念sama閱讀 47,729評論 2 368
  • 正文 我出身青樓州丹,卻偏偏與公主長得像,于是被迫代替她去往敵國和親杂彭。 傳聞我的和親對象是個(gè)殘疾皇子墓毒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,614評論 2 353