Youtube深度推薦模型解讀

本人微信公眾號(hào)為“推薦算法學(xué)習(xí)筆記”谁撼,定期推出經(jīng)典推薦算法文章娃胆,歡迎關(guān)注与倡。

本文介紹的是YouTube的經(jīng)典深度推薦算法論文《Deep Neural Networks for YouTube Recommendations》距帅,論文地址https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45530.pdf

一. Youtube推薦系統(tǒng)架構(gòu)

youtube推薦系統(tǒng)架構(gòu)圖如下所示

可以看到Y(jié)ouTube的推薦系統(tǒng)分為了兩個(gè)階段

階段1:召回階段(candidate generation)抖仅,負(fù)責(zé)從海量的視頻當(dāng)中挑選出用戶可能感興趣的候選視頻交煞,一般幾十到幾百不等

階段2:精排階段(ranking)咏窿,對(duì)階段1生成的候選視頻進(jìn)行排序,最終返回topK視頻給用戶

下面分別對(duì)召回階段和精排階段進(jìn)行詳細(xì)介紹

二.召回階段

召回階段的模型如下所示

召回階段的目標(biāo)是為每個(gè)用戶生成1個(gè)user vector和為每個(gè)視頻生成1個(gè)video vector素征。然后利用公式

就可以求出用戶u對(duì)視頻v的感興趣程度集嵌。

(1)怎么生成user vector?利用用戶的歷史數(shù)據(jù)行為和上下文特征御毅,經(jīng)過多層神經(jīng)網(wǎng)絡(luò)的輸出就是user vector

(2)怎么生成video vector纸淮?采用的是類似word2vec的方法,如下圖所示

輸入是user vector, 輸出是每一個(gè)視頻用戶會(huì)點(diǎn)擊的概率亚享,然后使用negative sample的方法進(jìn)行訓(xùn)練就可以得到每個(gè)視頻的video vector

(3)我們可以將所有用戶的user vector和所有視頻的video vector存儲(chǔ)起來咽块,這樣在serving的時(shí)候就可以直接取出來直接計(jì)算用戶感興趣的候選視頻。由于視頻的數(shù)量巨大欺税,一般采用局部敏感哈希等方法來加速計(jì)算

三.精排階段

精排階段的模型如下所示

可以看到模型采用的一個(gè)非常簡(jiǎn)單的DNN侈沪。但是值得注意的是它的預(yù)測(cè)目標(biāo)是視頻的平均觀看時(shí)長(zhǎng)(點(diǎn)擊率*觀看時(shí)長(zhǎng)),為了達(dá)到這個(gè)預(yù)測(cè)目標(biāo),可以看到它采用的是weight logistics regression晚凿,serving的時(shí)候采用的exp(Wx+b)亭罪。那么它們是怎么推出來的呢?推導(dǎo)過程如下圖所示

四.Tricks

1.訓(xùn)練的時(shí)候歼秽,每個(gè)用戶的訓(xùn)練樣本數(shù)量是相同的应役,這樣是為了防止少部分高度活躍的用戶主導(dǎo)損失函數(shù)。

2.在表示search query的時(shí)候燥筷,故意丟失掉序列信息箩祥,直接使用無序的bag of tokens,這樣有助于模型的exploitation肆氓。

3.把predicting held-out watch改成predicting future watch袍祖,可以防止overfit和使訓(xùn)練效果更好。如圖所示

4. 同樣的分類特征共享同一個(gè)embedding空間谢揪。例如"用戶看過的視頻Id"和"用戶展示過的視頻Id"這兩個(gè)特征蕉陋,“用戶語言”和“視頻語言”這兩個(gè)特征,它們的embedding都取自同一個(gè)embeding空間拨扶,如圖所示

5.對(duì)于連續(xù)的特征凳鬓,使用累計(jì)概率密度的方法對(duì)其進(jìn)行轉(zhuǎn)換到[0,1),同時(shí)并將開根號(hào)患民,平方后的值也加入到訓(xùn)練缩举,如圖所示

6.增加example age特征,即(當(dāng)前最大訓(xùn)練樣本的時(shí)間-樣本展示的時(shí)間)。增加后可以準(zhǔn)確預(yù)估出用戶感興趣的視頻的時(shí)間分布蚁孔,如圖所示

五.總結(jié)

以上就是YouTube深度推薦模型的一些Tricks奶赔,如果有問題和文章有錯(cuò)誤,歡迎和我交流杠氢。

本人微信公眾號(hào)為“推薦算法學(xué)習(xí)筆記”站刑,定期推出經(jīng)典推薦算法文章,歡迎關(guān)注鼻百。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末绞旅,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子温艇,更是在濱河造成了極大的恐慌因悲,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,657評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件勺爱,死亡現(xiàn)場(chǎng)離奇詭異晃琳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)琐鲁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門卫旱,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人围段,你說我怎么就攤上這事顾翼。” “怎么了奈泪?”我有些...
    開封第一講書人閱讀 164,057評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵适贸,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我涝桅,道長(zhǎng)拜姿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,509評(píng)論 1 293
  • 正文 為了忘掉前任苹支,我火速辦了婚禮砾隅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘债蜜。我一直安慰自己,他們只是感情好究反,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評(píng)論 6 392
  • 文/花漫 我一把揭開白布寻定。 她就那樣靜靜地躺著,像睡著了一般精耐。 火紅的嫁衣襯著肌膚如雪狼速。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,443評(píng)論 1 302
  • 那天卦停,我揣著相機(jī)與錄音向胡,去河邊找鬼恼蓬。 笑死,一個(gè)胖子當(dāng)著我的面吹牛僵芹,可吹牛的內(nèi)容都是我干的处硬。 我是一名探鬼主播,決...
    沈念sama閱讀 40,251評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼拇派,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼荷辕!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起件豌,我...
    開封第一講書人閱讀 39,129評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤疮方,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后茧彤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體骡显,經(jīng)...
    沈念sama閱讀 45,561評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評(píng)論 3 335
  • 正文 我和宋清朗相戀三年曾掂,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蟆盐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,902評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡遭殉,死狀恐怖石挂,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情险污,我是刑警寧澤痹愚,帶...
    沈念sama閱讀 35,621評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站蛔糯,受9級(jí)特大地震影響拯腮,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蚁飒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評(píng)論 3 328
  • 文/蒙蒙 一动壤、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧淮逻,春花似錦琼懊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至筛严,卻和暖如春醉旦,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工车胡, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留檬输,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,025評(píng)論 2 370
  • 正文 我出身青樓匈棘,卻偏偏與公主長(zhǎng)得像丧慈,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子羹饰,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評(píng)論 2 354