2010RecSys-The YouTube Video Recommendation

作者以及單位

James Davidson(google)

解決問題

借鑒的場景:短視頻公司结笨。

用戶看短視頻(youtube)有三種目的:1.看特定的video;2.看特定topic的video;3.找感興趣的視頻肥缔。

解決第三種目的撒轮,存在的挑戰(zhàn)是:1.短視頻除了題目沒有什么有價值信息;2.視頻短醇锚,用戶行為就短哼御,噪聲多;3.視頻生存周期短焊唬。

文章主要介紹如何在YouTube主頁上給用戶提供的個性化推薦內(nèi)容恋昼,其目的是為了提高用戶使用網(wǎng)站的互動性以及娛樂性。
文章中所提到的算法會輸出用戶可能喜歡的視頻集合赶促,而不是給出一個具體的用戶喜歡某一視頻的概率(評價指標(biāo)可以參考)液肌。

研究對象

如何在YouTube主頁上給用戶提供的個性化推薦內(nèi)容,其目的是為了提高用戶使用網(wǎng)站的互動性以及娛樂性鸥滨。
對象是主頁嗦哆!
在主頁上推薦視頻和推薦一個視頻的相關(guān)視頻在需求上有一定的差異谤祖,主頁上的推薦對內(nèi)容的新鮮度,發(fā)散性以及用戶近期行為的相關(guān)性要求比較高老速。

研究方法

用戶行為包括explicit和implicit feedback粥喜。前者是指用戶評分、明確表示喜歡橘券、不喜歡等行為额湘,后者是瀏覽、觀看等行為旁舰。原始數(shù)據(jù)中還含有非常多的噪聲锋华,很多不可控因素會影響原始數(shù)據(jù)的質(zhì)量。

為了確定要推薦哪些視頻箭窜,文章給出了相關(guān)視頻的定義:視頻v的相關(guān)視頻是指可能在視頻v之后被用戶觀看的視頻供置。兩個視頻的相關(guān)性由關(guān)聯(lián)規(guī)則挖掘方法來確定。視頻i和j的相關(guān)性在文章中作者使用了簡單的co-view來計算:


相關(guān)度

這里的Cij是視頻i和j的co-view數(shù)(共同出現(xiàn)次數(shù))绽快,f(Vi,Vj)則是根據(jù)視頻Vi和Vj的觀看次數(shù)給出的一個折扣(最簡單的一個此類函數(shù)為f(vi,vj)=ci?cj)芥丧。利用這個相關(guān)系數(shù)可以選出與種子視頻Vi 最相關(guān)的N個視頻,這里作者還引入了一個minimum score threshold坊罢,用來去除N個視頻中并不十分確定的相關(guān)視頻续担。

所有推薦視頻的集合主要是根據(jù)用戶過去的行為決定,一個用戶可能會觀看活孩,喜歡多個視頻或者給他們進行打分物遇。根據(jù)這些視頻,我們可以找到所有距離為1的相關(guān)視頻憾儒,然后根據(jù)所有距離為1的相關(guān)視頻找到距離為2的相關(guān)視頻询兴。

創(chuàng)新點

從系統(tǒng)尋找相關(guān)視頻來說,新意不大起趾。
但創(chuàng)新點主要是ranking部分:在推薦中诗舰,距離為1的相關(guān)視頻就足夠提供很多推薦結(jié)果,但是他們可能會十分偏向于用戶某一個狹窄的興趣點训裆,所以我們需要增加距離使推薦結(jié)果有更多的新穎性眶根。

當(dāng)論文中得到所有的推薦視頻集合后,可以對他們進行一次排序打分边琉,根據(jù)視頻質(zhì)量(觀看次數(shù)属百、視頻評分、評論变姨、收視和上傳時間等)族扰;用戶特征(用戶觀看觀看次數(shù)和觀看時間等);多樣性:(視頻集合的類別中做一個平衡)。
通過對用戶的反饋進行分析渔呵,我們可以把用戶不感興趣的視頻原因從推薦初始集合中刪去怒竿,或者限制某一個看過的視頻生成的推薦視頻數(shù)量。

結(jié)論

涵蓋了最基本的推薦引擎樣例生成以及額外的排序過程厘肮,并且從系統(tǒng)上分析了如何通過Bigtable,MapReduce來搭建這一推薦系統(tǒng)睦番,值得深入學(xué)習(xí)类茂。

論文解讀:

https://zhuanlan.zhihu.com/p/26977788
https://blog.csdn.net/friyal/article/details/83589232

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市托嚣,隨后出現(xiàn)的幾起案子巩检,更是在濱河造成了極大的恐慌,老刑警劉巖示启,帶你破解...
    沈念sama閱讀 222,681評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件兢哭,死亡現(xiàn)場離奇詭異,居然都是意外死亡夫嗓,警方通過查閱死者的電腦和手機迟螺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來舍咖,“玉大人矩父,你說我怎么就攤上這事∨琶梗” “怎么了窍株?”我有些...
    開封第一講書人閱讀 169,421評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長攻柠。 經(jīng)常有香客問我球订,道長,這世上最難降的妖魔是什么瑰钮? 我笑而不...
    開封第一講書人閱讀 60,114評論 1 300
  • 正文 為了忘掉前任冒滩,我火速辦了婚禮,結(jié)果婚禮上浪谴,老公的妹妹穿的比我還像新娘旦部。我一直安慰自己,他們只是感情好较店,可當(dāng)我...
    茶點故事閱讀 69,116評論 6 398
  • 文/花漫 我一把揭開白布士八。 她就那樣靜靜地躺著,像睡著了一般梁呈。 火紅的嫁衣襯著肌膚如雪婚度。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,713評論 1 312
  • 那天,我揣著相機與錄音蝗茁,去河邊找鬼醋虏。 笑死,一個胖子當(dāng)著我的面吹牛哮翘,可吹牛的內(nèi)容都是我干的颈嚼。 我是一名探鬼主播,決...
    沈念sama閱讀 41,170評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼饭寺,長吁一口氣:“原來是場噩夢啊……” “哼阻课!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起艰匙,我...
    開封第一講書人閱讀 40,116評論 0 277
  • 序言:老撾萬榮一對情侶失蹤限煞,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后员凝,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體署驻,經(jīng)...
    沈念sama閱讀 46,651評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,714評論 3 342
  • 正文 我和宋清朗相戀三年健霹,在試婚紗的時候發(fā)現(xiàn)自己被綠了旺上。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,865評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡糖埋,死狀恐怖抚官,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情阶捆,我是刑警寧澤凌节,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站洒试,受9級特大地震影響倍奢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜垒棋,卻給世界環(huán)境...
    茶點故事閱讀 42,211評論 3 336
  • 文/蒙蒙 一卒煞、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧叼架,春花似錦畔裕、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至乍构,卻和暖如春甜无,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評論 1 274
  • 我被黑心中介騙來泰國打工岂丘, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留陵究,地道東北人。 一個月前我還...
    沈念sama閱讀 49,299評論 3 379
  • 正文 我出身青樓奥帘,卻偏偏與公主長得像铜邮,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子寨蹋,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,870評論 2 361