抖音推薦系統(tǒng)冷啟動

推薦系統(tǒng)的冷啟動問題是指對于新用戶系統(tǒng)缺乏足夠的數(shù)據(jù)來捕捉用戶的興趣并有效的推薦內(nèi)容仆葡。這個問題是推薦系統(tǒng)再實際產(chǎn)品應(yīng)用中的一個主要挑戰(zhàn)。再眾多針對此問題的解決方案中沿盅,又一類廣泛使用的方法是鼓勵用戶用社交網(wǎng)絡(luò)賬號登陸推薦系統(tǒng)。推薦系統(tǒng)可以利用用戶社交網(wǎng)絡(luò)的信息(比如關(guān)注關(guān)系腰涧、好友關(guān)系、興趣標簽疗锐、發(fā)布內(nèi)容等)初始化用戶的興趣模型坊谁,從而進行有效的推薦口芍。

  1. 通過挖掘用戶發(fā)布內(nèi)容的關(guān)鍵字作為用戶興趣關(guān)鍵字。
  2. 利用用戶的社交關(guān)系吧用戶好友或者關(guān)注對象的興趣標簽匯聚到用戶身上鬓椭。

但在實際應(yīng)用中关划,很多用戶都比較敏感自己的隱私問題或者怕麻煩不會選擇社交網(wǎng)絡(luò)賬號登錄推薦產(chǎn)品。據(jù)統(tǒng)計祭玉,再一些熱門的新聞推薦類的產(chǎn)品中春畔,所有用戶中用微博、QQ律姨、微信等主流賬戶登錄的不超過50%。這就是使得現(xiàn)有的方法很難徹底解決推薦系統(tǒng)新用戶的冷啟動問題择份。

下面我們就來講講抖音是如何解決這類用戶的冷啟動問題的:

  1. 獲取用戶移動設(shè)備信息,通過該用戶的移動設(shè)備的操作系統(tǒng)獲取用戶的移動設(shè)備型號及安裝再該移動設(shè)備上的所有APP信息荣赶。
  2. 基于協(xié)同過濾產(chǎn)生第一推薦列表,將數(shù)據(jù)庫中與該用戶的移動設(shè)備型號或安裝的APP類似的其他用戶喜歡的內(nèi)容作為推薦內(nèi)容生成第一推薦列表
  3. 基于興趣標簽映射產(chǎn)生第二推薦列表利诺,把APP顯式地映射到一個或多個興趣標簽,然后根據(jù)每個興趣標簽篩選對應(yīng)的內(nèi)容作為推薦內(nèi)容生成第二推薦列表慢逾。
  4. 將上述的第一推薦列或第二推薦列表中的內(nèi)容推薦給該用戶灭红。

下面我們來看看具體是如何算的:

  1. 篩選常用有區(qū)分性的APP。
  2. 選取常見的只能手機機型变擒。
  3. 把APP和機型映射到特定維度。
  4. 對于給定用戶策添,從該給定用戶的移動設(shè)備信息中抽取移動設(shè)備特征向量澈段。
  5. 基于WeakAND算法找到向量距離和該給定用戶最近的K個用戶败富。
  6. 統(tǒng)計這K個用戶中點擊率最高的內(nèi)容作為推薦內(nèi)容。

如何抽取移動設(shè)備的特征向量:

  1. 將每個APP映射到一個[0兽叮, N-1]之間的維度猾愿。
  2. 將每個機型映射到一個[0,M-1]之間的維度蒂秘,與用戶機型對應(yīng)維度的值為1,其他維度的值均為0.
  3. 用戶安裝的APP對應(yīng)維度的值為該用戶最近特定天數(shù)的使用次數(shù)姻僧,其他維度的值均為0
  4. 定期分別統(tǒng)計每個APP和常用機型的用戶群體點擊率Top K的高點擊內(nèi)容列表。
  5. 給定用戶移動設(shè)備赌莺,通過用戶移動設(shè)備安裝的APP和機型分別獲取對應(yīng)的所述高點擊內(nèi)容列表
  6. 按照對應(yīng)的APP和機型的權(quán)重合并獲取的所述高點擊內(nèi)容列表并將其中的Top N作為推薦內(nèi)容。

如果維護興趣標簽:

  1. 建立推薦系統(tǒng)自身的標簽數(shù)據(jù)庫艘狭。
  2. 用網(wǎng)頁抓取技術(shù)抓取APP應(yīng)用市場中每個APP的標簽翠订。
  3. 把抓取過來的APP的標簽映射到標簽數(shù)據(jù)庫中。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末官撼,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子歧寺,更是在濱河造成了極大的恐慌,老刑警劉巖斜筐,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蛀缝,死亡現(xiàn)場離奇詭異,居然都是意外死亡嗤练,警方通過查閱死者的電腦和手機榛了,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進店門霜大,熙熙樓的掌柜王于貴愁眉苦臉地迎上來革答,“玉大人,你說我怎么就攤上這事残拐。” “怎么了溪食?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長栅组。 經(jīng)常有香客問我,道長笑窜,這世上最難降的妖魔是什么登疗? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任嫌蚤,我火速辦了婚禮,結(jié)果婚禮上脱吱,老公的妹妹穿的比我還像新娘。我一直安慰自己箱蝠,他們只是感情好,可當我...
    茶點故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布牙瓢。 她就那樣靜靜地躺著间校,像睡著了一般。 火紅的嫁衣襯著肌膚如雪憔足。 梳的紋絲不亂的頭發(fā)上酒繁,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天控妻,我揣著相機與錄音,去河邊找鬼弓候。 笑死,一個胖子當著我的面吹牛弓叛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播撰筷,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼抬闯!你這毒婦竟也來了关筒?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤蒸播,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后袍榆,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡宿崭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年才写,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赞草。...
    茶點故事閱讀 38,768評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖蜕劝,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情岖沛,我是刑警寧澤,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布廊镜,位于F島的核電站,受9級特大地震影響嗤朴,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜雹姊,卻給世界環(huán)境...
    茶點故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一衡楞、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧瘾境,春花似錦、人聲如沸迷守。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至急膀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間卓嫂,已是汗流浹背聘殖。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留餐禁,地道東北人。 一個月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓帮非,卻偏偏與公主長得像,于是被迫代替她去往敵國和親末盔。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,666評論 2 350

推薦閱讀更多精彩內(nèi)容