熱度排行,個(gè)性化推薦機(jī)制

? ? ? ? 剛看到一篇關(guān)于信息流熱度排行仔燕,個(gè)性化推薦機(jī)制的文章造垛,寫此文章總結(jié)下。本文雖思想?yún)⒄盏那拜叺奈螅且彩亲约涸瓌?chuàng)五辽。

? ? ? ? 首先說明信息既包括文字類的信息,也包括圖片外恕,視頻杆逗,甚至商品信息等信息。

? ? ? ? 解釋下三個(gè)名詞:

? ? ? ? 熱度詞庫:該詞庫根據(jù)當(dāng)前熱點(diǎn)來更新鳞疲,添加方式有兩種罪郊,手動更新,抓取微博等成熟媒體熱詞尚洽。

? ? ? ? 標(biāo)準(zhǔn)詞庫:記錄該產(chǎn)品中可能出現(xiàn)的信息的所有關(guān)鍵詞悔橄。一般來說網(wǎng)上有專門的在線詞庫可供選擇。

? ? ? 停用詞庫:在檢索關(guān)鍵詞時(shí)候翎朱,需要舍棄的詞語橄维,比如“我”,“想”等一些沒有實(shí)際含義的詞語拴曲。

一争舞、信息熱度排行機(jī)制

? ? ? 此處信息熱度排行類似于微博的熱搜,百度風(fēng)云榜澈灼,今日頭條的熱點(diǎn)等竞川。當(dāng)然此處的排行機(jī)制相比較于幾位大頭的算法機(jī)制較為簡單店溢,但是對于熱度排行的學(xué)習(xí)還是有很大幫助的。

? ? ? 公式:信息的熱度(H)=信息的初始熱度(H0)+信息的交互熱度(H(User))-隨時(shí)間遞減的熱度(H(Time))

? ? ? 首先得出該信息的所有關(guān)鍵詞委乌,方式:發(fā)布人自定義標(biāo)簽+系統(tǒng)根據(jù)標(biāo)準(zhǔn)詞庫和停用詞庫進(jìn)行系統(tǒng)篩選床牧。

1.信息的初始熱度(H0)

(1)第一種計(jì)算方法:根據(jù)該信息所屬的分類進(jìn)行熱度計(jì)算。例如遭贸,娛樂類的S(0)= H * 1.5戈咳,體育類的S(0)= H * 1.2。

(2)第二種計(jì)算方法:計(jì)算該信息的所有關(guān)鍵詞與熱詞庫的匹配度壕吹。S(0)=匹配度*H著蛙。

2.信息的交互熱度(H(User))

H(User)=(1*閱讀數(shù)+ 2*推薦數(shù)+ 3*評論數(shù)+ 4*分享數(shù))* N。

3.隨時(shí)間遞減的熱度(H(Time))

一個(gè)信息的熱度應(yīng)該隨時(shí)間指數(shù)遞減的耳贬,所以H(Time)表示應(yīng)該如下圖:


此處應(yīng)為一個(gè)隨時(shí)間遞增的指數(shù)函數(shù)踏堡,一個(gè)點(diǎn)為引爆點(diǎn)。

二咒劲、個(gè)性化推薦機(jī)制

1.基于內(nèi)容的個(gè)性化推薦

(1)首先得出該信息中關(guān)鍵詞集合顷蟆。(根據(jù)標(biāo)準(zhǔn)詞庫以及用戶自定義標(biāo)簽得出。)

(2)計(jì)算出關(guān)鍵詞集中單個(gè)關(guān)鍵詞對應(yīng)的tfidf值腐魂,tfidf值= tf * idf,用于 衡量該關(guān)鍵詞對于該信息的重要程度帐偎,其中tf是指該關(guān)鍵詞在該信息內(nèi)出現(xiàn)的頻率,idf指的是該關(guān)鍵詞在所有信息內(nèi)出現(xiàn)的頻率的相反值蛔屹,一般來講肮街,tf,idf越高判导,該關(guān)鍵詞越具有代表性。

(3)得出該信息的特征向量沛硅。


(4)文章關(guān)聯(lián)性之間的應(yīng)用眼刃。

計(jì)算兩個(gè)信息的特征向量,然后得出兩個(gè)向量的cos值摇肌。用cos值來表示兩個(gè)信息之間的相關(guān)性擂红。這種常應(yīng)用于相關(guān)文章推薦板塊,相關(guān)視頻推薦版塊围小。

(5)利用用戶特征向量來給用戶推薦信息昵骤。

當(dāng)用戶閱讀完一條信息后,對于該信息會有一個(gè)信息的特征向量為:


對應(yīng)的該用戶的行為向量為:


read,like,comment,share代表用戶的各種行為肯适,1,2,3,4分別代表各種行為的權(quán)重(人為賦予变秦。)

最終得出該用戶的特征向量為:


隨著用戶閱讀的信息量不斷增多,用戶特征向量越來越豐富框舔,再用用戶特征向量與各個(gè)文章相匹配蹦玫,就能進(jìn)行個(gè)性化推薦了赎婚。

2.基于用戶的協(xié)同推薦

(1)獲取用戶數(shù)據(jù)信息

a.外部數(shù)據(jù)。微信登錄樱溉,qq登錄可以獲取昵稱挣输,頭像。

B.主動詢問福贞。例如撩嚼,某些app會一開始詢問你性別,年齡等挖帘。

(2)根據(jù)獲取的用戶信息以及前面所說的用戶特征向量進(jìn)行用戶分群完丽。

(3)對于用戶X,他處于群體S(X肠套,n)舰涌,得出該群體的信息集合。分別得出用戶X分別與每一個(gè)信息的得分(第一個(gè)指標(biāo)是用戶X與S(X你稚,n)中每個(gè)用戶之間的關(guān)聯(lián)度瓷耙,第二個(gè)指標(biāo)是每個(gè)用戶對于該信息的關(guān)聯(lián)度)。

(4)根據(jù)每個(gè)信息的最終得分向用戶X進(jìn)行推薦刁赖。

小結(jié):以上都是基本的機(jī)制算法搁痛,實(shí)際運(yùn)用當(dāng)中,應(yīng)該是結(jié)合使用宇弛,并且根據(jù)實(shí)際情況有側(cè)重點(diǎn)鸡典。

微信公眾號:多一點(diǎn)思考,歡迎關(guān)注

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末枪芒,一起剝皮案震驚了整個(gè)濱河市彻况,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌舅踪,老刑警劉巖纽甘,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異抽碌,居然都是意外死亡悍赢,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進(jìn)店門货徙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來左权,“玉大人,你說我怎么就攤上這事痴颊∩统伲” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵祷舀,是天一觀的道長瀑梗。 經(jīng)常有香客問我烹笔,道長,這世上最難降的妖魔是什么抛丽? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任谤职,我火速辦了婚禮,結(jié)果婚禮上亿鲜,老公的妹妹穿的比我還像新娘允蜈。我一直安慰自己,他們只是感情好蒿柳,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布饶套。 她就那樣靜靜地躺著,像睡著了一般垒探。 火紅的嫁衣襯著肌膚如雪妓蛮。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天圾叼,我揣著相機(jī)與錄音蛤克,去河邊找鬼。 笑死夷蚊,一個(gè)胖子當(dāng)著我的面吹牛构挤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播惕鼓,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼筋现,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了箱歧?” 一聲冷哼從身側(cè)響起矾飞,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎呀邢,沒想到半個(gè)月后凰慈,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡驼鹅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了森篷。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片输钩。...
    茶點(diǎn)故事閱讀 39,688評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖仲智,靈堂內(nèi)的尸體忽然破棺而出买乃,到底是詐尸還是另有隱情,我是刑警寧澤钓辆,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布剪验,位于F島的核電站肴焊,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏功戚。R本人自食惡果不足惜娶眷,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望啸臀。 院中可真熱鬧届宠,春花似錦、人聲如沸乘粒。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽灯萍。三九已至轧铁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間旦棉,已是汗流浹背齿风。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留他爸,地道東北人聂宾。 一個(gè)月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像诊笤,于是被迫代替她去往敵國和親系谐。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容