推薦系統(tǒng)理論(六) -- 利用社交網(wǎng)絡數(shù)據(jù)進行推薦

本篇的思維導圖如下:

1橡类、社交網(wǎng)絡數(shù)據(jù)

自從搜索引擎谷歌誕生后笼蛛,大家都在討論互聯(lián)網(wǎng)的下一個金礦是什么。現(xiàn)在弛车,幾乎所有的人都認為那就是社交網(wǎng)絡齐媒。根據(jù)尼爾森2010年的報告,用戶在互聯(lián)網(wǎng)上22%的時間花費在社交網(wǎng)站 和社交媒體上1纷跛。Facebook和Twitter作為兩種不同類型社交網(wǎng)絡的代表喻括,是目前互聯(lián)網(wǎng)界的寵兒。谷歌公司也不甘落后贫奠,連續(xù)推出了很多社交網(wǎng)絡產(chǎn)品(Buzz和Google Plus)唬血。國內(nèi)的互聯(lián)網(wǎng)以新浪微博為代表,也吸引了很多人的眼球唤崭。
社交網(wǎng)絡數(shù)據(jù)的來源有下面幾個:
電子郵件
用戶注冊信息:比如公司拷恨、學校等
用戶的位置數(shù)據(jù):IP地址或者GPS數(shù)據(jù)
論壇和討論組
即時聊天工具
社交網(wǎng)站

2、社交網(wǎng)絡數(shù)據(jù)簡介

一般來說谢肾,有3種不同的社交網(wǎng)絡數(shù)據(jù):
雙向確認的社交網(wǎng)絡數(shù)據(jù):一般通過無向圖表示
單向關注的社交網(wǎng)絡數(shù)據(jù):用戶關系是單向的腕侄,可以通過有向圖表示
基于社區(qū)的社交網(wǎng)絡數(shù)據(jù):比如豆瓣小組

社交網(wǎng)絡數(shù)據(jù)中也存在長尾分布,主要根據(jù)用戶的入度和出度芦疏,用戶的入度反映了用戶的社會影響力冕杠,而用戶的出度代表了一個用戶關注的用戶數(shù)。從下圖可以看出酸茴,一個社交網(wǎng)絡中影響力大的用戶總是占少數(shù)分预,同時關注很多人的用戶占少數(shù),而絕大多數(shù)只關注很少的人弊决。

用戶入度分布
用戶出度分布

3噪舀、基于社交網(wǎng)絡的推薦

社會化推薦之所以受到很多網(wǎng)站的重視魁淳,是源于如下的優(yōu)點:
好友推薦可以增加推薦的信任度
社交網(wǎng)絡可以解決冷啟動問題
當然飘诗,社會化推薦有時候也有一定的缺點,主要是不一定提高推薦算法的離線精度界逛,因為社交網(wǎng)絡中好友關系不是基于共同興趣產(chǎn)生的昆稿,所以用戶好友的興趣往往和用戶的興趣不一致。

3.1 基于鄰域的社會化推薦算法

如果給定一個社交網(wǎng)絡和一份用戶行為數(shù)據(jù)集息拜。其中社交網(wǎng)絡定義了用戶之間的好友關系溉潭,而用 戶行為數(shù)據(jù)集定義了不同用戶的歷史行為和興趣數(shù)據(jù)净响。那么我們想到的最簡單算法是給用戶推薦好友喜歡的物品集合。即用戶u對物品i的興趣pui可以通過如下公式計算喳瓣。

其中out(u)是用戶u的好友集合馋贤,如果用戶v喜歡物品i,則rvi=1畏陕,否則rvi=0配乓。不過,即使都是 用戶u的好友惠毁,不同的好友和用戶u的熟悉程度和興趣相似度也是不同的犹芹。因此,我們應該在推薦 算法中考慮好友和用戶的熟悉程度以及興趣相似度:

這里鞠绰,wuv 由兩部分相似度構成腰埂,一部分是用戶u和用戶v的熟悉程度,另一部分是用戶u和用 戶v的興趣相似度蜈膨。熟悉度可以用用戶之間的共同好友比例來度量:

而興趣相似度可以通過和UserCF類似的方法度量屿笼,即如果兩個用戶 喜歡的物品集合重合度很高,兩個用戶的興趣相似度很高翁巍。

3.2 基于圖的社會化推薦算法

在社交網(wǎng)站中存在兩種關系刁卜,一種是用戶對物品的興趣關系,一種是用戶之間的社交網(wǎng)絡關系曙咽。用戶的社交網(wǎng)絡可以表示為社交網(wǎng)絡圖蛔趴,用戶對物品的行為可以表示為用戶物品二分圖,而這兩種圖可以結合成一個圖例朱。如下圖所示:

在定義完圖中的頂點和邊后孝情,需要定義邊的權重。其中用戶和用戶之間邊的權重可以定義為 用戶之間相似度的?a 倍(包括熟悉程度和興趣相似度)洒嗤,而用戶和物品之間的權重可以定義為用 戶對物品喜歡程度的 ? b倍箫荡。?a 和b ? 需要根據(jù)應用的需求確定。如果我們希望用戶好友的行為對 推薦結果產(chǎn)生比較大的影響渔隶,那么就可以選擇比較大的?a 羔挡。相反,如果我們希望用戶的歷史行為 對推薦結果產(chǎn)生比較大的影響间唉,就可以選擇比較大的 ?b 绞灼。

在定義完圖中的頂點、邊和邊的權重后呈野,我們就可以利用基于隨機游走的PersonalRank圖排序算法給每個用戶生成推薦結果低矮。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市被冒,隨后出現(xiàn)的幾起案子军掂,更是在濱河造成了極大的恐慌轮蜕,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蝗锥,死亡現(xiàn)場離奇詭異跃洛,居然都是意外死亡,警方通過查閱死者的電腦和手機终议,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門税课,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人痊剖,你說我怎么就攤上這事韩玩。” “怎么了陆馁?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵找颓,是天一觀的道長。 經(jīng)常有香客問我叮贩,道長击狮,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任益老,我火速辦了婚禮彪蓬,結果婚禮上,老公的妹妹穿的比我還像新娘捺萌。我一直安慰自己档冬,他們只是感情好,可當我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布桃纯。 她就那樣靜靜地躺著酷誓,像睡著了一般。 火紅的嫁衣襯著肌膚如雪态坦。 梳的紋絲不亂的頭發(fā)上盐数,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天,我揣著相機與錄音伞梯,去河邊找鬼玫氢。 笑死,一個胖子當著我的面吹牛谜诫,可吹牛的內(nèi)容都是我干的漾峡。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼猜绣,長吁一口氣:“原來是場噩夢啊……” “哼灰殴!你這毒婦竟也來了?” 一聲冷哼從身側響起掰邢,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤牺陶,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后辣之,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體掰伸,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年怀估,在試婚紗的時候發(fā)現(xiàn)自己被綠了狮鸭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡多搀,死狀恐怖歧蕉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情康铭,我是刑警寧澤惯退,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站从藤,受9級特大地震影響催跪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜夷野,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一懊蒸、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧悯搔,春花似錦骑丸、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至苏揣,卻和暖如春黄鳍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背平匈。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工框沟, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人增炭。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓忍燥,卻偏偏與公主長得像,于是被迫代替她去往敵國和親隙姿。 傳聞我的和親對象是個殘疾皇子梅垄,可洞房花燭夜當晚...
    茶點故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容