一胚嘲、書籍介紹
《推薦系統(tǒng)實踐》項亮編著作儿,陳義、王益審校馋劈,人民郵電出版社攻锰。
本篇讀書筆記主要針對該書的第五章內(nèi)容-利用上下文信息。
二妓雾、結(jié)構(gòu)概覽
三娶吞、主要內(nèi)容
上下文(context)信息包括用戶訪問推薦系統(tǒng)的時間、地點械姻、心情等妒蛇。——用戶當下所處的環(huán)境楷拳。比如說根據(jù)心情推歌绣夺。
1.時間上下文信息
(1)什么是時間效應
a)用戶興趣可能會隨著時間不同而變化。
b)物品本身有生命周期欢揖。比如新聞的生命周期很短乐导,音樂的生命周期很長。
c)季節(jié)效應:冬天吃火鍋浸颓,夏天吃冰棍物臂。
(2)系統(tǒng)時間特性的分析
添加時間上下文內(nèi)容后,推薦系統(tǒng)從一個靜態(tài)系統(tǒng)變成了一個時變的系統(tǒng)产上,用戶行為數(shù)據(jù)也變成了時間序列棵磷,包含時間信息。
(3)推薦系統(tǒng)的實時性
實時的推薦系統(tǒng)要能夠?qū)崟r響應用戶新的行為晋涣,當用戶有所行為后仪媒,推薦列表不斷變化,滿足用戶不斷變化的興趣谢鹊。
如亞馬遜:用戶的顯性反饋行為都會導致推薦列表的變化算吩。
對推薦系統(tǒng)的要求:
a)對用戶行為的存取具有實時性。
b)推薦算法本身具有實時性:實時計算推薦列表佃扼;算法需要平衡考慮用戶的近期行為和長期行為偎巢。
(4)推薦算法的時間多樣性
時間多樣性高的推薦系統(tǒng)用戶會經(jīng)常在不同時間看到不同的結(jié)果。在不損失精度的情況下要提高推薦結(jié)果的時間多樣性兼耀。
時間多樣性的解決可以有兩步:a)用戶在有新行為后調(diào)整推薦結(jié)果压昼,讓結(jié)果滿足用戶最近的興趣求冷;b)用戶沒有新的行為也能夠變化結(jié)果。
對于b)窍霞,有幾種思路匠题。
*在生成推薦結(jié)果的過程中加入一定的隨機性,隨機挑選部分但金。
*對用戶看到過的內(nèi)容降權(quán)韭山。
*每天使用不同的算法。
(5)算法
a)給用戶推薦歷史上最熱門的物品
b)時間上下文相關(guān)的ItemCF算法
首先我們回顧一下ItemCF算法冷溃,主要是利用用戶行為計算物品之間的相似度钱磅,然后根據(jù)推薦用戶歷史行為的物品中的相似物品。
增加時間信息后:
*用戶在相隔很短的時間內(nèi)喜歡的物品具有更高的相似度(針對物品之間相似度的計算)
*用戶近期行為比用戶很久之前的行為秃诵,更能體現(xiàn)用戶現(xiàn)在的興趣续搀,優(yōu)先給用戶推薦近期行為相似的物品。
c)時間上下文相隔的UserCF算法
同樣菠净,UserCF算法是給用戶推薦和她興趣相似的其他用戶喜歡的物品禁舷。
增加時間信息:
*不同用戶在表達出對物品喜歡的時間距離越近,表明用戶間的興趣相似度更大毅往。
*給用戶推薦和他興趣相似的用戶最近喜歡的物品牵咙。因為時間越近,越能代表當下的興趣攀唯。
(6)時間段圖模型
在圖模型中添加一個物品時間段節(jié)點集合和用戶時間段節(jié)點集合洁桌。
2.地點上下文信息
不同地區(qū),可能興趣也會不同侯嘀。
LARS的推薦系統(tǒng):首先將物品分為有空間屬性和沒有空間屬性的物品另凌;其次,將用戶也分為有空間屬性(帶有現(xiàn)在地址的)戒幔、沒有空間屬性的吠谢。由此將數(shù)據(jù)集分成帶有空間屬性的數(shù)據(jù)集。在地點上下文的推薦诗茎,可以考慮兩個方面工坊,第一,不同地方的用戶興趣存在者很大的差別敢订,因此在推薦系統(tǒng)中要考慮用戶的空間位置王污。第二,用戶往往在附近的地區(qū)活動楚午。因此不能給用戶推薦太遠的地方昭齐。
四、思考與總結(jié)
時間醒叁、地點可以認為是已經(jīng)驗證過的影響興趣推薦的上下文信息司浪。因此我們可以在已有的推薦算法中加入時間泊业、地點的因素把沼。對于一些未驗證的因素啊易,我們還需先驗證,然后和已有的算法相結(jié)合饮睬。
延伸閱讀:
推薦系統(tǒng)冷啟動問題——《推薦系統(tǒng)實踐》讀書筆記(三)