《Learning Graph-based POI Embedding for Location-based Recommendation》論文閱讀筆記

POI（point of interest）的推薦氓奈，事實上就是興趣點的推薦，也就是對地理位置的推薦舀奶，在美團育勺，點評等業(yè)務(wù)場景比較適用，于是決定開始看幾篇相關(guān)的論文腹躁。最近在思考如何把看過的論文做個轉(zhuǎn)化南蓬，而不是處于那種看了就忘，忘了又看的狀態(tài)烧颖，所以決定開始寫博客炕淮。當然是比較簡單的。鳖悠。嘻嘻乘综。

1.引言

隨著web2.0時代的到來，location-based social networks (LBSNs)在最近幾年出現(xiàn)了胞皱。許多用戶都會在去玩去吃飯時進行簽到打卡九妈，所以將用戶的這些簽到信息用在個性化推薦萌朱，對于在特定地點對特定用戶進行廣告投遞，和對用戶進行新地點的探索有重要的意義酒贬。

不像傳統(tǒng)的桌面推薦翠霍，比如（電影，音樂等的推薦）零如，POI推薦是將移動用戶和物理地點（觀光地點）等融合起來的锄弱，所以棵癣，面臨了更多挑戰(zhàn)：

1）數(shù)據(jù)稀疏：對POI地點的點評信息是要比對電影音樂等評價的花費要更昂貴的（畢竟你得實際去那一趟），并且很多用戶由于隱私，不愿意簽到河劝。使得POI中的數(shù)據(jù)很稀疏，這使得大部分的協(xié)同過濾方法都GG了牌里。

2）環(huán)境因素：POI推薦不僅要考慮用戶個人的偏好务甥，還有考慮時空上下文

3）冷啟動：無論什么推薦都會有的問題

4）用戶偏好的動態(tài)變化：用戶的喜好是會隨著時間的變化而變化敞临，而捕捉到這種興趣的遷移是十分有意義的。所以POI推薦是基于用戶最近的喜好和用戶所處的時空環(huán)境做推薦的奏黑。

為了應對以上四種挑戰(zhàn)编矾，我們提出了一種新的方法，來將以下四種因素融合起來蹂匹。

1）序列影響：事實證明人類的活動是存在序列模式的凹蜈，比如用戶一般會在機場和酒店間存在序列的check in信息踪区。

2）地理信息：人們趨向于訪問與他們目前所處的POI相近的POI

3）時間循環(huán)因素：人們在一天的活動模式中是存在規(guī)律的。比如早上九點到辦公室静尼，中午12點出現(xiàn)在飯店传泊。所以對于推薦而言眷细，他在午餐時間出現(xiàn)在飯店的概率是比出現(xiàn)在酒吧概率高的。

4）語義因素：Whrrl數(shù)據(jù)集證明同一用戶的check-in信息表現(xiàn)出了語義相似性普舆。

雖然目前很多方法都提出了將上述幾種因素進行融合，但是沒有這樣一種將所有都融合起來的方法（=祖能。=）养铸，并且不能很好擴展模型轧膘。另一方面，目前的方法不能夠很好的支持實時的推薦鳞滨，1）重新訓練模型非常耗費時間椿浓；2）不能夠很好的追蹤用戶喜好的變化扳碍，因為用戶最近的checkin信息會被淹沒在大量的數(shù)據(jù)中。雖然最近有markov-based的文章通過挖掘用戶時序行為模式來進行預測碱蒙，但是沒有考慮除了序列之外的其他幾個因素赛惩。

最近趁餐，embedding 技術(shù)被廣泛地使用到了各個領(lǐng)域，本文在embedding的基礎(chǔ)上季惯，提出了一種graph-based embedding called GE臀突，特別的候学，我們使用二部圖來捕捉POI-POI（序列影響），POI-地理位置（地理因素）隐圾，POI-time slots（時間因素），POI-content words（語義因素）硕盹，然后我們將這四種異質(zhì)的網(wǎng)絡(luò)圖embedding到低維空間中（how?）。最后啊胶，為了追蹤動態(tài)的用戶喜好變化焰坪，最后提出的模型是將用戶最近喜好和時空上下文的embedding結(jié)合起來進行推薦（原文是：To support real-time & context-aware recommendation, the final recommendations are made based on the embeddings of the user’s latest preferences and the spatiotemporal context in the shared latent space.）文章的主要貢獻如下：

1）就目前所知，我們是第一個將上述幾個因素全部考慮進來融合的儒恋。

2）我們提出了一種graph-based的embedding model來學習POI黔漂，時間炬守，地理位置，語義的表示酣藻，然后基于學習到的這些表示鳍置，提出了新奇（税产？感覺有點類似于attention）的模型來進行用戶喜好建模。

3）做了大量的試驗后撤卢，發(fā)現(xiàn)我們的很好放吩。

2.Graph-based embedding model

2.1 problem formulation

文章中用到的符號羽杰。

definition1：（POI）是一個特定的地點。有三個屬性：identifier莉测，geographical location and content唧喉，分別用v,lv,Wv來表示八孝。

definition2：（check-in activity）由五元組組成(u, v, lv, τ, Wv)，其中τ代表用戶u在時間τ訪問了地點v

definition3：（user profile）這里面是一系列由與用戶相關(guān)的check-in activity組成的子姜，并且按時間戳順序排序

definition4：（POI-POI graph）denoted as Gvv = (V ∪ V哥捕，Evv）嘉熊，V是一系列check-in的POIs，Evv是他們之間的邊

definition5：（POI-Region）denoted as Gvr=（V∪R鸽捻，Evr）御蒲，當v在region時诊赊，兩個有連邊

definition6：（POI-time）denoted as Gvt = (V ∪ T, Evt)碧磅，連邊權(quán)重是指在某一時間片中POI訪問的越頻繁權(quán)重越大

definition7：（POI-word）denoted as Gvw = (V ∪ W，Evw)丰榴，

然后通過把這幾個圖embedding到低維的共享的空間四濒，我們就能得到~v, ~r, ~t and ~w的表示。

然后將問題也形式化一下戈二，在給定數(shù)據(jù)集D的情況下喳资，有一個query q=(u,l,τ）仆邓，然后給出topk的 POI。

2.2 模型描述和優(yōu)化

2.2.1 二部圖的表示

受LINE的啟發(fā)（很多都提到了LINE绒北，是時候?qū)W習一波了，好像是能夠從大型的異質(zhì)網(wǎng)絡(luò)中學習embedding）

首先定義一個條件概率（這個用底下的KL散度推一下贴汪，不難）：

因為上述計算很麻煩扳埂，于是采用負采樣來優(yōu)化模型阳懂。

接下來開始將四張圖放在一起聯(lián)合學習embedding，目標函數(shù)和各部分的表示如下

最后進行對用戶喜好的動態(tài)建模柜思。之前的一樣隱空間模型等對用戶喜好建模都十分耗時岩调，所以本文使用最近用戶訪問的POI的表示來建模，并且隨著時間τ越遠赡盘，該項POI的效果逐漸衰減号枕。

finally。來看下文章如何進行推薦的陨享。文章還是很巧妙的把上述幾種embedding融合在一起了葱淳。（但是文章推薦給用戶的是之前沒有訪問過的POI，這里感覺有點過于強硬赞厕，萬一用戶是呈周期性的想要訪問某個點，所以我感覺應該把之前訪問過的和未訪問過一起加起來計算定硝，并賦予不同權(quán)重給他們皿桑。個人見解哈哈。）

接下來就是實驗部分啦，文章的實驗部分進行的十分詳細唁毒。建議可以去看看蒜茴。不僅使用了基礎(chǔ)的baseline，還將自己提出的算法進行了變種浆西。分別驗證了不同因素對于推薦的影響因素粉私。很強~，就不一一貼了近零，可以自己去找論文看哇诺核。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市久信，隨后出現(xiàn)的幾起案子窖杀，更是在濱河造成了極大的恐慌，老刑警劉巖裙士，帶你破解...
沈念sama閱讀 212,816評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件入客，死亡現(xiàn)場離奇詭異，居然都是意外死亡腿椎，警方通過查閱死者的電腦和手機桌硫，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,729評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來啃炸，“玉大人铆隘，你說我怎么就攤上這事∧嫌茫” “怎么了膀钠？”我有些...
開封第一講書人閱讀 158,300評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長裹虫。經(jīng)常有香客問我肿嘲，道長，這世上最難降的妖魔是什么恒界？我笑而不...
開封第一講書人閱讀 56,780評論 1贊 285
?港島之戀（遺憾婚禮）
正文為了忘掉前任睦刃，我火速辦了婚禮，結(jié)果婚禮上十酣，老公的妹妹穿的比我還像新娘涩拙。我一直安慰自己，他們只是感情好耸采，可當我...
茶點故事閱讀 65,890評論 6贊 385
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布兴泥。她就那樣靜靜地躺著，像睡著了一般虾宇。火紅的嫁衣襯著肌膚如雪搓彻。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 50,084評論 1贊 291
城市分裂傳說
那天，我揣著相機與錄音旭贬，去河邊找鬼怔接。笑死，一個胖子當著我的面吹牛稀轨，可吹牛的內(nèi)容都是我干的扼脐。我是一名探鬼主播，決...
沈念sama閱讀 39,151評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼奋刽，長吁一口氣：“原來是場噩夢啊……” “哼瓦侮！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起佣谐，我...
開封第一講書人閱讀 37,912評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤肚吏，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后狭魂，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罚攀，經(jīng)...
沈念sama閱讀 44,355評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,666評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年趁蕊，在試婚紗的時候發(fā)現(xiàn)自己被綠了坞生。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,809評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡掷伙，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出又兵，到底是詐尸還是另有隱情任柜，我是刑警寧澤，帶...
沈念sama閱讀 34,504評論 4贊 334
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布沛厨，位于F島的核電站宙地，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏逆皮。R本人自食惡果不足惜宅粥，卻給世界環(huán)境...
茶點故事閱讀 40,150評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望电谣。院中可真熱鬧秽梅，春花似錦、人聲如沸剿牺。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,882評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽晒来。三九已至钞诡，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背荧降。一陣腳步聲響...
開封第一講書人閱讀 32,121評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工接箫，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人朵诫。一個月前我還...
沈念sama閱讀 46,628評論 2贊 362
代替公主和親
正文我出身青樓列牺，卻偏偏與公主長得像，于是被迫代替她去往敵國和親拗窃。傳聞我的和親對象是個殘疾皇子瞎领，可洞房花燭夜當晚...
茶點故事閱讀 43,724評論 2贊 351