基于Apache Gremlin的協(xié)同推薦

目的

利用協(xié)同過濾推薦算法以及使用Apache Gremlin對Apache Gremlin電影推薦圖數(shù)據(jù)文中存儲的電影評級圖數(shù)據(jù)進(jìn)行遍歷吗货,從而給電影觀眾推薦合適的電影。

Apache Gremlin推薦《玩具總動員》

協(xié)同過濾算法

簡單的來說,協(xié)同過濾算法就是A觀眾和B用戶都喜歡《玩具總動員》這部影片赏廓,那么A觀眾和B觀眾就用相同的喜好交集,就可以利用這個將B用戶喜歡的其它影片直接推薦給A用戶哈街。

Apache Gremlin遍歷

利用Gremlin Console查詢《玩具總動員》影片的具體信息如下:

gremlin> v = g.idx(T.v)[[title:'Toy Story (1995)']] >> 1                                            
==>v[1]
gremlin> v.map()                                        
==>movieId=1
==>title=Toy Story (1995)
==>type=Movie

利用Gremlin Console查詢出對《玩具總動員》影片評分超過3星的觀眾(僅返回5個結(jié)果),代碼如下:

gremlin> v.inE('rated').filter{it.getProperty('stars') > 3}.outV.userId[0..4] 
==>v[3902]
==>v[3912]
==>v[3916]
==>v[3918]
==>v[3920]

下圖可以更好的幫助我們理解上面的兩個遍歷語言的邏輯:

Gremlin遍歷結(jié)果圖

利用Gremlin Console找出給《玩具總動員》評分超過3星的用戶拒迅,并且找出這些用戶給其它哪些電影的評級超過3星叹卷,代碼如下:

gremlin> v.inE('rated').filter{it.getProperty('stars') > 3}.outV.outE('rated').filter{it.getProperty('stars') > 3}.inV.title[0..4]
==>One Flew Over the Cuckoo's Nest (1975)
==>Erin Brockovich (2000)
==>Bug's Life, A (1998)
==>Ben-Hur (1959)
==>Christmas Story, A (1983)

Gremlin Console也為用戶提供了用戶自定義的遍歷步驟,如下:

gremlin> Gremlin.defineStep('corated',[Vertex,Pipe], { def stars ->
  _().inE('rated').filter{it.getProperty('stars') > stars}.outV.outE('rated').filter{it.getProperty('stars') > stars}.inV})
==>null

用戶通過自定義了corated這個遍歷步驟將之前的復(fù)雜的Gremlin遍歷語言進(jìn)行簡化坪它,簡化后如下:

gremlin> v.corated(3).title[0..4]
==>One Flew Over the Cuckoo's Nest (1975)
==>Erin Brockovich (2000)
==>Bug's Life, A (1998)
==>Ben-Hur (1959)
==>Christmas Story, A (1983)

讓我們統(tǒng)計一下對《玩具總動員》評級超過3星的用戶對其它評星也超過3星的影片的數(shù)量,如下:

gremlin> v.corated(3).count()      
==>268493

當(dāng)然268493里面有很多的重復(fù)數(shù)據(jù)帝牡,這是因?yàn)檫@些用戶出了《玩具總隊員》外對其它的影片愛好也有重復(fù)的往毡,我們可以通過下面的遍歷語言來進(jìn)行去重統(tǒng)計,如下:

gremlin> v.corated(3).uniqueObject.count()
==>3353

找出與《玩具總動員》有共同評級的前10部電影(這些電影就是要推薦的電影)靶溜,代碼如下:

gremlin> m = [:]                                                                                                  
gremlin> v.corated(3).filter{it != v}.title.groupCount(m) >> -1
==>null
gremlin> m.sort{a,b -> b.value <=> a.value}[0..9] 
==>Star Wars: Episode V - The Empire Strikes Back (1980)=1000
==>Star Wars: Episode IV - A New Hope (1977)=998
==>American Beauty (1999)=949
==>Matrix, The (1999)=925
==>Raiders of the Lost Ark (1981)=922
==>Silence of the Lambs, The (1991)=887
==>Saving Private Ryan (1998)=878
==>Back to the Future (1985)=876
==>Shawshank Redemption, The (1994)=875
==>Toy Story 2 (1999)=871

想了解更多圖計算的知識开瞭,請點(diǎn)擊娃娃學(xué)軟件

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市罩息,隨后出現(xiàn)的幾起案子嗤详,更是在濱河造成了極大的恐慌,老刑警劉巖瓷炮,帶你破解...
    沈念sama閱讀 222,807評論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件葱色,死亡現(xiàn)場離奇詭異,居然都是意外死亡娘香,警方通過查閱死者的電腦和手機(jī)苍狰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,284評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來烘绽,“玉大人淋昭,你說我怎么就攤上這事“步樱” “怎么了翔忽?”我有些...
    開封第一講書人閱讀 169,589評論 0 363
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我歇式,道長驶悟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,188評論 1 300
  • 正文 為了忘掉前任贬丛,我火速辦了婚禮撩银,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘豺憔。我一直安慰自己额获,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,185評論 6 398
  • 文/花漫 我一把揭開白布恭应。 她就那樣靜靜地躺著抄邀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪昼榛。 梳的紋絲不亂的頭發(fā)上境肾,一...
    開封第一講書人閱讀 52,785評論 1 314
  • 那天,我揣著相機(jī)與錄音胆屿,去河邊找鬼奥喻。 笑死,一個胖子當(dāng)著我的面吹牛非迹,可吹牛的內(nèi)容都是我干的环鲤。 我是一名探鬼主播,決...
    沈念sama閱讀 41,220評論 3 423
  • 文/蒼蘭香墨 我猛地睜開眼憎兽,長吁一口氣:“原來是場噩夢啊……” “哼冷离!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起纯命,我...
    開封第一講書人閱讀 40,167評論 0 277
  • 序言:老撾萬榮一對情侶失蹤西剥,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后亿汞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瞭空,經(jīng)...
    沈念sama閱讀 46,698評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,767評論 3 343
  • 正文 我和宋清朗相戀三年留夜,在試婚紗的時候發(fā)現(xiàn)自己被綠了匙铡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,912評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡碍粥,死狀恐怖鳖眼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嚼摩,我是刑警寧澤钦讳,帶...
    沈念sama閱讀 36,572評論 5 351
  • 正文 年R本政府宣布矿瘦,位于F島的核電站,受9級特大地震影響愿卒,放射性物質(zhì)發(fā)生泄漏缚去。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,254評論 3 336
  • 文/蒙蒙 一琼开、第九天 我趴在偏房一處隱蔽的房頂上張望易结。 院中可真熱鬧,春花似錦柜候、人聲如沸搞动。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,746評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鹦肿。三九已至,卻和暖如春辅柴,著一層夾襖步出監(jiān)牢的瞬間箩溃,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,859評論 1 274
  • 我被黑心中介騙來泰國打工碌嘀, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留涣旨,地道東北人。 一個月前我還...
    沈念sama閱讀 49,359評論 3 379
  • 正文 我出身青樓股冗,卻偏偏與公主長得像开泽,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子魁瞪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,922評論 2 361