Ways of making recommendations
目錄
- 基于內(nèi)容的推薦系統(tǒng):根據(jù)產(chǎn)品屬性推薦
- 協(xié)作型過(guò)濾:基于類(lèi)似的用戶推薦
1. 基于內(nèi)容的推薦系統(tǒng):根據(jù)產(chǎn)品屬性推薦
基于內(nèi)容的推薦系統(tǒng)是以每種已知產(chǎn)品的屬性認(rèn)知來(lái)推薦新產(chǎn)品。假設(shè)你告訴一個(gè)朋友你剛剛看過(guò)奧黛麗·赫本(Audrey Hepburn)主演的電影“羅馬假日”(Roman Holiday)(真是經(jīng)典到掉牙过椎。瘤旨。。)宾添,而且你真的很喜歡它。你的朋友可能會(huì)建議你接下來(lái)看電影Sabrina鳞陨。兩部電影都是浪漫的喜劇颠猴,兩部電影都是同一個(gè)電影明星。這可能是一個(gè)很好的建議坡贺,因?yàn)殡娪坝泻芏喙餐膶傩怨俦病_@是基于內(nèi)容的推薦系統(tǒng)的理念箱舞。他們嘗試推薦與用戶已經(jīng)喜歡的產(chǎn)品具有相似屬性的產(chǎn)品。
我們可以在這張表上看到John已經(jīng)給羅馬假日五星級(jí)了肺魁。我們接下來(lái)應(yīng)該給John推薦什么電影电湘?在基于內(nèi)容的推薦系統(tǒng)中,我們也會(huì)有一張表格鹅经,向我們提供有關(guān)每部電影的詳細(xì)信息寂呛。這是表格可能的樣子。
這個(gè)表格為每部電影分配四種不同類(lèi)別的評(píng)分:浪漫瘾晃,懸疑贷痪,動(dòng)作和音樂(lè)。這個(gè)想法是蹦误,如果用戶真的喜歡浪漫得分高的電影劫拢,我們可以推薦其他也有浪漫色彩的電影。
我們可以在這張表中看到羅馬假日和薩布麗娜在浪漫中排名第一强胰,但是在動(dòng)作和懸疑方面都很低舱沧。相比之下,“第三人稱(chēng)”和“臭名昭著”則因?yàn)閼乙啥星懊┡佳螅_馬假日則處于低位狗唉。從這個(gè)表格中我們可以猜測(cè)羅馬假日和薩布麗娜彼此之間的相似程度比其他兩部電影更接近,所以喜歡羅馬假日的人也可能喜歡塞布麗娜涡真》指基于此,Sabrina將成為推薦給John的一部好電影哆料,我們可以猜測(cè)John可能會(huì)給Sabrina一個(gè)很高的評(píng)價(jià)缸剪。
蘇珊高度評(píng)價(jià)The Third Man杏节。讓我們?cè)倏纯措娪暗膶傩浴T谶@里我們可以看到典阵,第三人與臭名昭著的屬性非常相似奋渔。 “臭名昭著”可能是蘇珊高度評(píng)價(jià)的一部電影。對(duì)蘇珊來(lái)說(shuō)這將是一個(gè)很棒的電影推薦壮啊。
如果您有描述性的數(shù)據(jù)可用于每個(gè)你想推薦的產(chǎn)品嫉鲸,那么基于內(nèi)容的建議可以很好地工作,這對(duì)于您處理還沒(méi)有任何用戶評(píng)論的情況非常有用歹啼。
但是基于內(nèi)容的推薦系統(tǒng)有一個(gè)很大的缺點(diǎn)玄渗。在向用戶推薦產(chǎn)品之前座菠,必須為清單中的每個(gè)產(chǎn)品創(chuàng)建數(shù)據(jù)腳本。這是非常耗時(shí)的藤树,并且會(huì)帶來(lái)很多主觀性浴滴,可能會(huì)推翻您的推薦結(jié)果。例如岁钓,一個(gè)人可能會(huì)說(shuō)電影是非常有懸念的升略,但另一個(gè)人可能會(huì)不同意,并說(shuō)這根本不是懸疑屡限。如果有成千上萬(wàn)的產(chǎn)品需要標(biāo)注降宅,那么以一致和公平的方式標(biāo)注所有產(chǎn)品可能非常困難。這使得在大型產(chǎn)品數(shù)據(jù)庫(kù)上使用基于內(nèi)容的推薦是困難的和耗時(shí)的囚霸,除非產(chǎn)品易于用一套一致的屬性來(lái)描述。
2. 協(xié)作型過(guò)濾(Collaborative filtering):基于類(lèi)似的用戶推薦
協(xié)同型過(guò)濾系統(tǒng)僅根據(jù)用戶過(guò)去對(duì)產(chǎn)品的評(píng)分來(lái)提出建議激才,而不是基于產(chǎn)品本身的任何內(nèi)容拓型。在協(xié)同型過(guò)濾中,推薦系統(tǒng)不了解其推薦的實(shí)際產(chǎn)品瘸恼。它只知道其他用戶如何評(píng)價(jià)產(chǎn)品劣挫。它使用過(guò)去的評(píng)級(jí)來(lái)提出新的建議。這是一個(gè)電影表和用戶給這些電影的評(píng)級(jí)东帅。假設(shè)我們想向John推薦一部電影压固。我們應(yīng)該推薦Sabrina還是Notorious?我們可以看到靠闭,John的過(guò)去評(píng)論與Bob的評(píng)論非常相似帐我。
他們都是羅馬假日五星和第三人一星±颍看起來(lái)他們的口味有一些重疊拦键。另外,我們可以看到Bob喜歡Sabrina檩淋,但不喜歡Notorious芬为。這可能會(huì)給我們提供約翰如何反應(yīng)的線索。我們也可以看到蟀悦,蘇珊和愛(ài)麗絲似乎和鮑勃有很大的不同媚朦。也許這也能給我們一些線索。通過(guò)查看所有其他用戶以及他們迄今為止如何評(píng)價(jià)電影日戈,Bob看起來(lái)很可能會(huì)給Sabrina一個(gè)很高的評(píng)價(jià)询张,臭名昭著的評(píng)價(jià)很低,所以我們會(huì)推薦Sabrina給Bob浙炼。
這是協(xié)作過(guò)濾的一個(gè)例子瑞侮。我們對(duì)每部電影一無(wú)所知的圆。我們甚至不需要知道他們的標(biāo)題。只要知道所有用戶過(guò)去對(duì)每個(gè)產(chǎn)品的評(píng)價(jià)半火,我們都可以挑選出Bob會(huì)喜歡的新產(chǎn)品越妈。協(xié)作型過(guò)濾與基于內(nèi)容的建議相比具有非常大的優(yōu)勢(shì)。好處是钮糖,你甚至不需要知道你推薦的產(chǎn)品梅掠。只要你有用戶評(píng)論數(shù)據(jù),你就可以建立一個(gè)協(xié)作型過(guò)濾推薦系統(tǒng)店归。但是協(xié)作過(guò)濾確實(shí)有一些限制阎抒。
它只適用于你已經(jīng)有了用戶評(píng)論。如果你沒(méi)有任何評(píng)論消痛,你不能提出建議且叁。這意味著向全新的用戶推薦產(chǎn)品是困難的,因?yàn)樾掠脩暨€沒(méi)有審查任何產(chǎn)品秩伞。最后逞带,協(xié)作過(guò)濾往往傾向于推薦對(duì)評(píng)論很多的產(chǎn)品,這可能使用戶很難發(fā)現(xiàn)新片纱新,因?yàn)樗麄儾惶赡芙?jīng)常被推薦展氓。
結(jié)語(yǔ)
下一節(jié)是對(duì)我們代碼用到的工具做個(gè)簡(jiǎn)單介紹,為了保持隊(duì)形脸爱, 我還是單獨(dú)發(fā)一節(jié)(雖然內(nèi)容有點(diǎn)少) .
你的 關(guān)注-收藏-轉(zhuǎn)發(fā) 是我繼續(xù)分享的動(dòng)力!