簡(jiǎn)介
關(guān)于協(xié)同過(guò)濾的例子就是看電影枪孩,有時(shí)候不知道哪一部電影是我們喜歡的或者評(píng)分比較高的堪嫂,那么我們通常的做法就是問問周圍的朋友,看看有什么好的電影推薦创千。在問的時(shí)候缰雇,都習(xí)慣于問跟自己口味差不多的朋友入偷,這就是協(xié)同過(guò)濾的核心思想。
定義
- 百度百科
協(xié)同過(guò)濾簡(jiǎn)單來(lái)說(shuō)是利用某興趣相投械哟、擁有共同經(jīng)驗(yàn)之群體的喜好來(lái)推薦用戶感興趣的信息疏之,個(gè)人通過(guò)合作的機(jī)制給予信息相當(dāng)程度的回應(yīng)(如評(píng)分)并記錄下來(lái)以達(dá)到過(guò)濾的目的進(jìn)而幫助別人篩選信息,回應(yīng)不一定局限于特別感興趣的暇咆,特別不感興趣信息的紀(jì)錄也相當(dāng)重要锋爪。協(xié)同過(guò)濾又可分為評(píng)比(rating)或者群體過(guò)濾(social filtering)。協(xié)同過(guò)濾以其出色的速度和健壯性糯崎,在全球互聯(lián)網(wǎng)領(lǐng)域炙手可熱
- 維基百科
協(xié)同過(guò)濾是通過(guò)將過(guò)濾操作在一大群人中擴(kuò)散几缭,用于過(guò)濾大量信息的一種機(jī)制河泳。與主流媒體都有一個(gè)或少數(shù)幾個(gè)編輯設(shè)定一些指導(dǎo)原則不同的是沃呢,協(xié)同過(guò)濾的社會(huì)化網(wǎng)絡(luò)可以有無(wú)窮多的編輯,并隨著參與者人數(shù)的增多而變地更好拆挥。協(xié)同過(guò)濾基于群體智慧和多數(shù)原則的兩個(gè)基本原則之上薄霜。
核心
- 收集用戶偏好
- 找到相似的用戶或者物品
- 計(jì)算并推薦
算法細(xì)分
以用戶為基礎(chǔ)(User-based)的協(xié)同過(guò)濾
1.收集用戶信息
2.最近鄰搜索(Nearest neighbor search, NNS)
3.產(chǎn)生推薦結(jié)果基于物品的協(xié)同過(guò)濾算法
跟上述的基于用戶的協(xié)同過(guò)濾算法類似,但它從物品本身纸兔,而不是用戶角度惰瓜。
比如喜歡物品A的用戶都喜 歡物品C,那么可以知道物品A與物品C的相似度很高汉矿,而用戶C喜歡物品A崎坊,那么可以推斷出用戶C也可能喜歡物品C以項(xiàng)目為基礎(chǔ)(Item-based)的協(xié)同過(guò)濾
1.收集用戶信息
2.針對(duì)項(xiàng)目的最近鄰搜索
3.產(chǎn)生推薦結(jié)果以模型為基礎(chǔ)(Model- based)的協(xié)同過(guò)濾
以模型為基礎(chǔ)的協(xié)同過(guò)濾(Model-based Collaborative Filtering)是先用歷史數(shù)據(jù)得到一個(gè)模型,再用此模型進(jìn)行預(yù)測(cè)洲拇。以模型為基礎(chǔ)的協(xié)同過(guò)濾廣泛使用的技術(shù)包括Latent Semantic Indexing奈揍、Bayesian Networks…等,根據(jù)對(duì)一個(gè)樣本的分析得到模型赋续。
國(guó)內(nèi)案例
豆瓣是國(guó)內(nèi)做的比較成功的社交網(wǎng)站男翰,它以圖書,電影纽乱,音樂和同城活動(dòng)為中心蛾绎,形成一個(gè)多元化的社交網(wǎng)絡(luò)平臺(tái),自然推薦的功能是必不可少的鸦列,當(dāng)你在豆瓣電影中將一些你看過(guò)的或是感興趣的電影加入你看過(guò)和想看的列表里租冠,并為它們做相應(yīng)的評(píng)分,這時(shí)豆瓣的推薦引擎已經(jīng)拿到你的一些偏好信息豆瓣的推薦是通過(guò) “豆瓣猜”薯嗤,為了讓用戶清楚這些推薦是如何來(lái)的顽爹,豆瓣還給出了“豆瓣猜”的一個(gè)簡(jiǎn)要的介紹
你的個(gè)人推薦是根據(jù)你的收藏和評(píng)價(jià)自動(dòng)得出的,每個(gè)人的推薦清單都不同应民。你的收藏和評(píng)價(jià)越多话原,豆瓣給你的推薦會(huì)越準(zhǔn)確和豐富夕吻。每天推薦的內(nèi)容可能會(huì)有變化。隨著豆瓣的發(fā)展繁仁,給你推薦的內(nèi)容也會(huì)越來(lái)越準(zhǔn)涉馅。
所以我們通過(guò)豆瓣得知,豆瓣猜是基于社會(huì)化的協(xié)同過(guò)濾的推薦黄虱。豆瓣的用戶越多稚矿,用戶的反饋越多,那么推薦的效果也就會(huì)越準(zhǔn)確捻浦。
國(guó)內(nèi)案例
AMAZON書店提供先進(jìn)的個(gè)性化推薦功能晤揣,能為不同興趣偏好的用戶自動(dòng)推薦盡量符合其興趣需要的書籍。 AMAZON使用推薦軟件對(duì)讀者曾經(jīng)購(gòu)買過(guò)的書以及該讀者對(duì)其他書的評(píng)價(jià)進(jìn)行分析后朱灿,將向讀者推薦他可能喜歡的新書昧识,只要鼠標(biāo)點(diǎn)一下,就可以買到該書盗扒;AMAZON能對(duì)顧客購(gòu)買過(guò)的東西進(jìn)行自動(dòng)分析跪楞,然后因人而異的提出合適的建議。 讀者的信息將被再次保存侣灶,這樣顧客下次來(lái)時(shí)就能更容易的買到想要的書甸祭。此外,完善的售后服務(wù)也是AMAZON的優(yōu)勢(shì)褥影,讀者可以在拿到書籍的30天內(nèi)池户,將完好無(wú)損的書和音樂光盤退回AMAZON,AMAZON將原價(jià)退款凡怎。當(dāng)然AMAZON的成功還不止于此校焦,如果一位顧客在AMAZON購(gòu)買一本書,下次他再次訪問時(shí)栅贴,映入眼簾的首先是這位顧客的名字和歡迎的字樣斟湃。
AMAZON對(duì)于用戶的協(xié)同過(guò)濾就是通過(guò)用戶曾經(jīng)購(gòu)買過(guò)的書和讀者對(duì)其他的書進(jìn)行分析,最后給用戶推薦出用戶可能會(huì)喜歡的新書檐薯。購(gòu)買數(shù)越多凝赛,AMAZON的個(gè)性化推薦功能也越多。
雙手奉上:關(guān)于協(xié)同過(guò)濾
上面文字均參考與百度百科坛缕。