- 協(xié)同過濾簡單來說是利用某興趣相投第岖、擁有共同經(jīng)驗之群體的喜好來推薦用戶感興趣的信息哭当,個人通過合作的機制給予信息相當程度的回應(如評分)并記錄下來以達到過濾的目的進而幫助別人篩選信息漱牵,回應不一定局限于特別感興趣的,特別不感興趣信息的紀錄也相當重要垒探。
- 協(xié)同過濾又可分為評比(rating)或者群體過濾(social filtering)協(xié)同過濾以其出色的速度和健壯性眉撵,在全球互聯(lián)網(wǎng)領域炙手可熱。
- 以用戶為基礎(User-based)的協(xié)同過濾把敞、以項目為基礎(Item-based)的協(xié)同過濾弥奸、以模型為基礎(Model- based)的協(xié)同過濾
- 優(yōu)點
以用戶的角度來推薦的協(xié)同過濾系統(tǒng)有下列優(yōu)點:
能夠過濾機器難以自動內(nèi)容分析的信息,如藝術品先巴,音樂等其爵。
共用其他人的經(jīng)驗,避免了內(nèi)容分析的不完全或不精確伸蚯,并且能夠基于一些復雜的摩渺,難以表述的概念(如信息質(zhì)量、個人品味)進行過濾剂邮。
有推薦新信息的能力摇幻。可以發(fā)現(xiàn)內(nèi)容上完全不相似的信息挥萌,用戶對推薦信息的內(nèi)容事先是預料不到的绰姻。可以發(fā)現(xiàn)用戶潛在的但自己尚未發(fā)現(xiàn)的興趣偏好引瀑。
推薦個性化狂芋、自動化程度高、能夠有效的利用其他相似用戶的回饋信息憨栽、加快個性化學習的速度帜矾。 - 缺點
雖然協(xié)同過濾作為一推薦機制有其相當?shù)膽靡沓妫珔f(xié)同過濾仍有許多的問題需要解決。整體而言屡萤,最典型的問題有
新用戶問題(New User Problem) 系統(tǒng)開始時推薦質(zhì)量較差珍剑;
新項目問題(New Item Problem) 質(zhì)量取決于歷史數(shù)據(jù)集;
稀疏性問題(Sparsity)死陆;
系統(tǒng)延伸性問題(Scalability)
來自百度百科
- 要實現(xiàn)協(xié)同過濾的推薦算法招拙,要進行以下三個步驟:
收集數(shù)據(jù)——找到相似用戶和物品——進行推薦 - Item CF 和 User CF 是基于協(xié)同過濾推薦的兩個最基本的算法,User CF 是很早以前就提出來了措译,Item CF 是從 Amazon 的論文和專利發(fā)表之后(2001 年左右)開始流行别凤,大家都覺得 Item CF 從性能和復雜度上比 User CF 更優(yōu),其中的一個主要原因就是對于一個在線網(wǎng)站瞳遍,用戶的數(shù)量往往大大超過物品的數(shù)量闻妓,同時物品的數(shù)據(jù)相對穩(wěn)定,因此計算物品的相似度不但計算量較小掠械,同時也不必頻繁更新由缆。但我們往往忽略了這種情況只適應于提供商品的電子商務網(wǎng)站,對于新聞猾蒂,博客或者微內(nèi)容的推薦系統(tǒng)均唉,情況往往是相反的,物品的數(shù)量是海量的肚菠,同時也是更新頻繁的舔箭,所以單從復雜度的角度,這兩個算法在不同的系統(tǒng)中各有優(yōu)勢蚊逢,推薦引擎的設計者需要根據(jù)自己應用的特點選擇更加合適的算法层扶。
來自博客網(wǎng)