協(xié)同過(guò)濾
定義:
- 協(xié)同過(guò)濾(Collaborative Filtering)技術(shù),是推薦系統(tǒng)中應(yīng)用最為廣泛的技術(shù)之一语婴,它基于一組興趣相同的用戶進(jìn)行推薦描孟。準(zhǔn)確來(lái)說(shuō)是一種方法論,它假設(shè)可以通過(guò)購(gòu)買或使用歷史找出近似的用戶或商品砰左。來(lái)源:(https://www.zhihu.com/question/21507689%EF%BC%89)
- 協(xié)同過(guò)濾匿醒,Collaborative Filtering(簡(jiǎn)稱:CF)。 基于集體用戶智慧缠导,在一定相關(guān)基礎(chǔ)上廉羔,有比較好的豐富度,可以幫助用戶發(fā)現(xiàn)潛在興趣僻造。來(lái)源:知乎喵姐(https://zhuanlan.zhihu.com/p/24045987)
- 協(xié)同過(guò)濾(Collaborative Filtering憋他,CF)是推薦系統(tǒng)廣泛使用的一種技術(shù)孩饼,它主要通過(guò)考慮用戶(User)與用戶之間、物品(Item)與物品之間的相似度(Similarity)竹挡,來(lái)向用戶推薦物品捣辆。、協(xié)同過(guò)濾算法得到的是對(duì)一件item的評(píng)分此迅。協(xié)同過(guò)濾將評(píng)分最高的item推薦給user汽畴。協(xié)同過(guò)濾得到的推薦是有排序的,評(píng)分越高耸序,推薦的程度就越高忍些。 - 定義來(lái)源:(知乎用戶)</mark>
- 協(xié)同過(guò)濾簡(jiǎn)單來(lái)說(shuō)是利用某興趣相投、擁有共同經(jīng)驗(yàn)之群體的喜好來(lái)推薦用戶感興趣的信息坎怪,個(gè)人通過(guò)合作的機(jī)制給予信息相當(dāng)程度的回應(yīng)(如評(píng)分)并記錄下來(lái)以達(dá)到過(guò)濾的目的進(jìn)而幫助別人篩選信息罢坝,回應(yīng)不一定局限于特別感興趣的,特別不感興趣信息的紀(jì)錄也相當(dāng)重要搅窿。
舉例:
國(guó)外案例: -GroupLens 這個(gè)系統(tǒng)主要是應(yīng)用在新聞的篩選上嘁酿,幫助新聞的閱聽(tīng)者過(guò)濾其感興趣的新聞內(nèi)容,閱聽(tīng)者看過(guò)內(nèi)容后給一個(gè)評(píng)比的分?jǐn)?shù)男应,系統(tǒng)會(huì)將分?jǐn)?shù)記錄起來(lái)以備未來(lái)參考之用闹司,假設(shè)前提是閱聽(tīng)者以前感興趣的東西在未來(lái)也會(huì)有興趣閱聽(tīng),若閱聽(tīng)者不愿揭露自己的身分也可以匿名進(jìn)行評(píng)分沐飘。 和Tapestry不同之處有兩點(diǎn)游桩,首先,Tapestry專指一個(gè)點(diǎn)(如一個(gè)網(wǎng)站內(nèi)耐朴、一個(gè)系統(tǒng)內(nèi))的過(guò)濾機(jī)制借卧;GroupLens則是跨點(diǎn)跨系統(tǒng)的新聞過(guò)濾機(jī)制。再來(lái)筛峭,Tapestry不會(huì)將同一筆資料的評(píng)比總和起來(lái)铐刘;GroupLens會(huì)將同一筆資料從不同使用者得到的評(píng)比加總。
讓我們知道的理由 GroupLens具有以下特點(diǎn):開(kāi)放性所有的新聞閱聽(tīng)者皆可使用影晓,雖然系統(tǒng)委托Better Bit Bureau設(shè)計(jì)給分的系統(tǒng)镰吵,但若有不同的評(píng)分機(jī)制也適用于GroupLens。方便性:給分并不是一件困難的事情且溝通上非常方便俯艰,評(píng)分結(jié)果容易詮釋捡遍。規(guī)模性:有可能發(fā)展成大規(guī)模的系統(tǒng)锌订,一旦發(fā)展成大規(guī)模竹握,儲(chǔ)存空間與計(jì)算成本問(wèn)題顯得相當(dāng)棘手。隱密性:如果使用者不想讓別人知道他是誰(shuí)辆飘,別人就不會(huì)知道啦辐。由此可以看出谓传,現(xiàn)今網(wǎng)絡(luò)各個(gè)推薦系統(tǒng)的雛形已然形成,在GroupLens之后還有性質(zhì)相近的MovieLens芹关,電影推薦系統(tǒng)续挟;Ringo,音樂(lè)推薦系統(tǒng)侥衬;Video Recommender诗祸,影音推薦系統(tǒng);以及Jster轴总,笑話推薦系統(tǒng)等等直颅。乃至于今日的YouTube、aNobii皆是相似性值得網(wǎng)絡(luò)推薦平臺(tái)怀樟,較不同的是經(jīng)過(guò)時(shí)間推移功偿,網(wǎng)絡(luò)越來(lái)越發(fā)達(dá),使用者越來(lái)越多往堡,系統(tǒng)也發(fā)展得越來(lái)越嚴(yán)密械荷。與Tapestry相比,GroupLens的過(guò)濾機(jī)制更加的全面虑灰。 不同的評(píng)分機(jī)制也適用于該系統(tǒng)吨瞎,不只是局限于一個(gè)評(píng)分機(jī)制。**
為何符合定義:1穆咐、這個(gè)系統(tǒng)會(huì)對(duì)一些內(nèi)容進(jìn)行篩選关拒,根據(jù)讀者的愛(ài)好以及感興趣的方面進(jìn)行推薦。 2庸娱、有著一套評(píng)分系統(tǒng)着绊,并且可以將不同使用者的評(píng)比加總,更加方便讀者的交流以及能讓讀者得到更加全面的信息熟尉。
- :網(wǎng)易云音樂(lè)是一款專注于發(fā)現(xiàn)與分享的音樂(lè)產(chǎn)品归露,依托專業(yè)音樂(lè)人、DJ斤儿、好友推薦及社交功能剧包,在線音樂(lè)服務(wù)主打歌單、社交往果、大牌推薦和音樂(lè)指紋疆液,以歌單、DJ節(jié)目陕贮、社交堕油、地理位置為核心要素,主打發(fā)現(xiàn)和分享。網(wǎng)易云音樂(lè)讓用戶通過(guò)綁定手機(jī)通訊錄掉缺、#微博卜录、人人網(wǎng)等發(fā)現(xiàn)已有用戶,關(guān)注對(duì)方后眶明,可以看到朋友的音樂(lè)行為艰毒。用戶可以查看身邊在使用網(wǎng)易云音樂(lè)聽(tīng)歌的人和他在聽(tīng)的歌曲,也可以添加關(guān)注搜囱。它會(huì)根據(jù)用戶所聽(tīng)或所搜的歌曲推出“猜你喜歡”的歌單丑瞧;用戶對(duì)音樂(lè)的喜歡與否或是音質(zhì)的問(wèn)題也會(huì)對(duì)歌曲的評(píng)分有影響。
-
==
為何符合定義
1.能夠過(guò)濾難以進(jìn)行機(jī)器自動(dòng)基于內(nèi)容分析的信息蜀肘。 2.推薦的新穎性嗦篱。 3、人性化設(shè)計(jì)及個(gè)性化推行
- 為何值得我們知道幌缝? 一灸促、提供更人性化的服務(wù)會(huì)提高用戶的使用率,既滿足用戶需求又帶動(dòng)產(chǎn)業(yè)發(fā)展涵卵。 二浴栽、更便捷和人性化的服務(wù)證明了我國(guó)科技技術(shù)正一步步地成熟,我們時(shí)刻關(guān)注社會(huì)發(fā)展轿偎,才利于個(gè)人自身的發(fā)展典鸡。
- 國(guó)內(nèi)案例
今日頭條:引入個(gè)性化推薦的策略。他們所采用的坏晦,是協(xié)同過(guò)濾(Collaborative Filtering) + 基于內(nèi)容推薦 +熱門推薦
- 為何值得我們知道
1.它是我國(guó)網(wǎng)絡(luò)門戶落幕的標(biāo)志萝玷,是我國(guó)網(wǎng)絡(luò)媒體進(jìn)入一個(gè)新階段的標(biāo)志。具有代表性昆婿。
2.它是基于多種推薦方式相結(jié)合球碉,我們通過(guò)了解可以更好地知道不同推薦方式之間的區(qū)別。
- 為何符合定義:
1.通過(guò)分析文章的相似程度來(lái)推薦給用戶仓蛆,這體現(xiàn)定義中的物品與物品之間的相似度睁冬。
2.100篇新的文章出來(lái)之后,對(duì)部分用戶進(jìn)行了曝光看疙,然后就可以根據(jù)用戶相似度豆拨,來(lái)預(yù)計(jì)其他用戶對(duì)這篇文章的興趣度,進(jìn)而挑選這100篇中預(yù)計(jì)興趣度最高的30篇曝光給這群用戶能庆。這體現(xiàn)了定義中用戶與用戶之間的相似度施禾。
與傳統(tǒng)文本過(guò)濾相比,協(xié)同過(guò)濾有下列優(yōu)點(diǎn):
能夠過(guò)濾難以進(jìn)行機(jī)器自動(dòng)基于內(nèi)容分析的信息搁胆。如藝術(shù)品弥搞、音樂(lè);
能夠基于一些復(fù)雜的邮绿,難以表達(dá)的概念(信息質(zhì)量、品位)進(jìn)行過(guò)濾;
推薦的新穎性拓巧。
正因?yàn)槿绱怂孤担瑓f(xié)同過(guò)濾在商業(yè)應(yīng)用上也取得了不錯(cuò)的成績(jī)一死。Amazon肛度,CDNow,MovieFinder投慈,都采用了協(xié)同過(guò)濾的技術(shù)來(lái)提高服務(wù)質(zhì)量承耿。
缺點(diǎn)是:
用戶對(duì)商品的評(píng)價(jià)非常稀疏,這樣基于用戶的評(píng)價(jià)所得到的用戶間的相似性可能不準(zhǔn)確(即稀疏性問(wèn)題);
隨著用戶和商品的增多伪煤,系統(tǒng)的性能會(huì)越來(lái)越低;
如果從來(lái)沒(méi)有用戶對(duì)某一商品加以評(píng)價(jià)加袋,則這個(gè)商品就不可能被推薦(即最初評(píng)價(jià)問(wèn)題)。
因此抱既,現(xiàn)在的電子商務(wù) 推薦系統(tǒng)都采用了幾種技術(shù)相結(jié)合的推薦技術(shù)职烧。
參考的文獻(xiàn):
- http://baike.sogou.com/v55257271.htm?fromTitle=協(xié)同過(guò)濾