#推薦系統(tǒng)是用來解決實際問題的,本質(zhì)是通過一定的方式將用戶與物品聯(lián)系起來鼻疮,而不同的推薦系統(tǒng)利用了不同的方式怯伊。
常見的有 社會化推薦、基于內(nèi)容的推薦判沟、基于協(xié)同過濾的推薦
#幾乎所有的推薦系統(tǒng)應(yīng)用都是由前臺的展示頁面震贵、后臺的日志系統(tǒng)以及推薦算法系統(tǒng)3部分構(gòu)成。
#前端:
物品信息:比如電影的標(biāo)題水评、海報
用戶反饋模塊:比如音樂的播放、評分媚送、不感興趣 ??
推薦理由
#推薦系統(tǒng)評測:
一個完整的推薦系統(tǒng)一般存在3個參與方:用戶中燥、物品提供者、推薦系統(tǒng)本身
首先塘偎,推薦系統(tǒng)需要滿足用戶的需求疗涉,給用戶推薦那些令他們感興趣的物品拿霉。
其次,推薦系統(tǒng)要讓各方物品提供者的物品都能夠被推薦給對其感興趣的用戶咱扣,而不是只推薦幾個大型的提供者绽淘。
最后,好的推薦系統(tǒng)能夠收集用戶反饋闹伪,不斷完善推薦的質(zhì)量沪铭,令三方共贏。
預(yù)測精準(zhǔn)度是推薦系統(tǒng)領(lǐng)域的重要指標(biāo)(沒有之一)
好的推薦系統(tǒng)不僅僅能準(zhǔn)確預(yù)測用戶的行為偏瓤,而且能夠擴展用戶的視野杀怠,幫助用戶發(fā)現(xiàn)那些他們可能感興趣,但卻不那么容易發(fā)現(xiàn)的東西厅克。
#推薦系統(tǒng)實驗方法
1. 離線實驗
優(yōu)點:速度快赔退,可以測試大量算法;
缺點:無法計算點擊率证舟、轉(zhuǎn)化率等商業(yè)指標(biāo)
2. 用戶調(diào)查
優(yōu)點:可以獲得主觀感受的指標(biāo)硕旗,e.g. 滿意度
缺點:成本較高,可能因被試樣本不同女责,導(dǎo)致結(jié)果偏差
3. 在線實驗
周期長漆枚,要有選擇性;AB系統(tǒng)比較復(fù)雜鲤竹,注意不同實驗組間的用戶分層是否有交叉浪读;
#測評指標(biāo):
1. 用戶滿意度
2. 預(yù)測精準(zhǔn)度
- 評分預(yù)測
- TopN推薦
3. 覆蓋率(信息熵、基尼系數(shù)
4. 多樣性
5. 新穎性(過濾已讀辛藻、整體低流行度
6. 驚喜度(推薦和歷史不相似碘橘,但覺得滿意
7. 信任度(增加推薦系統(tǒng)的透明度、利用用戶的好友信息給用戶做推薦
8. 實時性
9. 健壯性(盡量使用代價比較高的用戶行為
10. 商業(yè)目標(biāo)
總結(jié):離線優(yōu)化的指標(biāo)吱肌,應(yīng)該是在限制既定覆蓋率痘拆、多樣性、新穎性的條件下氮墨,盡量優(yōu)化預(yù)測精準(zhǔn)度
#測評維度:
1. 用戶維度(人口統(tǒng)計學(xué)信息纺蛆、活躍度以及是不是新用戶
2. 物品維度(包括物品屬性、流行度规揪、平均分以及是不是新加入的物品
3. 時間維度(包括季節(jié)桥氏、是否工作日、白天或晚上等
如何了解一個人猛铅,《論語》說:“聽其言字支,觀其行”。通過用戶留下的文字和行為了解用戶興趣和需求。
實現(xiàn)個性化推薦最理想的情況是用戶能在注冊的時候主動告訴我們他喜歡什么堕伪,但這種方法有3個缺點:
1. 現(xiàn)在的自然語言理解技術(shù)很難理解用戶用來描述興趣的自然語言揖庄;
2. 用戶的興趣是不斷變化的,但用戶不會不停地更新興趣描述欠雌;
3. 很多時候用戶并不知道自己喜歡什么蹄梢,或者很難用語言描述自己喜歡什么;