作者:hooly
微信公眾號(hào):一口袋星光
一屑埋、推薦引擎的工作原理:
推薦引擎的工作原理
二嗦哆、推薦引擎的分類:
基于大眾行為的推薦引擎和個(gè)性化推薦引擎
根據(jù)大眾行為的推薦引擎俊犯,對每個(gè)用戶都給出同樣的推薦帽衙,這些推薦可以是靜態(tài)的由系統(tǒng)管理員人工設(shè)定的,或者基于系統(tǒng)所有用戶的反饋統(tǒng)計(jì)計(jì)算出的熱度比較高的商品
個(gè)性化推薦引擎纸巷,對不同的用戶镇草,根據(jù)他們的口味和喜好給出更加精確的推薦,這時(shí)瘤旨,系統(tǒng)需要了解需推薦內(nèi)容和用戶的特質(zhì)梯啤,或者通過找到與當(dāng)前用戶相同喜好的用戶,實(shí)現(xiàn)推薦存哲。
大部分人們討論的推薦引擎都是個(gè)性化的推薦引擎因宇,因?yàn)閺母旧险f,只有個(gè)性化的推薦引擎才是更加智能的信息發(fā)現(xiàn)過程宏胯。
三羽嫡、根據(jù)推薦引擎的數(shù)據(jù)源
1、根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度肩袍,這種被稱為基于人口統(tǒng)計(jì)學(xué)的推薦(Demographic-based Recommendation)
基于人口統(tǒng)計(jì)學(xué)的推薦
2杭棵、根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù),發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性氛赐,這種被稱為基于內(nèi)容的推薦(Content-based Recommendation)
基于內(nèi)容的推薦
3魂爪、根據(jù)用戶對物品或者信息的偏好,發(fā)現(xiàn)物品或者內(nèi)容本身的相關(guān)性艰管,或者是發(fā)現(xiàn)用戶的相關(guān)性滓侍,這種被稱為基于協(xié)同過濾的推薦(Collaborative Filtering-based Recommendation)。(口口相傳的推薦方式)
三個(gè)基本步驟:
1.用戶給產(chǎn)品評(píng)分
2.協(xié)同過濾找到有相似評(píng)分(即品味)的用戶牲芋,成為鄰近者
3.產(chǎn)品不是由用戶評(píng)分撩笆,而是由用戶的鄰近著的混合評(píng)分決定(領(lǐng)袖者的評(píng)價(jià)可能權(quán)重更大)
基于用戶的協(xié)同過濾
進(jìn)一步研究涉及協(xié)同推薦領(lǐng)域的可信度和能力捺球,其基本思想是,區(qū)分推薦的生產(chǎn)者和使用者夕冲,判斷生產(chǎn)者提供的信息質(zhì)量氮兵。在這種情況下,推薦的使用者是用戶歹鱼;反過來用戶的鄰近者是生產(chǎn)者泣栈,生產(chǎn)者評(píng)分的質(zhì)量可以根據(jù)生產(chǎn)者與使用者評(píng)分之間的差異來衡量。
基于物品的協(xié)同過濾
四弥姻、混合的推薦機(jī)制
在現(xiàn)行的 Web 站點(diǎn)上的推薦往往都不是單純只采用了某一種推薦的機(jī)制和策略南片,他們往往是將多個(gè)方法混合在一起,從而達(dá)到更好的推薦效果庭敦。關(guān)于如何組合各個(gè)推薦機(jī)制疼进,這里講幾種比較流行的組合方法。
加權(quán)的混合(Weighted Hybridization): 用線性公式(linear formula)將幾種不同的推薦按照一定權(quán)重組合起來螺捐,具體權(quán)重的值需要在測試數(shù)據(jù)集上反復(fù)實(shí)驗(yàn)颠悬,從而達(dá)到最好的推薦效果。
切換的混合(Switching Hybridization):前面也講到定血,其實(shí)對于不同的情況(數(shù)據(jù)量,系統(tǒng)運(yùn)行狀況诞外,用戶和物品的數(shù)目等)澜沟,推薦策略可能有很大的不同,那么切換的混合方式峡谊,就是允許在不同的情況下茫虽,選擇最為合適的推薦機(jī)制計(jì)算推薦。
分區(qū)的混合(Mixed Hybridization):采用多種推薦機(jī)制既们,并將不同的推薦結(jié)果分不同的區(qū)顯示給用戶濒析。其實(shí),Amazon啥纸,當(dāng)當(dāng)網(wǎng)等很多電子商務(wù)網(wǎng)站都是采用這樣的方式号杏,用戶可以得到很全面的推薦,也更容易找到他們想要的東西斯棒。
分層的混合(Meta-Level Hybridization): 采用多種推薦機(jī)制盾致,并將一個(gè)推薦機(jī)制的結(jié)果作為另一個(gè)的輸入,從而綜合各個(gè)推薦機(jī)制的優(yōu)缺點(diǎn)荣暮,得到更加準(zhǔn)確的推薦庭惜。
五、冷啟動(dòng)的處理
1基于人口統(tǒng)計(jì)學(xué)和基于內(nèi)容的推薦穗酥,一般來說在初始就需要維護(hù)好用戶或者物品基本屬性數(shù)據(jù)护赊。所以冷啟動(dòng)問題比較容易解決
2.基于用戶的協(xié)同過濾惠遏,當(dāng)新用戶進(jìn)來時(shí),通常是根據(jù)用戶類型骏啰、屬性特征节吮,看相同類型的用戶的喜好,然后假設(shè)當(dāng)前用戶的喜好器一,然后推薦
3.基于物品的協(xié)同過濾课锌,當(dāng)新物品出現(xiàn)時(shí),通常是根據(jù)物品的類型祈秕、屬性特征渺贤,看相同類型的物品都被哪些商戶喜歡,假設(shè)這些商戶同樣喜歡這個(gè)新物品请毛,然后推薦志鞍。
六、評(píng)估推薦系統(tǒng)
用戶認(rèn)為與推薦系統(tǒng)的交互有用嗎方仿?他們對收到的推薦結(jié)果滿意嗎固棚?是什么驅(qū)使用戶貢獻(xiàn)知識(shí)?比如有助于提高系統(tǒng)預(yù)測質(zhì)量的評(píng)分或評(píng)論仙蚜?或或者用戶關(guān)于接受推薦真正喜歡的是什么此洲?是意外和新奇,還是他們知識(shí)不想繼續(xù)找下去了委粉?
概念的有效性呜师、可靠性和靈敏度
實(shí)驗(yàn)研究涉及一般會(huì)通過控制一個(gè)或多個(gè)獨(dú)立變量。
七贾节、個(gè)性化推薦的重點(diǎn):
1.能吸引更多地用戶到商品詳情頁面(物品瀏覽轉(zhuǎn)化率)
2.有助于將更多訪問者變成購買者(銷售轉(zhuǎn)化)
3.促使單個(gè)用戶瀏覽更多物品
4.促使單個(gè)用戶購買更多物品
注意有些算法對點(diǎn)擊量有明顯促進(jìn)作用汁汗;有些算法對銷售轉(zhuǎn)化有明顯促進(jìn)作用;不同的算法促進(jìn)的點(diǎn)不同栗涂。所以要針對推薦的目的選擇合適的算法知牌。
八、算法
這里面并沒有特別關(guān)注算法實(shí)現(xiàn)的東西斤程,大部分公司這些是技術(shù)需要考慮的問題角寸。
九、整體架構(gòu)
推薦系統(tǒng)整理架構(gòu)設(shè)計(jì)
一暖释、特征倉庫
1.用戶維度數(shù)據(jù):是用來描述用戶的特征數(shù)據(jù)袭厂。了解用戶,一般從用戶標(biāo)簽屬性和行為屬性兩個(gè)層面即可球匕。
用戶標(biāo)簽屬性用來描述用戶靜態(tài)特征:性別纹磺、年齡、愛好亮曹、家庭住址等等
用戶行為數(shù)據(jù)簡單來說就是行為日志:用戶查看了什么橄杨、點(diǎn)擊了什么秘症、收藏了、添加購物車了式矫;分為顯性和隱形兩類:顯性的就是指能看出用戶的偏好比如收藏乡摹、添加購物車,而隱形的看不出用戶明顯的偏好采转,比如瀏覽行為聪廉,很可能只是因?yàn)檫@個(gè)頁面是首頁而已。
2.內(nèi)容維度數(shù)據(jù):表示內(nèi)容的細(xì)節(jié)特征故慈,比如內(nèi)容是商品板熊,則商品的價(jià)格、重量察绷、顏色干签、型號(hào)等都是內(nèi)容維度的數(shù)據(jù)
3.時(shí)間維度、城市維度:比如用戶在北京的行為數(shù)據(jù)拆撼、用戶在晚上12點(diǎn)的行為數(shù)據(jù)容劳。分析用戶特征的時(shí)候,要考慮用戶的地點(diǎn)和實(shí)效闸度。
二竭贩、計(jì)算邏輯層
用戶內(nèi)容匹配:用戶喜歡某些特征的內(nèi)容;如果有些內(nèi)容包含這些特征莺禁,則認(rèn)為用戶喜歡這些內(nèi)容
內(nèi)容匹配:利用用戶之前喜歡的內(nèi)容娶视,找到與這些內(nèi)容相似的內(nèi)容,認(rèn)為是用戶喜歡的睁宰。
用戶匹配:根據(jù)用戶特征尋找相似的用戶,相似的用戶喜歡的東西寝凌,認(rèn)為這個(gè)用戶也喜歡柒傻。
三、針對初步結(jié)果集的分析
1.過濾:把之前的推薦歷史過濾掉较木,把不符合要求红符、質(zhì)量差的內(nèi)容過濾掉
2.排名:制定結(jié)果集的優(yōu)先級(jí)
3.選擇優(yōu)質(zhì)內(nèi)容,整理伐债,進(jìn)行推薦
十预侯、其他:
在算法層有些東西還是可以細(xì)分
比如N中推薦策略的疊加組合權(quán)重的靈活設(shè)置(可配置)
熱銷商品懲罰系數(shù)設(shè)置(可配置)
業(yè)務(wù)突發(fā)要求,某類商品的推薦降權(quán)處理等等峰锁。
這些都不應(yīng)該寫死在算法中萎馅,應(yīng)該做成靈活可配置的,適應(yīng)各種情況下的需求虹蒋。
作者:hooly
微信公眾號(hào):一口袋星光
我會(huì)在微信公號(hào)上持續(xù)更新我的文章糜芳,你來討論我很歡迎飒货。