做個(gè)性化推薦原因
從用戶角度:根據(jù)用戶特征過(guò)濾掉“無(wú)效”物品/信息第美,推薦符合用戶口味的物品/信息,從而提升用戶體驗(yàn),進(jìn)一步也增加用戶點(diǎn)擊率涨享,為轉(zhuǎn)化提供更多可能性。
從系統(tǒng)的角度:可以讓更多長(zhǎng)尾的物品/信息被曝光仆百,從而更大效率的李良勇資源厕隧。
個(gè)性化算法的大前提
1、給物打標(biāo)簽
????標(biāo)簽不只是簡(jiǎn)單的給物品/信息分類俄周,而是代表著分發(fā)給不同的用戶群體吁讨,比如運(yùn)動(dòng)、健身類視頻就可以在標(biāo)簽中加上“球迷”“健身達(dá)人”等峦朗,有關(guān)動(dòng)漫等二次元的內(nèi)容建丧,也可以加入些類似“宅男”“蘿莉”等標(biāo)簽。
????分類是樹狀的波势,是自上而下依次劃分的翎朱。在分類體系里,每個(gè)節(jié)點(diǎn)都有嚴(yán)格的父子關(guān)系尺铣,在兄弟節(jié)點(diǎn)層都具有可以被完全枚舉的屬性值拴曲。
? ??標(biāo)簽是網(wǎng)狀的,更強(qiáng)調(diào)表達(dá)屬性關(guān)系而非繼承關(guān)系凛忿, 只有權(quán)重大小之分澈灼,不強(qiáng)調(diào)包含與被包含關(guān)系。這就使得相對(duì)于分類而言侄非,標(biāo)簽的靈活性更強(qiáng)蕉汪。 在權(quán)威性方面流译,標(biāo)簽是弱化的,每個(gè)用戶都可參與進(jìn)來(lái)者疤,基于自己的偏好貼標(biāo)簽福澡,從而借助規(guī)模效應(yīng)實(shí)現(xiàn)對(duì)信息表意完備性的覆蓋。因此驹马,在設(shè)計(jì)系統(tǒng)時(shí)革砸,可以先基于產(chǎn)品場(chǎng)景快速覆蓋主要標(biāo)簽,再結(jié)合標(biāo)簽集合的使用頻次糯累、專家建議等因素逐步將部分入口收斂到樹狀的分類體系中來(lái)算利。
2、為用戶打標(biāo)簽
通常一個(gè)用戶的行為數(shù)據(jù)包括:用戶給物品打上標(biāo)簽泳姐。
給用戶提供標(biāo)簽的方法主要有:給用戶推薦一個(gè)系統(tǒng)中最熱門的標(biāo)簽效拭;給用戶推薦物品上最熱門的標(biāo)簽;給用戶推薦他自己經(jīng)常使用的標(biāo)簽等胖秒。實(shí)際過(guò)程中缎患,為了給用戶精確的推薦,除了用戶的行為數(shù)據(jù)外阎肝,還會(huì)收集用戶基本信息挤渔、位置信息、搜索等信息簡(jiǎn)歷完整的用戶畫像风题。
推薦算法原則
1判导、相似物的推薦
? ? 基于物的相似性推薦是基礎(chǔ)的推薦策略。
(1)優(yōu)點(diǎn)
只依賴物品本身的特征而不依賴用戶的行為沛硅,讓新的物品眼刃、冷僻的物品都能得到展示的機(jī)會(huì)。
(2)缺點(diǎn)
推薦質(zhì)量的優(yōu)劣完全依賴于特征構(gòu)建的完備性稽鞭,但特征構(gòu)建本身是一項(xiàng)系統(tǒng)的工程鸟整,存在一定成本;
基于物品或信息屬性推薦沒(méi)有考慮用戶對(duì)物品的態(tài)度朦蕴,用戶的品位和調(diào)性很難得到詮釋和表達(dá)。比如弟头,市面上關(guān)于內(nèi)容分發(fā)的書籍很多吩抓,僅從標(biāo)簽詞上很難分辨出高下。
2赴恨、基于用戶行為協(xié)同過(guò)濾
主要思路為:第一步疹娶,找到那些與你在某一方面口味相似的人群;
第二步伦连,將這一人群喜歡的東西推薦給你雨饺。
(1)基于用戶的協(xié)同過(guò)濾(user CollaborationFilter-User CF)
首先钳垮,通過(guò)用戶對(duì)內(nèi)容/物品的偏好找到相鄰鄰居用戶,然后將鄰居用戶喜歡的推薦給當(dāng)前用戶额港。下圖給出了一個(gè)例子饺窿,對(duì)于用戶 A,根據(jù)用戶的歷史偏好移斩,這里只計(jì)算得到一個(gè)鄰居—用戶C肚医,然后將用戶C喜歡的物品D推薦給用戶 A。
(2)基于物品的CF
基于物品的 CF 的原理和基于用戶的 CF 類似向瓷,只是在計(jì)算鄰居時(shí)采用物品本身肠套,而不是從用戶的角度,即基于用戶對(duì)物品的偏好找到相似的物品猖任,然后根據(jù)用戶的歷史偏好你稚,推薦相似的物品給他。下圖給出了一個(gè)例子朱躺,對(duì)于物品A入宦,根據(jù)所有用戶的歷史偏好,喜歡物品 A的用戶都喜歡物品C室琢,得出物品A和物品C比較相似乾闰,而用戶C喜歡物品A,那么可以推斷出用戶C可能也喜歡物品 C盈滴。