隨著算法的普及箍土,大量的產(chǎn)品有了個性化推薦的功能灌侣,這也成為內(nèi)容類產(chǎn)品的標配侥涵。個性化定制化逐漸成為了互聯(lián)網(wǎng)思維的新補充,被提升到了越來越重要的地位儡嘶。算法推薦經(jīng)過了很長一段時間的發(fā)展谒兄,才逐漸達到能給用戶驚喜的階段。比如在電商領(lǐng)域社付,推薦算法可以挖掘用戶潛在購買需求,縮短用戶選取商品的時間邻耕,提升用戶的購物體驗鸥咖;在新聞或段視頻領(lǐng)域,推薦算法可以推送用戶喜歡的內(nèi)容兄世,提高用戶的閱讀效率啼辣,減少用戶選擇內(nèi)容的時間,也增加了用戶在產(chǎn)品上的停留時長御滩。
算法應(yīng)用階段
內(nèi)容類產(chǎn)品發(fā)展初期鸥拧,推薦算法一般為“熱度算法”,就是系統(tǒng)把熱點內(nèi)容優(yōu)先推薦送給用戶削解,完成熱點內(nèi)容的高閱讀率富弦。在積累了一定的用戶數(shù)據(jù)后,會發(fā)現(xiàn)用戶閱讀內(nèi)容過于集中于熱點信息氛驮,長尾信息中的優(yōu)質(zhì)資源往往被忽略腕柜,造成資源浪費。“千人一面”的狀況已不是一個優(yōu)質(zhì)的解決方案盏缤,所以算法逐漸演變?yōu)椤皞€性化推薦”砰蠢,也就是協(xié)同過濾的方法論支撐下的一種算法。協(xié)同過濾能很好的根據(jù)用戶的喜好唉铜,推薦匹配的內(nèi)容台舱,減少資源浪費,增加用戶使用的友好體驗潭流。真正做到“千人千面”竞惋。
推薦算法的信息來源
第三方數(shù)據(jù)
一個新系統(tǒng)在初期沒有數(shù)據(jù)積累的情況下,可與第三方合作幻枉,互授部分信息共享碰声。比如,很多系統(tǒng)支持微信登陸熬甫,這時候可以獲取客戶的微信信息胰挑,生活地點,部分生活習(xí)慣等椿肩。同時會獲取用戶的社交信息瞻颂,共同好友越多表明圈子越相似,可以推薦更多相似的內(nèi)容郑象。
用戶行為數(shù)據(jù)
記錄用戶在系統(tǒng)內(nèi)的使用習(xí)慣贡这,可以準確的描述單個用戶的行為特征,愛好特征等有效的信息厂榛,系統(tǒng)根據(jù)提取出的分析結(jié)果盖矫,將內(nèi)容與之匹配,完成更精準的推薦击奶。如辈双,某用戶經(jīng)常瀏覽體育信息,系統(tǒng)將對應(yīng)推薦更多體育相關(guān)的咨詢柜砾,省去用戶搜索篩選的時間湃望。
基于生活習(xí)慣
基于生活習(xí)慣,生活常識的推薦痰驱,往往也可以作為內(nèi)置的一個信息來源途徑证芭。比如,外賣的app推薦用戶的餐廳担映,一般默認是位置優(yōu)先废士,就近推薦,如果是快中午的時間段使用蝇完,系統(tǒng)默認推薦午餐湃密,其次是晚餐诅挑。靠生活常識作出的系統(tǒng)算法泛源,可以更符合人類的習(xí)慣拔妥,給用戶更好的體驗。
熱度算法
熱度算法簡單的說就是把最核心的內(nèi)容優(yōu)先推薦达箍,用新聞舉例没龙,每一條新聞都具有實效性,隨著時間的推移缎玫,該條新聞的關(guān)注度降低硬纤,關(guān)注點被新的熱點新聞取代。量化以上的過程赃磨,把各個影響因素設(shè)定為變量筝家,會得出以下的公式:
新聞熱度=初始熱度分+用戶交互熱度分-衰減熱度分
初始熱度分為新聞產(chǎn)生時,系統(tǒng)對新聞主體的預(yù)判熱度值邻辉。預(yù)判的分值一般為以下兩種模式溪王,一種情況,按照新聞類別的不同值骇,娛樂新聞大于財經(jīng)新聞莹菱,大于國際新聞,大于文化新聞等等系統(tǒng)的預(yù)設(shè)吱瘩,依次給出不同的初始熱度分道伟;另一種情況,系統(tǒng)預(yù)置熱詞詞庫使碾,用新聞的關(guān)鍵詞和詞庫的去匹配蜜徽,匹配度高的,初始熱度分高票摇。
用戶的交互熱度分也是一個變量拘鞋,先要明確用的哪些行為會影響新聞熱度,然后對這些行為量化兄朋,加權(quán)或打分等方式。例如怜械,網(wǎng)易云音樂颅和,用戶的聽歌,重復(fù)循環(huán)缕允,收藏峡扩,評論,分享等行為障本,系統(tǒng)為每一種行為打分教届,求和后得出用戶交互的熱度分:
用戶交互熱度分=聽歌X10+循環(huán)X5+收藏X10+評論X5+分享X3
此公式還可以繼續(xù)細化响鹃,每一種操作的分值也可以作為變量,在產(chǎn)品前期時案训,傳播產(chǎn)品為主要任務(wù)买置,所以分享的加權(quán)要大一些,隨著網(wǎng)易云的發(fā)展强霎,社區(qū)的概念逐漸強化忿项,評論區(qū)互動的加權(quán)會加大,所以評論的分值會增加城舞,系統(tǒng)隨時調(diào)整分數(shù)加權(quán)轩触,得出更準確的用戶交互的影響值。
衰減熱度分是一個隨時間變化而變化的數(shù)值家夺,往往是一個函數(shù)的表達脱柱。用新聞舉例,新聞的熱度會隨著時間的推移而衰減拉馋,并且趨勢是越來越快榨为,人們在接受新的熱點后,迅速忘記“舊聞”椅邓,直至熱度趨近于零柠逞。根據(jù)理論數(shù)據(jù),構(gòu)建函數(shù)景馁,準確的表達衰減分值板壮。
還有很多其他的影響因素,比如傳播次數(shù)合住,傳播層數(shù)绰精,停留時長等等,都會影響熱度值透葛,要想更精準的表達笨使,就需要把涉及到的因素都作為變量,不斷完善算法僚害,才能更精準的完成推薦硫椰。
個性化推薦算法
隨著用戶量的增加,產(chǎn)品日活的增加萨蚕,用戶也不能僅限于千人一面熱點閱讀的模式中靶草,個性化推薦在此時顯得尤為重要。個性化推薦有兩種常見的解決方案岳遥,一種是基于內(nèi)容的推薦算法奕翔,推薦內(nèi)容往往是根據(jù)用戶的使用習(xí)慣得來,較為精準浩蓉;另一種是基于用戶的協(xié)同推薦算法派继,系統(tǒng)會根據(jù)以往使用內(nèi)容宾袜,為用戶建模,然后根據(jù)群體中個體的使用習(xí)慣驾窟,推薦更多超預(yù)期的內(nèi)容庆猫,達到預(yù)測推薦的效果。
基于內(nèi)容的推薦算法-預(yù)期內(nèi)
基于內(nèi)容的推薦算法纫普,靠收集用戶的使用習(xí)慣阅悍,進而推薦相關(guān)的內(nèi)容。系統(tǒng)使用分詞庫匹配昨稼、關(guān)鍵詞匹配等等方式节视,達到內(nèi)容的匹配,做到內(nèi)容的精確劃分假栓。比如寻行,用戶瀏覽了某部科幻電影,系統(tǒng)就會按照該電影所對應(yīng)的標簽匾荆,如科幻拌蜘,然后系統(tǒng)推薦相同標簽的影片給用戶。
這樣的推薦方案牙丽,確定性強简卧,推薦的內(nèi)容都是根據(jù)用戶的歷史來確定,不能挖掘用戶的潛在需求烤芦。
基于用戶的協(xié)同推薦-超預(yù)期
做到精準推薦后举娩,系統(tǒng)會繼續(xù)挖掘更潛在的推薦需求,給用戶超預(yù)期的推薦體驗构罗。這就到了基于用戶協(xié)同推薦的階段铜涉。簡單的說,這種算法是增加了用戶建模的環(huán)節(jié)遂唧,將同標簽的用戶群分芙代,對比群體中單個個體的特征,默認這種特征為這類人的潛在特征盖彭,再將此特征內(nèi)容推薦給同標簽的用戶纹烹,達到超預(yù)期的推薦效果。
比如召边,某用戶購買了一個蘋果手機铺呵,系統(tǒng)會將此用戶歸類為果粉,系統(tǒng)識別出很多果粉除了買蘋果的商品掌实,還會購買小米作為備用機陪蜻,這個特征會被系統(tǒng)識別為潛在需求邦马,推薦給果粉贱鼻,減少果粉選擇備用機的時間宴卖。
這樣的推薦算法,不僅能完成精準的推薦邻悬,還能給用戶小驚喜症昏,讓系統(tǒng)“有溫度”。但是這樣的推薦方式父丰,往往需要積累了大量用戶資料為基礎(chǔ)肝谭,才可以精確的完成。