2017年字節(jié)跳動(dòng)公司旗下的今日頭條和抖音APP的火爆疾捍,讓人們領(lǐng)略到推薦系統(tǒng)的強(qiáng)大徐鹤。而如何做到“千人千面”,如何做到推薦給用戶是他真正喜歡的酪我,而不是他之前已經(jīng)瀏覽過的司浪?更甚者是如何幫助用戶發(fā)現(xiàn)他的愛好泊业,從而改善用戶的閱讀效率?這都是推薦系統(tǒng)應(yīng)該做到的事情啊易。
一個(gè)好的推薦系統(tǒng)吁伺,筆者認(rèn)為主要有以下四個(gè)核心內(nèi)容:
內(nèi)容:內(nèi)容數(shù)量、內(nèi)容特征租谈;
用戶:用戶量篮奄、用戶固有屬性、用戶關(guān)系鏈割去;
用戶—內(nèi)容連接通道:用戶瀏覽內(nèi)容時(shí)產(chǎn)生的反饋窟却,如閱讀、點(diǎn)贊劫拗、評論等间校;
算法:根據(jù)不同的特征及策略要求對不同的算法進(jìn)行迭代,如協(xié)同過濾页慷、邏輯回歸等憔足。
其中,作為資訊類的推薦系統(tǒng)PM酒繁,除算法需要由算法工程師來負(fù)責(zé)完成外滓彰,剩下三點(diǎn)PM都要和工程師或者編輯共同完成的。推薦內(nèi)容質(zhì)量的保證州袒,少不了PM的跑前跑后啊揭绑。
微信“看一看”的出發(fā)點(diǎn)是改善用戶對訂閱號的閱讀效率,讓用戶更快地進(jìn)入到內(nèi)容里——本質(zhì)上充當(dāng)著基于推薦系統(tǒng)的新聞資訊類產(chǎn)品的功能郎哭。
本文接下來就以“看一看”為例他匪,圍繞“內(nèi)容”、“用戶”夸研、“用戶—內(nèi)容連接通道”邦蜜,從推薦特征及推薦的可解釋性兩個(gè)方面分析其推薦系統(tǒng)現(xiàn)狀及改進(jìn)措施,以達(dá)到改善用戶閱讀體驗(yàn)的目的亥至,做到推薦的“千人千面”悼沈。
一、推薦特征
近幾年姐扮,深度學(xué)習(xí)的大火絮供,在很多領(lǐng)域都實(shí)現(xiàn)端到端的學(xué)習(xí)(如圖像、語音等)茶敏,但是在推薦系統(tǒng)這個(gè)領(lǐng)域王國壤靶,特征工程卻是必不可少的。
通過筆者的體驗(yàn)惊搏,微信“看一看”采用的特征主要有以下幾點(diǎn):
1.內(nèi)容特征
與其他新聞資訊類產(chǎn)品相同的是:微信“看一看”在內(nèi)容形式上有圖文贮乳、視頻等,在屬性劃分上采用典型的層次化文本分類算法胀屿。
而不同的是:其內(nèi)容特征除了有圖文內(nèi)容特征外塘揣,還具有公眾號的屬性特征,從而將內(nèi)容與內(nèi)容背后的賬號進(jìn)行連接宿崭。
“看一看”根據(jù)用戶目前已關(guān)注的公眾號亲铡、公眾號內(nèi)容及用戶的瀏覽記錄等反饋行為,預(yù)測用戶感興趣的內(nèi)容類型葡兑,進(jìn)而幫助用戶去更快地到其所感興趣的內(nèi)容奖蔓。
2.用戶特征
用戶特征指用戶的畫像,如用戶的年齡讹堤、性別吆鹤、地理位置等,不同特征下的用戶感興趣的內(nèi)容也是不同的洲守。
3.熱度特征
微信“看一看”有熱門話題和要聞這兩種屬性特征疑务,熱門話題是公眾號里討論最多的熱點(diǎn)話題沾凄,要聞、24小時(shí)新聞的內(nèi)容多來自騰訊新聞知允。
4.協(xié)同特征
與其他新聞資訊類產(chǎn)品不同的是撒蟀,微信本身發(fā)揮著即時(shí)通訊的功能,用戶的社交關(guān)系鏈自然就成為其推薦系統(tǒng)的一個(gè)重要的屬性温鸽。
推薦系統(tǒng)不僅給用戶推薦其所感興趣的內(nèi)容保屯,還挖掘“朋友都在看”、“朋友圈熱點(diǎn)”等信息涤垫,將好友屬性和公眾號屬性進(jìn)行疊加姑尺,避免了越推越窄的窘迫。
微信“看一看”目前依靠以上四種特征蝠猬,發(fā)掘用戶的喜好切蟋,給用戶推薦其感興趣的內(nèi)容,進(jìn)而提升用戶的閱讀效率吱雏。
智能時(shí)代敦姻,用戶每時(shí)每刻都在產(chǎn)生信息,推薦系統(tǒng)可以利用的特征也就更多歧杏。
對此镰惦,除以上特征外,筆者認(rèn)為微信“看一看”還可以采用的推薦特征如下(紅色部分):
(1)協(xié)同特征
在即時(shí)通訊方面犬绒,與QQ不同的是:微信更多的是履行著熟人社交的職責(zé)旺入。
熟人,即具有相同價(jià)值觀凯力、相同興趣愛好的社群茵瘾,而熟人(朋友)又可細(xì)分為經(jīng)常聯(lián)系的與不經(jīng)常聯(lián)系的,經(jīng)常聯(lián)系的朋友對于用戶的閱讀行為具有指引作用咐鹤,用戶也會趨向于獲得與經(jīng)常聯(lián)系的朋友相同或者相似的資訊信息拗秘。
因此,對比微信之前的協(xié)同特征祈惶,可以將好友屬性細(xì)分為經(jīng)常聯(lián)系好友與不經(jīng)常聯(lián)系好友雕旨,進(jìn)而在推薦算法上為不同的好友屬性設(shè)置不同的權(quán)重。
(2) 環(huán)境特征
工作捧请、通勤凡涩、旅游,用戶所處環(huán)境的變化疹蛉,對當(dāng)時(shí)瀏覽的內(nèi)容也會有所差別活箕。
而這一屬性的數(shù)據(jù)通常無法直接獲得,需要結(jié)合算法策略分析多個(gè)屬性的相關(guān)關(guān)系可款,從而生成環(huán)境特征育韩,如通過微信支付獲得的用戶購買信息(購買車票克蚂、旅游門票等)、用戶地理信息的變化等可以預(yù)測出用戶目前所處的環(huán)境座慰,進(jìn)而可以給用戶推薦所處環(huán)境相對應(yīng)的內(nèi)容陨舱。
二翠拣、推薦可解釋比精準(zhǔn)更有意義
智能時(shí)代版仔,推薦系統(tǒng)的“千人千面”不僅體現(xiàn)在推薦內(nèi)容的差異,還體現(xiàn)在推薦理由的表達(dá)方式的不同误墓。
對新聞資訊類產(chǎn)品來說蛮粮,推薦理由是為了讓用戶知道每一項(xiàng)推薦項(xiàng)目是怎么得到的,從而說服用戶接受產(chǎn)品的推薦谜慌,這在改善用戶閱讀體驗(yàn)上是有一定意義的然想。
吸引用戶點(diǎn)擊閱讀的因素有標(biāo)題、來源欣范、縮略圖变泄、推薦理由等,這些因素的本質(zhì)是給用戶一個(gè)點(diǎn)擊的理由恼琼。用戶是懶的妨蛹,在推薦理由精準(zhǔn)、合理的情況下晴竞,才能夠真正“智能”地幫助用戶快速找到感興趣的內(nèi)容蛙卤。
微信“看一看”目前已有的推薦理由形式如下:
“看一看”基于用戶的興趣、熱點(diǎn)噩死、社交/協(xié)同過濾的群體來生成推薦理由颤难,這些推薦理由在輔助用戶產(chǎn)生瀏覽行為上有一定的促進(jìn)作用,但是卻并沒有做到真正的“千人千面”已维,因?yàn)槠鋵Σ煌脩舻耐扑]理由的表達(dá)方式是相同的行嗤。
智能時(shí)代,推薦理由的“千人千面”應(yīng)該體現(xiàn)在不同用戶的特異性上垛耳,即推薦理由的人性化栅屏、個(gè)性化。
同樣的推薦理由艾扮,結(jié)合目標(biāo)用戶的屬性既琴、習(xí)慣以及內(nèi)容的上下文環(huán)境,可以生成不同語言的表達(dá)方式泡嘴,如有些用戶可能更喜歡賣萌的方式甫恩,有些用戶更喜歡嚴(yán)謹(jǐn)?shù)姆绞健@樣的推薦理由,才是真正的“千人千面”酌予。