淺談內(nèi)容推薦在社區(qū)類產(chǎn)品中的落地方式

按:做社區(qū)產(chǎn)品,內(nèi)容推薦是一個(gè)繞不開的話題。傳統(tǒng)論壇按版塊分發(fā)內(nèi)容的模式具有被動(dòng)屿良、低效等局限性,已不再適合如今快節(jié)奏的閱讀模式惫周,用戶不再有大量的時(shí)間「沙里淘金」尘惧,因此基于內(nèi)容的推薦模式被越來越多地應(yīng)用到內(nèi)容社區(qū)產(chǎn)品中。本文依據(jù)前人對(duì)內(nèi)容推薦的研究递递,綜合自身實(shí)踐褥伴,簡(jiǎn)要討論內(nèi)容推薦的一些落地方式。


什么是內(nèi)容推薦

內(nèi)容推薦是「基于內(nèi)容本身的推薦」漾狼,即將內(nèi)容進(jìn)行分析后建立特征重慢,然后依據(jù)這些特征給用戶進(jìn)行推薦,這種特征往往用「標(biāo)簽」來定義逊躁。標(biāo)簽在整個(gè)內(nèi)容推薦體系中具有很重要的作用似踱。那么如何進(jìn)行標(biāo)簽的制定,即所謂「打標(biāo)簽」呢稽煤?

內(nèi)容標(biāo)簽

1. 用戶自行打標(biāo)簽
用戶自行打標(biāo)簽有兩種方式:一是用戶在平臺(tái)預(yù)設(shè)標(biāo)簽下生產(chǎn)的內(nèi)容會(huì)自動(dòng)打上對(duì)應(yīng)標(biāo)簽核芽,二是平臺(tái)允許用戶自行添加一些標(biāo)簽。后一種方式可能由于用戶對(duì)內(nèi)容把握不足酵熙,或惡意操作轧简,導(dǎo)致大量冗余標(biāo)簽或噪音標(biāo)簽產(chǎn)生,不利于后期維護(hù)匾二。
2. 機(jī)器自動(dòng)打標(biāo)簽
使用機(jī)器進(jìn)行打標(biāo)簽哮独,有一定的開發(fā)成本。一般可以結(jié)合分詞技術(shù)和 TF-IDF 來提取關(guān)鍵詞作為標(biāo)簽察藐。這里需要注意的一點(diǎn)是皮璧,這種打標(biāo)簽的方式對(duì)文本的依賴度較高,如果社區(qū)內(nèi)容為音頻分飞、視頻等多媒體內(nèi)容悴务,這種方式僅能作用于內(nèi)容的標(biāo)題,因此可能會(huì)受一些「標(biāo)題黨」的干擾譬猫,但總體打標(biāo)簽效率比較高讯檐。
3. 運(yùn)營(yíng)人工打標(biāo)簽
運(yùn)營(yíng)人工打標(biāo)簽是一種最笨羡疗,但也是最有效的方法。通過運(yùn)營(yíng)人工干預(yù)别洪,可以對(duì)內(nèi)容標(biāo)簽進(jìn)行復(fù)核叨恨,使標(biāo)簽和內(nèi)容匹配度更高;同時(shí)通過運(yùn)營(yíng)介入蕉拢,可以人工設(shè)置關(guān)聯(lián)標(biāo)簽特碳,將關(guān)聯(lián)標(biāo)簽進(jìn)行聚類處理。

因此晕换,一般的做法是午乓,用戶在某一預(yù)設(shè)標(biāo)簽下生產(chǎn)內(nèi)容,由機(jī)器進(jìn)行自動(dòng)打標(biāo)簽后闸准,運(yùn)營(yíng)進(jìn)行人工標(biāo)簽復(fù)審益愈。

用戶標(biāo)簽

除了內(nèi)容標(biāo)簽外,如果想做到更精細(xì)化的推薦夷家,還需要給用戶進(jìn)行「特征化分析」蒸其,也就是給用戶也打上標(biāo)簽。用戶和內(nèi)容的交互库快,如點(diǎn)擊摸袁、瀏覽、點(diǎn)贊义屏、收藏等靠汁,都可以作為給用戶打標(biāo)簽的基礎(chǔ)。
用戶打標(biāo)簽的過程需要注意兩點(diǎn)闽铐,一是由于熱門內(nèi)容會(huì)干預(yù)用戶的標(biāo)簽蝶怔,因此對(duì)于熱門內(nèi)容的標(biāo)簽,需要做降權(quán)處理兄墅;二是用戶的興趣會(huì)隨著時(shí)間衰減或發(fā)生變化踢星,這時(shí)需要對(duì)用戶的標(biāo)簽進(jìn)行清洗,可以給內(nèi)容增加「不感興趣」的選項(xiàng)隙咸,用戶觸發(fā)后則對(duì)此標(biāo)簽做降權(quán)處理沐悦。


冷啟動(dòng)

每個(gè)內(nèi)容平臺(tái)在初期都會(huì)遇到這樣一個(gè)問題:巧婦難為無米之炊。新平臺(tái)總會(huì)遇到扎瓶,要么用戶行為或偏好數(shù)據(jù)過少所踊,要么內(nèi)容數(shù)量不足的情況。這時(shí)候應(yīng)該如何進(jìn)行內(nèi)容的推薦呢概荷?

  • 用戶首次使用時(shí),可以引導(dǎo)用戶進(jìn)行所感興趣的標(biāo)簽選擇碌燕,然后將該標(biāo)簽下的熱門內(nèi)容推薦給用戶误证;若用戶不選擇標(biāo)簽继薛,則可以采取全站熱門推薦或人工篩選推薦,將平臺(tái)中絕大部分用戶關(guān)心的內(nèi)容進(jìn)行推薦
  • 如果平臺(tái)中新內(nèi)容較多時(shí)愈捅,可以在推薦時(shí)選取部分新內(nèi)容進(jìn)行推薦遏考,每通過推薦增加一次閱讀,傳播度 +1蓝谨,若起傳播度高于某一預(yù)設(shè)的閾值時(shí)灌具,可以認(rèn)為該新內(nèi)容值得推薦,更多進(jìn)行曝光譬巫。這種方式可以解決新內(nèi)容的冷啟動(dòng)咖楣,也可以增加新內(nèi)容的曝光量。

推薦方式

首先預(yù)設(shè)一個(gè)推薦的目標(biāo):將較新的芦昔、優(yōu)質(zhì)的诱贿、用戶可能感興趣的內(nèi)容推薦給用戶,會(huì)涉及到以下三個(gè)維度:

  • 新(timescore) —— 反映內(nèi)容的實(shí)時(shí)性(用戶無關(guān))
  • 優(yōu)(qualityscore) —— 反映內(nèi)容的質(zhì)量(用戶無關(guān))
  • 興趣(interestscore) —— 用戶的個(gè)性化需求(用戶相關(guān))

關(guān)鍵節(jié)點(diǎn)

  1. 計(jì)算時(shí)間衰減得分:時(shí)間越新咕缎,得分越高珠十。參考函數(shù):1/log(a*x+10, 10),其中 x 為發(fā)表日期與當(dāng)前日期的時(shí)間差凭豪,a 為常量焙蹭。
  2. 計(jì)算內(nèi)容質(zhì)量得分:綜合內(nèi)容的閱讀、點(diǎn)贊嫂伞、收藏等維度計(jì)算得出孔厉。參考函數(shù):sum(c/(1+exp(-(x-a)/b))),其中 x 為影響因素的數(shù)值末早,a 為該因素的均值烟馅,c 為影響因素的權(quán)重,b 為常量然磷。
  3. 計(jì)算影響用戶興趣的因素
  4. 去重:已推薦給用戶的內(nèi)容應(yīng)從推薦列表中移除郑趁。
  5. 控制數(shù)量:一次推薦給用戶的數(shù)量不宜過多,可從某一數(shù)量開始逐漸遞增或遞減姿搜。
  6. 控制邊界:在極端情況下寡润,會(huì)出現(xiàn)完全無內(nèi)容推薦或推薦內(nèi)容被消費(fèi)完全,這種情況下應(yīng)允許不進(jìn)行推薦舅柜,而按照時(shí)間維度展示所有用戶關(guān)注標(biāo)簽的內(nèi)容梭纹。


    一般推薦路徑

其他注意點(diǎn)

1. 時(shí)效性內(nèi)容
對(duì)于與時(shí)間強(qiáng)相關(guān)的內(nèi)容,例如新聞或突發(fā)事件等致份,需要與普通的推薦內(nèi)容區(qū)分開变抽,做單獨(dú)的推薦通道。

2. 內(nèi)容排序
受順序效應(yīng)影響,在推薦時(shí)應(yīng)注意推薦內(nèi)容的排序绍载,和用戶最相關(guān)诡宗、質(zhì)量最高的內(nèi)容應(yīng)排在頂部。通常在有用戶信息的情況下击儡,可以將推薦出的內(nèi)容按和用戶相關(guān)度進(jìn)行排序塔沃;若沒有用戶信息時(shí),則可單獨(dú)依據(jù)內(nèi)容本身的質(zhì)量進(jìn)行排序阳谍。

3. 長(zhǎng)尾內(nèi)容
平臺(tái)里一般都會(huì)存在一些長(zhǎng)尾內(nèi)容蛀柴,這部分如果不進(jìn)行推薦,則很難觸達(dá)用戶矫夯。針對(duì)長(zhǎng)尾內(nèi)容鸽疾,可以在一定維度進(jìn)行統(tǒng)一提取后,當(dāng)做新內(nèi)容重新進(jìn)行推薦茧痒,但需注意時(shí)效性內(nèi)容不適合使用此方法肮韧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市旺订,隨后出現(xiàn)的幾起案子弄企,更是在濱河造成了極大的恐慌,老刑警劉巖区拳,帶你破解...
    沈念sama閱讀 206,602評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拘领,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡樱调,警方通過查閱死者的電腦和手機(jī)约素,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來笆凌,“玉大人圣猎,你說我怎么就攤上這事∑蚨” “怎么了送悔?”我有些...
    開封第一講書人閱讀 152,878評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)爪模。 經(jīng)常有香客問我欠啤,道長(zhǎng)薯鼠,這世上最難降的妖魔是什么匈挖? 我笑而不...
    開封第一講書人閱讀 55,306評(píng)論 1 279
  • 正文 為了忘掉前任扒最,我火速辦了婚禮记焊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘浸剩。我一直安慰自己年碘,他們只是感情好嘶伟,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評(píng)論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著纽疟,像睡著了一般罐韩。 火紅的嫁衣襯著肌膚如雪憾赁。 梳的紋絲不亂的頭發(fā)上污朽,一...
    開封第一講書人閱讀 49,071評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音龙考,去河邊找鬼蟆肆。 笑死,一個(gè)胖子當(dāng)著我的面吹牛晦款,可吹牛的內(nèi)容都是我干的炎功。 我是一名探鬼主播,決...
    沈念sama閱讀 38,382評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼缓溅,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼蛇损!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起坛怪,我...
    開封第一講書人閱讀 37,006評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤淤齐,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后袜匿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體更啄,經(jīng)...
    沈念sama閱讀 43,512評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評(píng)論 2 325
  • 正文 我和宋清朗相戀三年居灯,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了祭务。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,094評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡怪嫌,死狀恐怖义锥,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情岩灭,我是刑警寧澤拌倍,帶...
    沈念sama閱讀 33,732評(píng)論 4 323
  • 正文 年R本政府宣布,位于F島的核電站川背,受9級(jí)特大地震影響贰拿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜熄云,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評(píng)論 3 307
  • 文/蒙蒙 一膨更、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧缴允,春花似錦荚守、人聲如沸珍德。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)锈候。三九已至,卻和暖如春敞贡,著一層夾襖步出監(jiān)牢的瞬間泵琳,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工誊役, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留获列,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,536評(píng)論 2 354
  • 正文 我出身青樓蛔垢,卻偏偏與公主長(zhǎng)得像击孩,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子鹏漆,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容