熱門內(nèi)容對任何網(wǎng)站都很重要,對社交網(wǎng)站更為重要。如何讓用戶第一眼就看到感興趣的內(nèi)容而留下來烤礁,正是各種排名算法的任務。
設計一個好的排名算法抓歼,需要考慮的因素很多败富,其中最重要的是以下兩點:
- 社區(qū)屬性及內(nèi)容屬性
- 網(wǎng)站本身內(nèi)容的量級與更新頻率
前者決定采用何種排名算法悔醋,后者確定排名的上升與下降速度。
影響因素
社區(qū)屬性及內(nèi)容屬性
社交網(wǎng)站產(chǎn)生許多用戶上傳的內(nèi)容兽叮,對這些內(nèi)容進行排名時篙顺,需要考慮內(nèi)容本身的信息。
從類型上充择,UGC內(nèi)容主要是圖片德玫、文章、音頻還是視頻椎麦?一般來說宰僧,圖片掃一眼,文章讀一遍观挎,音頻聽一次琴儿,視頻看一遍,占用用戶的時間依次增加,留住用戶的成本也隨之增加。
從特征上嘁捷,單圖或多圖造成?段子還是長文?一首歌還是一集Podcast雄嚣?短視頻還是長視頻晒屎?越復雜的形式,用戶付出的時間成本越大缓升。
用戶付出了時間鼓鲁,那么會要求回報。網(wǎng)站回報用戶的東西港谊,無外乎興趣和價值骇吭。而興趣和價值,是兩條不同方向的岔路歧寺,通向不同的排名算法燥狰。
網(wǎng)站本身內(nèi)容的量級與更新頻率
內(nèi)容的量級棘脐,像大象與螞蟻,體量越大龙致,系統(tǒng)越復雜荆残。從海量內(nèi)容中挑選出熱門內(nèi)容,需要更多的參數(shù)和指標净当。
更新頻率内斯,像流水線與手工作坊,頻率越快像啼,產(chǎn)出越多俘闯。新內(nèi)容產(chǎn)生出來后,排名需要很快地上升忽冻,才能排到前列真朗,引起注意;舊內(nèi)容存在一段時間后僧诚,排名需要很快地下降遮婶,才能讓位給新內(nèi)容。
所以湖笨,需要根據(jù)網(wǎng)站本身的內(nèi)容旗扑,確定排名算法需要考慮的參數(shù),以及確定參數(shù)的取值慈省。
興趣與價值
用戶留下來臀防,無外乎幾種情況:這個東西很有趣(有趣型),或這個東西對我有用(有用型)边败,或者兼而有之袱衷。
有趣的東西,用戶第一眼看到就喜歡笑窜,但內(nèi)容本身沒有收藏價值致燥。用戶的態(tài)度是:見之我喜,不見也有其它東西讓我喜排截。例如各種段子嫌蚤、笑話、gif圖等匾寝。
有用的內(nèi)容搬葬,用戶看后念念不忘荷腊,收藏以備以后查看艳悔、回味與參考。例如旅游攻略女仰、喜歡的文章猜年、好聽的歌曲等抡锈。
排名如何上升
新內(nèi)容一產(chǎn)生出來就具有上升趨勢。
用戶瀏覽乔外、like(點贊床三、頂,喜歡)杨幼、評論撇簿、高評分(星級),編輯推薦等差购,都會使排名上升四瘫。
有趣型的內(nèi)容,排名迅速上升欲逃,如病毒般地傳播開來找蜜。
有用型的內(nèi)容稳析,排名逐漸上升洗做,越到后來越多人知道它的價值。
排名如何下降
舊內(nèi)容漸漸呈現(xiàn)下降趨勢诚纸。
少有訪問、dislike(討厭陈惰、踩咬清,反對)、低評分(星級)奴潘、編輯降權旧烧,都會使排名下降。
有趣型的內(nèi)容画髓,排名維持了一段新鮮期后掘剪,大部分用戶就失去興趣了。
有用型的內(nèi)容夺谁,排名雖然下降了,但其價值還在肉微,還會不斷有人關注匾鸥。
沒有銀彈
知名博主阮一峰發(fā)表了6篇基于用戶投票的排名算法的系列文章碉纳。這6篇文章剖析了幾個網(wǎng)站的排名算法勿负。
如Delicious采用"過去60分鐘內(nèi)被收藏的次數(shù)"進行排名。每過60分鐘劳曹,就統(tǒng)計一次奴愉。它的上升和下降趨勢就是階梯函數(shù)式的琅摩。
Hacker News采用票數(shù)計算排名,并考慮時間因素锭硼,分數(shù)隨著時間逐漸減小房资。看下降曲線檀头,Hacker News屬于有趣型的網(wǎng)站(用戶當然可以獲得價值轰异,這里指排名算法的類型)。
Stack Overflow屬于有用型的網(wǎng)站暑始。一個問題提出后溉浙,需要網(wǎng)友的回答、對答案投贊成或反對票蒋荚、評論戳稽。這些內(nèi)容的完善都需要時間。所以期升,隨著時間的推移惊奇,一些問題和答案的價值開始慢慢顯露,當你搜索時播赁,Statck Overflow就會給你展示最有用的內(nèi)容颂郎。
redit也屬于有趣型的網(wǎng)站。它的時間因素占主導容为,就是說任何人發(fā)的新內(nèi)容都比較容易靠前乓序;排名算法中利用了贊成票與反對票的差額,說明有爭議(很多人贊成坎背,同時很多人反對)的內(nèi)容替劈,排名靠后;很多人贊成得滤,很少人反對的內(nèi)容陨献,排名靠前。阮一峰得出結論:
這決定了Reddit是一個符合大眾口味的社區(qū)懂更,不是一個很激進眨业、可以展示少數(shù)派想法的地方。
這也說明了沮协,沒有銀彈龄捡,要建設什么樣的社區(qū),就要采用能體現(xiàn)社區(qū)特征的排名算法慷暂。
博客鏈接
http://spetacular.github.io/2016/02/15/sns-hot-feed-ranking-algorithm.html