一翁都、威爾遜算法
在互聯(lián)網(wǎng)內(nèi)容領(lǐng)域或者電商領(lǐng)域的策略相關(guān)同學(xué)搪桂,一定都聽過大名鼎鼎的威爾遜算法螃壤,但每當(dāng)不了解技術(shù)的同學(xué)們看到算法兩個字阅畴,就會望而生畏倡怎,其實這個算法背后的原理還是比較簡單的,但前提是你得動得基本的統(tǒng)計學(xué)基礎(chǔ)知識
? ? ? ? 威爾遜算法主要是基于用戶評價行為的排序算法贱枣,通俗的說就是大家覺得這個好监署,就會排到前面,是基于用戶選擇和評價行為的一種算法纽哥,所以要排序的東西钠乏,不管是文章、商品或者評論等等春塌,首先需要有用戶評價的功能晓避,即有好壞的投票數(shù)據(jù),才適合用這個算法只壳。
我們把一個回答下的每次贊踩都當(dāng)作試一次隨機(jī)試驗俏拱,則滿足如下條件
1、每次贊踩都是獨立的吕世,互不影響的
2彰触、用戶只有兩種選擇梯投,贊或者踩
3命辖、n次重復(fù)投票后,贊了k次分蓖,那么好評率就是k/n
以上三個條件剛好滿足二項分布尔艇,那么二項分布的P就是我們要的好評率,那么通過二項分布的相關(guān)計算么鹤,可以預(yù)測這個回答的好評率的置信區(qū)間终娃,選擇置信區(qū)間下線值作為回答的好評率 P,每個回答根據(jù)P的大小進(jìn)行排序蒸甜。這樣一來棠耕,排序的步驟就比較清晰了
第一步:計算每個回答的好評率p
第二步:計算每個回答的好評率的置信區(qū)間
第三部:根據(jù)置信區(qū)間的下限值余佛,進(jìn)行排名,這個值越大窍荧,排名越高
① 二項分布的p=k/n辉巡,好評率p=k/n? k為好評的次數(shù),n為評價的總次數(shù)
②二項分布的置信區(qū)間(未完待續(xù))
二項分布的置信區(qū)間有多種計算公式蕊退,最常見的是"正態(tài)區(qū)間"(Normal approximation interval)郊楣。但是,它只適用于樣本較多的情況(np > 5 且 n(1 ? p) > 5)瓤荔,對于小樣本净蚤,它的準(zhǔn)確性很差。因此我們采用Z檢驗输硝,?今瀑,其中
,
,則有
二腔丧、知乎策略
? ? ? ?知乎最核心的功能就是他的問答功能放椰,他是以生產(chǎn)者和消費者為核心的機(jī)制,如何讓消費者快速瀏覽沉迷到優(yōu)質(zhì)內(nèi)容中愉粤,如何讓生產(chǎn)者得到激勵持續(xù)玩下去砾医,是需要考慮的兩個重要的問題。這兩個問題是相輔相成的衣厘,好的內(nèi)容得到好的曝光如蚜,既滿足了消費者,也滿足了生產(chǎn)者的利益影暴,使得社區(qū)生態(tài)得到良性循環(huán)错邦,因此知乎的策略主旨就是“讓優(yōu)質(zhì)的內(nèi)容得到更多的曝光”。
那么如何讓回答優(yōu)質(zhì)并得到更多的曝光型宙,主要從兩個方面考慮1撬呢、優(yōu)質(zhì)內(nèi)容生產(chǎn)及篩選 2、曝光激勵手段妆兑,以下為主要的點魂拦,每個點可擴(kuò)展的運營 產(chǎn)品 及策略工作都可以有很多。
① 運營垂類專家大v的招募儲備(招募優(yōu)質(zhì)生產(chǎn)者 @運營)
② 策略精準(zhǔn)篩選優(yōu)質(zhì)內(nèi)容及用戶(主動發(fā)現(xiàn)優(yōu)質(zhì)生產(chǎn)者@策略pm)搁嗓,這塊主要有機(jī)器模型自動識別芯勘、用戶反饋行為篩選兩類。
?③ 單答案的rank曝光刺激腺逛、產(chǎn)生用戶互動激勵荷愕、激發(fā)優(yōu)質(zhì)用戶歸屬感認(rèn)同感(留住優(yōu)質(zhì)生產(chǎn)者,吸引瀏覽者轉(zhuǎn)化)
?④ 創(chuàng)造其他曝光推薦機(jī)會,如日報安疗、熱榜等(留住頭部優(yōu)質(zhì)生產(chǎn)者抛杨,吸引瀏覽者轉(zhuǎn)化)
?⑤? 給更多的權(quán)益,除了主要的曝光荐类,還可以分潤激勵蝶桶、平臺認(rèn)可等(刺激優(yōu)質(zhì)內(nèi)容生產(chǎn))
? ? ? ? 知乎的rank策略,框架圖如下掉冶,主要就是威爾遜得分真竖,知乎對于優(yōu)質(zhì)的回答的定義,不是提問者說了算厌小,也不是平臺說了算恢共,而是廣大瀏覽用戶說了算,所以采用威爾遜得分最合適