評分料仗、評星湾盗、投票是很多網(wǎng)站的標(biāo)配,比如淘寶的寶貝評價罢维、知乎的贊同淹仑。有些網(wǎng)站甚至以這些功能為生存根基,比如大眾點(diǎn)評肺孵、豆瓣等應(yīng)用匀借,用戶的打分、評論是它們的主要功能平窘,目的就是對不同對象進(jìn)行排序吓肋,從而為有需求的用戶提供決策依據(jù)。目前大多涉及打分瑰艘、投票的網(wǎng)站是鬼,所有參與用戶的權(quán)重都是一樣的。但這其實(shí)存在一些問題紫新。
一均蜜、存在問題
1.針對單一項目:由于偏好等主觀因素和專業(yè)性等客觀因素導(dǎo)致結(jié)果失真
以大眾點(diǎn)評為例,吃是一件很個性化的事情芒率,是完全基于主觀感受的囤耳,這就導(dǎo)致結(jié)果的參考性并不強(qiáng)。舉個例子,兩個人同時去吃泰國菜充择,對于喜歡這種酸辣口味的人來說德玫,會覺得這家餐廳很好吃,那么他在打分的時候就會偏高了打椎麦;而對于吃不慣泰式口味的人就會覺得這家店很難吃宰僧,打分的時候自然會往偏低了打。假設(shè)在短時間內(nèi)观挎,去這家泰國餐廳吃飯的人以吃不慣泰國菜的人居多琴儿,最后評分總體偏低,此時一個喜歡吃泰國菜的人在大眾點(diǎn)評上看見這家店評分太低就不去吃了键兜,但其實(shí)總的來說這家店的口味是中上水平的凤类,那這時候這個評分就會對用戶產(chǎn)生誤導(dǎo)作用。而這個誤導(dǎo)作用的根源就是因?yàn)闆]有對用戶進(jìn)行劃分普气,所有用戶的打分占比的權(quán)重是一樣的谜疤,沒有把其中真正有效的打分從眾多無效打分中區(qū)分出來。
通過劃分用戶屬性改變權(quán)重來增強(qiáng)結(jié)果的有效性
針對大眾點(diǎn)評而言现诀,我認(rèn)為合理的打分機(jī)制應(yīng)該是這樣的夷磕。首先對用戶的偏好口味和商家的口味都進(jìn)行標(biāo)簽化,然后當(dāng)用戶打分的時候仔沿,將用戶的偏好和商家的進(jìn)行匹配坐桩,再根據(jù)兩者的匹配度給用戶分配一定的權(quán)重。為什么這樣合理呢封锉?我舉一個有點(diǎn)極端的例子绵跷。原來的打分機(jī)制就好像一群身份完全不同的人,醫(yī)生成福、律師碾局、投資人、學(xué)生奴艾、家庭主婦净当、清潔工等等聚集在一起討論一個醫(yī)學(xué)問題,然后得出了一個平均答案蕴潦。而我說的這種投票機(jī)制也是同樣一群人像啼,不同的是我把其中的醫(yī)生區(qū)分出來,給他們賦予了更多的權(quán)利潭苞,在統(tǒng)計結(jié)果的時候主要參考他們的意見忽冻,然后再輔之以其他人群的意見。對兩種打分機(jī)制進(jìn)行比較此疹,顯然后者統(tǒng)計的結(jié)果更具參考意義甚颂。
歸根究底就是權(quán)重兩個字蜜猾。首先,劃分用戶身份振诬;然后,根據(jù)具體情況分配權(quán)重衍菱;最后赶么,計算出加權(quán)分。其實(shí)最根本的問題是如何區(qū)分用戶身份脊串。我前面提供了一種標(biāo)簽化的方法辫呻,根據(jù)一定的屬性來細(xì)化用戶身份。我設(shè)想的大眾點(diǎn)評打分機(jī)制其實(shí)就是根據(jù)兩者的共同點(diǎn)來匹配雙方琼锋。像知乎放闺,也有人提議對贊同根據(jù)專業(yè)領(lǐng)域進(jìn)行加權(quán)。比如中醫(yī)的討論缕坎,就應(yīng)該以醫(yī)界人士的意見為準(zhǔn)怖侦,那么學(xué)醫(yī)人士的一票贊同就應(yīng)該等于普通人的1.5票(1.5票只是舉例,沒有科學(xué)依據(jù))谜叹。
2.針對多個項目:由于參與人數(shù)差異導(dǎo)致的不可比較性
以電影點(diǎn)評網(wǎng)站為例匾寝,這里就有一個問題:熱門電影與冷門電影的平均得分,是否真的可比荷腊?舉例來說艳悔,一部好萊塢大片有10000個觀眾投票,一部小成本的文藝片只有100個觀眾投票女仰。這兩者的投票結(jié)果猜年,怎么比較?如何才能公平地反映出一部電影真正的質(zhì)量疾忍?
通過加權(quán)分來彌補(bǔ)差異
一個合理的思路是乔外,如果要比較兩部電影的好壞,至少應(yīng)該請同樣多的觀眾觀看和評分锭碳。既然文藝片的觀眾人數(shù)偏少袁稽,那么應(yīng)該設(shè)法為它增加一些觀眾。IMDB網(wǎng)站是目前互聯(lián)網(wǎng)上最為權(quán)威擒抛、系統(tǒng)推汽、全面的電影資料網(wǎng)站,它所特有的電影評分系統(tǒng)深受影迷的歡迎歧沪,注冊用戶可以給任何一部影片打分并加以評述歹撒,網(wǎng)站又會根據(jù)影片所得平均分、選票的數(shù)目等計算得出影片的加權(quán)平均分并以此進(jìn)行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行诊胞。
根據(jù)IMDB網(wǎng)站上公布的TOP250評分標(biāo)準(zhǔn)暖夭,IMDB top 250用的是貝葉斯統(tǒng)計的算法得出的加權(quán)分(Weighted Rank-WR)锹杈,公式如下:
WR = ( v/(v+m))×R + (m÷(v+m) )×C
(其中:R是用普通的方法計算出的平均分;v是參與投票的人數(shù)迈着;m是進(jìn)入IMDB top 250需要的最小票數(shù)竭望;C是目前所有電影的平均得分)
仔細(xì)研究這個公式,你會發(fā)現(xiàn)裕菠,IMDB為每部電影增加了m張選票咬清,并且這些選票的基本評分都為c。這樣做的原因是奴潘,假設(shè)所有電影都至少有m張選票旧烧,那么就都具備了進(jìn)入前250名的評選條件;然后假設(shè)這m張選票的評分是所有電影的平均得分画髓;最后掘剪,用現(xiàn)有的觀眾投票進(jìn)行修正,長期來看奈虾,v/(v+m)這部分的權(quán)重將越來越大夺谁,得分將慢慢接近真實(shí)情況。這樣做拉近了不同電影之間投票人數(shù)的差異愚墓,使得投票人數(shù)較少的電影也有可能排名前列予权。
二、權(quán)重是否違背了公平原則
無論打分還是投票浪册,我們都是秉著公平公正公開的原則扫腺,如果給一個人多一點(diǎn)權(quán)利,是不是就違背了公平村象?其實(shí)并不然笆环。什么是公平?我的老師曾這樣給我解釋厚者,真正的公平是躁劣,公交上所有的女性、兒童库菲、老人都有座位账忘,而不再這范圍之內(nèi)的男性都站著。我們并不是生而平等的熙宇。我所謂的生而不平等是指鳖擒,術(shù)業(yè)有專攻,在不同的專業(yè)領(lǐng)域我們這些業(yè)余的就是沒有專家的科學(xué)和權(quán)威烫止。那么如何突出他們的身份蒋荚,加權(quán)。因?yàn)橹挥羞@樣馆蠕,我們才能得出最精準(zhǔn)期升、最科學(xué)的結(jié)果惊奇。
三、加權(quán)的其他意義
1.區(qū)分核心用戶播赁,避免惡意打分/投票
下面再給大家分享一種付費(fèi)用戶權(quán)重大的例子颂郎。造作是一個C2B的家具電商平臺。在家具設(shè)計方面行拢,用戶通過投票參與設(shè)計祖秒。造作給出用戶使用場景、材料舟奠、解決方式等命題,設(shè)計師會給出設(shè)計方案房维,用戶進(jìn)行投票沼瘫,得票高的設(shè)計進(jìn)入后續(xù)生產(chǎn)。在投票過程中咙俩,造作會考慮到所有用戶的意見耿戚,但付費(fèi)用戶的權(quán)重更大。造作為什么要這樣做呢阿趁?在我看來膜蛔,造作是為了通過付費(fèi)這一行為,一方面使來篩選出平臺的核心用戶脖阵。用戶行為代表了他的消費(fèi)傾向和消費(fèi)潛力皂股。平臺可以把這些消費(fèi)傾向和消費(fèi)潛力直接和產(chǎn)品掛起鉤來,這會讓平臺的銷售顯得無比精準(zhǔn)命黔。另一方面呜呐,付費(fèi)用戶較高的權(quán)重可以從一定程度上彌補(bǔ)部分搗亂分子的亂投票、惡意打分悍募。我們不可能保證每一分每一票都是有效的蘑辑,只能通過某些手段盡量減少這些無效打分無效投票。
2.避免同票同分的尷尬場面
當(dāng)我們做決策的時候最害怕出現(xiàn)平局的現(xiàn)象坠宴,這往往使得我們陷入選擇困難或者重選的局面洋魂。那么在這種情況下,權(quán)重就發(fā)揮其作用了喜鼓。怎么理解呢副砍,舉一個通俗易懂的例子,玩過狼人殺的朋友都知道颠通,警長是擁有1.5票投票權(quán)的址晕,為什么呢?因?yàn)榘滋炱比说臅r候很有可能出現(xiàn)平票的情況顿锰,那就要進(jìn)行二次陳述谨垃、二次投票启搂,而第二次的投票結(jié)果說不定仍然是平票,陷入死循環(huán)刘陶。此時警長那多出來的0.5票就可以完美解決這個問題了胳赌。
以上純屬個人的一些小想法,歡迎大家指錯匙隔、討論疑苫。