搜索排序MRR 扒寄,MAP ,NDCG比較

MRR:平均排名的倒數(shù)

MAP:平均精度均值

NDCG:標(biāo)準(zhǔn)化折扣累積收益

一拟烫、無(wú)排序的度量指標(biāo)

二该编、有排序意義的度量指標(biāo)

1:MRR

優(yōu)點(diǎn):該方法計(jì)算簡(jiǎn)單,解釋簡(jiǎn)單硕淑。

? ? ? ? ? ?這種方法高度關(guān)注列表的第一個(gè)相關(guān)元素课竣。它最適合有針對(duì)性的搜索嘉赎,比如用戶詢(xún)問(wèn)“對(duì)我來(lái)說(shuō)最好的東西”。

? ? ? ? ? ?適用于已知項(xiàng)目搜索稠氮,如導(dǎo)航查詢(xún)或?qū)ふ沂聦?shí)曹阔。

缺點(diǎn):MRR指標(biāo)不評(píng)估推薦項(xiàng)目列表的其余部分。它只關(guān)注列表中的第一個(gè)項(xiàng)目隔披。

? ? ? ? ? ?它給出一個(gè)只有一個(gè)相關(guān)物品的列表赃份。如果這是評(píng)估的目標(biāo),那找個(gè)度量指標(biāo)是可以的奢米。

? ? ? ? ? ?對(duì)于想要瀏覽相關(guān)物品列表的用戶來(lái)說(shuō)抓韩,這可能不是一個(gè)好的評(píng)估指標(biāo)。用戶的目標(biāo)可能是比較多個(gè)相關(guān)物品鬓长。


2:MAP

平均準(zhǔn)確率為每個(gè)查詢(xún)的相關(guān)排序結(jié)果賦予一個(gè)評(píng)價(jià)數(shù)字谒拴,將多個(gè)查詢(xún)的結(jié)果進(jìn)行平均。

兩個(gè)不同查詢(xún)?cè)谕慌判蛩惴ㄉ系恼倩芈屎蜏?zhǔn)去率

查詢(xún)1的平均準(zhǔn)確率=(1.0+0.67+0.5+0.44+0.5)/5=0.62

查詢(xún)2的平均準(zhǔn)確率=(0.5+0.4+0.43)/3=0.44

MAP=(0.62+0.44)/2=0.53

優(yōu)點(diǎn):給出了一個(gè)代表“精確度 - 召回率“”曲線下復(fù)雜區(qū)域的單一度量涉波。這提供了每個(gè)列表的平均精度英上。

? ? ? ? ? ?處理列表推薦物品的自然排序。這與將檢索項(xiàng)視為集合的度量標(biāo)準(zhǔn)形成了對(duì)比啤覆。

? ? ? ? ? ?這一指標(biāo)能夠給予發(fā)生在排序高的推薦名單中的錯(cuò)誤更多的權(quán)重苍日。相反,它對(duì)發(fā)生在推薦列表中較深位置的錯(cuò)誤的權(quán)重較小窗声。這符合在推薦列表的最前面顯示盡可能多的相關(guān)條目的需要相恃。

缺點(diǎn):這個(gè)度量標(biāo)準(zhǔn)適用于二進(jìn)制(相關(guān)/非相關(guān))評(píng)級(jí)。然而笨觅,它不適合細(xì)粒度的數(shù)字評(píng)級(jí)拦耐。此度量無(wú)法從此信息中提取誤差度量。

? ? ? ? ? ?對(duì)于細(xì)粒度的評(píng)分见剩,例如從1星到5星的評(píng)分杀糯,評(píng)估首先需要對(duì)評(píng)分進(jìn)行閾值,以產(chǎn)生二元相關(guān)性苍苞。一種選擇是只考慮大于4的評(píng)級(jí)固翰。由于人工閾值的存在,這在評(píng)估度量中引入了偏差柒啤。此外倦挂,我們正在丟棄那些精細(xì)的信息。這個(gè)信息是在4星和5星之間的差異評(píng)級(jí)担巩,以及在不相關(guān)的項(xiàng)目的信息方援。1星評(píng)級(jí)真的和3星評(píng)級(jí)一樣嗎?為了解決這些問(wèn)題涛癌,recsys社區(qū)提出了另一個(gè)更近期的度量標(biāo)準(zhǔn)犯戏。這個(gè)度量考慮了評(píng)級(jí)中包含的細(xì)粒度信息送火。讓我們看一看NDCG度量。


3:NDCG

優(yōu)點(diǎn):NDCG的主要優(yōu)勢(shì)是它考慮到了分等級(jí)的相關(guān)性值先匪。當(dāng)它們?cè)跀?shù)據(jù)集中可用時(shí)种吸,NDCG是一個(gè)很好的選擇鸳址。

? ? ? ? ? ?與MAP度量相比吃型,它在評(píng)估排名項(xiàng)目的位置方面做得很好。它適用于二元的相關(guān)/非相關(guān)場(chǎng)景尸昧。

? ? ? ? ? ?平滑的對(duì)數(shù)折現(xiàn)因子有一個(gè)很好的理論基礎(chǔ)岸裙,該工作的作者表明猖败,對(duì)于每一對(duì)顯著不同的排名推薦系統(tǒng),NDCG度量始終能夠確定更好的一個(gè)降允。

缺點(diǎn):NDCG在部分反饋方面有一些問(wèn)題恩闻。當(dāng)我們有不完整的評(píng)級(jí)時(shí),就會(huì)發(fā)生這種情況剧董。這是大多數(shù)推薦系統(tǒng)的情況幢尚。如果我們有完整的評(píng)級(jí),就沒(méi)有真正的任務(wù)去實(shí)現(xiàn)翅楼!在這種情況下尉剩,recsys系統(tǒng)所有者需要決定如何歸罪于缺失的評(píng)級(jí)。將缺少的值設(shè)置為0將把它們標(biāo)記為不相關(guān)的項(xiàng)犁嗅。其他計(jì)算值(如用戶的平均/中值)也可以幫助解決這個(gè)缺點(diǎn)边涕。

? ? ? ? ? ?接下來(lái)晤碘,用戶需要手動(dòng)處理IDCG等于0的情況褂微。當(dāng)用戶沒(méi)有相關(guān)文檔時(shí),就會(huì)發(fā)生這種情況园爷。這里的一個(gè)策略是也將NDCG設(shè)置為0宠蚂。

? ? ? ? ? ?另一個(gè)問(wèn)題是處理NDCG@K。recsys系統(tǒng)返回的排序列表的大小可以小于k童社。為了處理這個(gè)問(wèn)題求厕,我們可以考慮固定大小的結(jié)果集,并用最小分?jǐn)?shù)填充較小的集合扰楼。


參考資料:

《搜索引擎-信息檢索實(shí)踐》?|? W.Bruce Croft? ?Donald Metzler? ?Trevor Strohman

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末呀癣,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子弦赖,更是在濱河造成了極大的恐慌项栏,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蹬竖,死亡現(xiàn)場(chǎng)離奇詭異沼沈,居然都是意外死亡流酬,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)列另,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)芽腾,“玉大人,你說(shuō)我怎么就攤上這事页衙√希” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵店乐,是天一觀的道長(zhǎng)惭载。 經(jīng)常有香客問(wèn)我,道長(zhǎng)响巢,這世上最難降的妖魔是什么描滔? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮踪古,結(jié)果婚禮上含长,老公的妹妹穿的比我還像新娘。我一直安慰自己伏穆,他們只是感情好拘泞,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著枕扫,像睡著了一般陪腌。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上烟瞧,一...
    開(kāi)封第一講書(shū)人閱讀 51,482評(píng)論 1 302
  • 那天诗鸭,我揣著相機(jī)與錄音,去河邊找鬼参滴。 笑死强岸,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的砾赔。 我是一名探鬼主播蝌箍,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼暴心!你這毒婦竟也來(lái)了妓盲?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤专普,失蹤者是張志新(化名)和其女友劉穎悯衬,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體脆诉,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡甚亭,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年贷币,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片亏狰。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡役纹,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出暇唾,到底是詐尸還是另有隱情促脉,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布策州,位于F島的核電站瘸味,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏够挂。R本人自食惡果不足惜旁仿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望孽糖。 院中可真熱鬧枯冈,春花似錦、人聲如沸办悟。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)病蛉。三九已至炫加,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間铺然,已是汗流浹背俗孝。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留探熔,地道東北人驹针。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓烘挫,卻偏偏與公主長(zhǎng)得像诀艰,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子饮六,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容