【轉(zhuǎn)載】信息檢索(IR)的評價指標介紹 – 準確率、召回率限书、F1虫蝶、mAP、ROC倦西、AUC

http://www.cnblogs.com/scnucs/archive/2012/10/10/2718497.html

在信息檢索秉扑、分類體系中,有一系列的指標调限,搞清楚這些指標對于評價檢索和分類性能非常重要,因此最近根據(jù)網(wǎng)友的博客做了一個匯總误澳。

準確率耻矮、召回率、F1

信息檢索忆谓、分類裆装、識別、翻譯等領(lǐng)域兩個最基本指標是?召回率(Recall Rate)?和?準確率(Precision Rate)?倡缠,召回率也叫查全率哨免,準確率也叫查準率,概念公式?:

召回率(?R?ecall)????? =? 系統(tǒng)檢索到的相關(guān)文件 / 系統(tǒng)所有相關(guān)的文件總數(shù)

準確率(?P?recision) = ?系統(tǒng)檢索到的相關(guān)文件 / 系統(tǒng)所有檢索到的文件總數(shù)

圖示表示如下:

?


注意:準確率和召回率是互相影響的昙沦,理想情況下肯定是做到兩者都高琢唾,但是一般情況下準確率高、召回率就低盾饮,召回率低采桃、準確率高,當然如果兩者都低丘损,那是什么地方出問題了?普办。一般情況,用不同的閥值徘钥,統(tǒng)計出一組不同閥值下的精確率和召回率衔蹲,如下圖:



如果是做搜索,那就是保證召回的情況下提升準確率呈础;如果做疾病監(jiān)測舆驶、反垃圾,則是保準確率的條件下而钞,提升召回贞远。

所以,在兩者都要求高的情況下笨忌,可以用F1來衡量蓝仲。


F1?=??2??*?P?*?R?/?(P?+?R)??


F1?=??2??*?P?*?R?/?(P?+?R)??


公式基本上就是這樣,但是如何算圖1中的A、B袱结、C亮隙、D呢??這需要人工標注垢夹,人工標注數(shù)據(jù)需要較多時間且枯燥溢吻,如果僅僅是做實驗可以用用現(xiàn)成的語料。當然果元,還有一個辦法促王,找個一個比較成熟的算法作為基準,用該算法的結(jié)果作為樣本來進行比照?而晒,這個方法也有點問題蝇狼,如果有現(xiàn)成的很好的算法,就不用再研究了倡怎。


AP和mAP(mean Average Precision)

mAP是為解決P迅耘,R,F(xiàn)-measure的單點值局限性的监署。為了得到 一個能夠反映全局性能的指標颤专,可以看考察下圖,其中兩條曲線(方塊點與圓點)分布對應(yīng)了兩個檢索系統(tǒng)的準確率-召回率曲線


可以看出钠乏,雖然兩個系統(tǒng)的性能曲線有所交疊但是以圓點標示的系統(tǒng)的性能在絕大多數(shù)情況下要遠好于用方塊標示的系統(tǒng)栖秕。

從中我們可以 發(fā)現(xiàn)一點,如果一個系統(tǒng)的性能較好晓避,其曲線應(yīng)當盡可能的向上突出累魔。

更加具體的,曲線與坐標軸之間的面積應(yīng)當越大够滑。

最理想的系統(tǒng)垦写, 其包含的面積應(yīng)當是1,而所有系統(tǒng)的包含的面積都應(yīng)當大于0彰触。這就是用以評價信息檢索系統(tǒng)的最常用性能指標梯投,平均準確率mAP其規(guī)范的定義如下:(其中P,R分別為準確率與召回率)


ROC和AUC

ROC和AUC是評價分類器的指標况毅,上面第一個圖的ABCD仍然使用分蓖,只是需要稍微變換。


回到ROC上來尔许,ROC的全名叫做Receiver Operating Characteristic么鹤。

ROC關(guān)注兩個指標

? ?True Positive Rate ( TPR ) ?= TP / [ TP + FN] ,TPR代表能將正例分對的概率

? ?False Positive Rate( FPR ) = FP / [ FP + TN] 味廊,F(xiàn)PR代表將負例錯分為正例的概率

在ROC 空間中蒸甜,每個點的橫坐標是FPR棠耕,縱坐標是TPR,這也就描繪了分類器在TP(真正的正例)和FP(錯誤的正例)間的trade-off柠新。ROC的主要分析工具是一個畫在ROC空間的曲線——ROC curve窍荧。我們知道,對于二值分類問題恨憎,實例的值往往是連續(xù)值蕊退,我們通過設(shè)定一個閾值,將實例分類到正類或者負類(比如大于閾值劃分為正類)憔恳。因此我們可以變化閾值瓤荔,根據(jù)不同的閾值進行分類,根據(jù)分類結(jié)果計算得到ROC空間中相應(yīng)的點钥组,連接這些點就形成ROC curve输硝。ROC curve經(jīng)過(0,0)(1,1),實際上(0, 0)和(1, 1)連線形成的ROC curve實際上代表的是一個隨機分類器者铜。一般情況下,這個曲線都應(yīng)該處于(0, 0)和(1, 1)連線的上方放椰。如圖所示作烟。

用ROC curve來表示分類器的performance很直觀好用±剑可是拿撩,人們總是希望能有一個數(shù)值來標志分類器的好壞。

于是?Area Under roc Curve(AUC)?就出現(xiàn)了如蚜。顧名思義压恒,AUC的值就是處于ROC curve下方的那部分面積的大小。通常错邦,AUC的值介于0.5到1.0之間探赫,較大的AUC代表了較好的Performance。

AUC計算工具:

http://mark.goadrich.com/programs/AUC/

P/R和ROC是兩個不同的評價指標和計算方式撬呢,一般情況下伦吠,檢索用前者,分類魂拦、識別等用后者毛仪。

參考鏈接:

http://www.vanjor.org/blog/2010/11/recall-precision/

http://bubblexc.com/y2011/148/

http://wenku.baidu.com/view/ef91f011cc7931b765ce15ec.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市芯勘,隨后出現(xiàn)的幾起案子箱靴,更是在濱河造成了極大的恐慌,老刑警劉巖荷愕,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件衡怀,死亡現(xiàn)場離奇詭異棍矛,居然都是意外死亡,警方通過查閱死者的電腦和手機狈癞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門茄靠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蝶桶,你說我怎么就攤上這事慨绳。” “怎么了真竖?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵脐雪,是天一觀的道長。 經(jīng)常有香客問我恢共,道長战秋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任讨韭,我火速辦了婚禮脂信,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘透硝。我一直安慰自己狰闪,他們只是感情好,可當我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布濒生。 她就那樣靜靜地躺著埋泵,像睡著了一般。 火紅的嫁衣襯著肌膚如雪罪治。 梳的紋絲不亂的頭發(fā)上丽声,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天,我揣著相機與錄音觉义,去河邊找鬼雁社。 笑死,一個胖子當著我的面吹牛晒骇,可吹牛的內(nèi)容都是我干的歧胁。 我是一名探鬼主播,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼厉碟,長吁一口氣:“原來是場噩夢啊……” “哼喊巍!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起箍鼓,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤崭参,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后款咖,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體何暮,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡奄喂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了海洼。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片跨新。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖坏逢,靈堂內(nèi)的尸體忽然破棺而出域帐,到底是詐尸還是另有隱情,我是刑警寧澤是整,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布肖揣,位于F島的核電站,受9級特大地震影響浮入,放射性物質(zhì)發(fā)生泄漏龙优。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一事秀、第九天 我趴在偏房一處隱蔽的房頂上張望彤断。 院中可真熱鬧,春花似錦易迹、人聲如沸宰衙。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽菩浙。三九已至巢掺,卻和暖如春句伶,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背陆淀。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工考余, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人轧苫。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓楚堤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親含懊。 傳聞我的和親對象是個殘疾皇子身冬,可洞房花燭夜當晚...
    茶點故事閱讀 42,916評論 2 344