機器學(xué)習(xí) 模型評估中的 精確率势篡、召回率翩肌、F1、ROC禁悠、AUC

1 混淆矩陣

準(zhǔn)確率對于分類器的性能分析來說念祭,并不是一個很好地衡量指標(biāo),因為如果數(shù)據(jù)集不平衡(每一類的數(shù)據(jù)樣本數(shù)量相差太大)绷蹲,很可能會出現(xiàn)誤導(dǎo)性的結(jié)果棒卷。例如,如果在一個數(shù)據(jù)集中有95只貓祝钢,但是只有5條狗诅挑,那么某些分類器很可能偏向于將所有的樣本預(yù)測成貓棺滞。整體準(zhǔn)確率為95%,但是實際上該分類器對貓的識別率是100%,而對狗的識別率是0%扇雕。所以我們先引入一個概念腿椎,混淆矩陣 參考文檔思灌,我們直接看一個例子照激。

1.2 多分類的例子

假設(shè)有一個用來對貓(cats)、狗(dogs)铃拇、兔子(rabbits)進行分類的系統(tǒng)钞瀑,混淆矩陣就是為了進一步分析性能而對該算法測試結(jié)果做出的總結(jié)。假設(shè)總共有 27 只動物:8只貓慷荔, 6條狗雕什, 13只兔子。結(jié)果的混淆矩陣如下圖:


在這里插入圖片描述

在這個混淆矩陣中显晶,實際有 8只貓贷岸,但是系統(tǒng)將其中3只預(yù)測成了狗;對于 6條狗磷雇,其中有 1條被預(yù)測成了兔子偿警,2條被預(yù)測成了貓。從混淆矩陣中我們可以看出系統(tǒng)對于區(qū)分貓和狗存在一些問題唯笙,但是區(qū)分兔子和其他動物的效果還是不錯的螟蒸。所有正確的預(yù)測結(jié)果都在對角線上,所以從混淆矩陣中可以很方便直觀的看出哪里有錯誤崩掘,因為他們呈現(xiàn)在對角線外面七嫌。


混淆矩陣是用來總結(jié)一個分類器結(jié)果的矩陣。對于k元分類呢堰,其實它就是一個k x k的表格,用來記錄分類器的預(yù)測結(jié)果凡泣,對于最常見的二分類來說枉疼,它的混淆矩陣是2乘2的皮假。本次主要也是使用二分類來進行分析。

2.2 二分類的例子

我們先看一個圖


在這里插入圖片描述

再對比下我們的0-1預(yù)測:

預(yù)測值=1 預(yù)測值=0
真實值=1 True Positive(TP) False Negative(FN)
真實值=0 False Positive (FP) True Negative(TN)

各類定義:
真陽性(True Positive骂维,TP):樣本的真實類別是正例惹资,并且模型預(yù)測的結(jié)果也是正例
真陰性(True Negative,TN):樣本的真實類別是負(fù)例航闺,并且模型將其預(yù)測成為負(fù)例
假陽性(False Positive褪测,F(xiàn)P):樣本的真實類別是負(fù)例,但是模型將其預(yù)測成為正例
假陰性(False Negative潦刃,F(xiàn)N):樣本的真實類別是正例侮措,但是模型將其預(yù)測成為負(fù)例

混淆矩陣延伸出的各個評價指標(biāo):
準(zhǔn)確度(Accuracy) = (TP+TN) / (TP+TN+FN+TN)
正確率(Precision) = TP / (TP + FP)
真陽性率(True Positive Rate,TPR)乖杠,靈敏度(Sensitivity)分扎,召回率(Recall) = TP / (TP + FN)
真陰性率(True Negative Rate,TNR)胧洒,特異度(Specificity) = TN / (TN + FP)
假陰性率(False Negatice Rate畏吓,F(xiàn)NR),漏診率( = 1 - 靈敏度) = FN / (TP + FN) = 1 - TPR
假陽性率(False Positice Rate卫漫,F(xiàn)PR)菲饼,誤診率( = 1 - 特異度) = FP / (FP + TN) = 1 - TNR
F1-值(F1-score) = 2 * TP / (2 * TP+FP+FN)

2.3 二分類真實數(shù)值計算

預(yù)測值=1 預(yù)測值=0
真實值=1 5 2
真實值=0 4 4

在上面例子中各項評價指標(biāo)的計算

  1. 準(zhǔn)確度(Accuracy) = (TP+TN) / (TP+TN+FN+TN), 準(zhǔn)確度 = (5+4) / 15 = 0.6
  2. 正確率(Precision) = TP / (TP + FP)列赎,精度 = 5 / (5+4) = 0.556
  3. 真陽性率(True Positive Rate宏悦,TPR),靈敏度(Sensitivity)粥谬,召回率(Recall) = TP / (TP + FN)肛根, 召回 = 5 / (5+2) = 0.714
  4. 真陰性率(True Negative Rate,TNR)漏策,特異度(Specificity) = TN / (TN + FP)派哲, 特異度 = 4 / (4+2) = 0.667
  5. 假陰性率(False Negatice Rate,F(xiàn)NR)掺喻,漏診率( = 1 - 靈敏度) = FN / (TP + FN) = 1 - TPR芭届, 特異度 = 2 / (5+2) = 0.286
  6. 假陽性率(False Positice Rate,F(xiàn)PR)感耙,誤診率( = 1 - 特異度) = FP / (FP + TN) = 1 - TNR 特異度 = 2 / (4+2) = 0.333
  7. F1-值(F1-score) = 2 * TP / (2 * TP+FP+FN)褂乍, F1-值 = 2 * 5 / (2 * 5+4+2) = 0.625
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市即硼,隨后出現(xiàn)的幾起案子逃片,更是在濱河造成了極大的恐慌,老刑警劉巖只酥,帶你破解...
    沈念sama閱讀 219,110評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件褥实,死亡現(xiàn)場離奇詭異呀狼,居然都是意外死亡,警方通過查閱死者的電腦和手機损离,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評論 3 395
  • 文/潘曉璐 我一進店門哥艇,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人僻澎,你說我怎么就攤上這事貌踏。” “怎么了窟勃?”我有些...
    開封第一講書人閱讀 165,474評論 0 356
  • 文/不壞的土叔 我叫張陵祖乳,是天一觀的道長。 經(jīng)常有香客問我拳恋,道長凡资,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,881評論 1 295
  • 正文 為了忘掉前任谬运,我火速辦了婚禮隙赁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘梆暖。我一直安慰自己伞访,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,902評論 6 392
  • 文/花漫 我一把揭開白布轰驳。 她就那樣靜靜地躺著厚掷,像睡著了一般。 火紅的嫁衣襯著肌膚如雪级解。 梳的紋絲不亂的頭發(fā)上冒黑,一...
    開封第一講書人閱讀 51,698評論 1 305
  • 那天,我揣著相機與錄音勤哗,去河邊找鬼抡爹。 笑死,一個胖子當(dāng)著我的面吹牛芒划,可吹牛的內(nèi)容都是我干的冬竟。 我是一名探鬼主播,決...
    沈念sama閱讀 40,418評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼民逼,長吁一口氣:“原來是場噩夢啊……” “哼泵殴!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起拼苍,我...
    開封第一講書人閱讀 39,332評論 0 276
  • 序言:老撾萬榮一對情侶失蹤笑诅,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吆你,經(jīng)...
    沈念sama閱讀 45,796評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡同蜻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,968評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了早处。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,110評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡瘫析,死狀恐怖砌梆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情贬循,我是刑警寧澤咸包,帶...
    沈念sama閱讀 35,792評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站杖虾,受9級特大地震影響烂瘫,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜奇适,卻給世界環(huán)境...
    茶點故事閱讀 41,455評論 3 331
  • 文/蒙蒙 一坟比、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧嚷往,春花似錦葛账、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至贷祈,卻和暖如春趋急,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背势誊。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評論 1 272
  • 我被黑心中介騙來泰國打工呜达, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人键科。 一個月前我還...
    沈念sama閱讀 48,348評論 3 373
  • 正文 我出身青樓闻丑,卻偏偏與公主長得像,于是被迫代替她去往敵國和親勋颖。 傳聞我的和親對象是個殘疾皇子嗦嗡,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,047評論 2 355

推薦閱讀更多精彩內(nèi)容