機(jī)器學(xué)習(xí)中贩毕,常使用混淆矩陣來(lái)對(duì)分類模型的效果進(jìn)行衡量胆描,本文主要講述一下標(biāo)準(zhǔn)的二分類混淆矩陣與多分類混淆矩陣瞬雹、準(zhǔn)確率與精確率的區(qū)別悄晃。
混淆矩陣
real-P | real-N | |
---|---|---|
predict-P | TP | FP |
predict-N | FN | TN |
模型整體準(zhǔn)確率 = (TP + TN)/ (TP + FN + FP + TN) (1)
但需注意,準(zhǔn)確率并不足以反映分類模型的實(shí)際效果褥蚯,比如:預(yù)測(cè)一個(gè)人是否患病挚冤,假設(shè)實(shí)際中98%的人是健康人,2%的人是病人赞庶。若正例為病人训挡,預(yù)測(cè)混淆矩陣如下:
real-P | real-N | |
---|---|---|
predict-P | 0 | 0 |
predict-N | 2 | 98 |
則按照公式(1),整體準(zhǔn)確率 = 98%歧强。
但是顯而易見(jiàn)澜薄,該模型對(duì)一個(gè)人是否患病,并沒(méi)有任何預(yù)測(cè)能力誊锭。
為了解決此問(wèn)題表悬,需對(duì)單個(gè)類別進(jìn)行評(píng)估弥锄,指標(biāo)如下:
精確率 = TP / (TP + FP)
召回率 = TP / (TP + FN)
還是上表丧靡,對(duì)病人的預(yù)測(cè),精確率 和 召回率 均為0籽暇,因此温治,使用單個(gè)類別的 精確率 和 召回率 可以反映一個(gè)類別的真實(shí)效果。
多類別混淆矩陣
real-1 | real-2 | ...... | real-n | |
---|---|---|---|---|
predict-1 | 20 | 0 | ...... | 1 |
predict-2 | 2 | 90 | ...... | 0 |
...... | ...... | ...... | ...... | ...... |
predict-n | 0 | 0 | ...... | 80 |
注意:區(qū)分 準(zhǔn)確率 和 精確率