轉(zhuǎn)自http://blog.csdn.net/gagalaha/article/details/51327083
在模式識別中芹扭,我們經(jīng)常會使用到一些指標(biāo)對目標(biāo)識別或者影像分類的結(jié)果進行評價亲铡。
假設(shè)我們需要將一個樣本集分類為蘋果和非蘋果兩類聘萨,那么分類結(jié)果有四種情況:
第一種情況:True Positive,本來就是蘋果被分類成蘋果梁厉;
第二種情況:False Positive咬荷,本來不是蘋果被分類成蘋果刽射;
第三種情況:False Negative,本來是蘋果被分類成非蘋果补鼻;
第四種情況:True Negative哄啄,本來不是蘋果被分類成為非蘋果。
True是指分類正確风范,F(xiàn)alse是指分類錯誤咨跌。
Positive是指被分類器分為蘋果(正樣本),Negative是指被分類器分為非蘋果(負(fù)樣本)硼婿。
這里我們引入三個指標(biāo)來對分類器進行評價:
(1)準(zhǔn)確率(Precision)锌半,又稱“精度”、“正確率”寇漫;
(2)召回率(Recall)刊殉,又稱“查全率”;
(3)F1-Score州胳,準(zhǔn)確率和召回率的綜合指標(biāo)记焊。
三個指標(biāo)的定義如下:
一般來說,準(zhǔn)確率和召回率反映了分類器性能的兩個方面栓撞,單一依靠某個指標(biāo)并不能較為全面地評價一個分類器的性能遍膜。
假如分類器只將蘋果特征十分明顯碗硬、是蘋果的概率非常高的樣本分為蘋果,其余的樣本分為非蘋果瓢颅,此時該分類器的準(zhǔn)確率就會非常的高恩尾,但是它因為將所有疑似蘋果都錯誤分為非蘋果,召回率變得非常低惜索。
假如分類器將所有可能為蘋果的樣本全部劃分為蘋果特笋,其余的樣本為非蘋果,此時該分類器的召回率會非常之高巾兆,但是它因為將所有可能為蘋果的樣本分為蘋果時引入了許多錯誤猎物,準(zhǔn)確率不可能高。
引入F1-Score作為綜合指標(biāo)角塑,就是為了平衡準(zhǔn)確率和召回率的影響蔫磨,較為全面地評價一個分類器。
有時候考慮到不同的需求圃伶,可能會更看重準(zhǔn)確率或者召回率堤如。這時我們可以引入F2-Score和F0.5-Score。包括F1-Score窒朋,這三個指標(biāo)都來自以下定義搀罢,只是參數(shù)不同。
其中侥猩,F(xiàn)1-Score是指準(zhǔn)確率和召回率一樣重要榔至;
F2-Score是指召回率比準(zhǔn)確率重要一倍;
F0.5-Score是指準(zhǔn)確率比召回率重要一倍欺劳。