第一個字母T和F代表true和false晃虫,是形容詞。
第二個字母代表P和N陰性陽性扣墩,positive和negative哲银,是預測結果。
所以現在翻譯一下:
TP: true positive, 正確的陽性呻惕,說明預測是陽性荆责,而且預測對了,那么實際也是正例蟆融。
TN: true negative, 正確的陰性草巡,說明預測是陰性,而且預測對了型酥,那么實際也是負例山憨。
FP: false positive, 假陽性,說明預測是陽性弥喉,預測錯了郁竟,所以實際是負例。
FN: false negative, 假陰性由境,說明預測是陰性棚亩,預測錯了,所以實際是正例虏杰。
第一個字母表示你的預測值是否正確讥蟆,第二個字母表示你的預測值是什么。
評價指標:
1)正確率(accuracy)
正確率是我們最常見的評價指標纺阔,accuracy = (TP+TN)/(P+N)瘸彤,這個很容易理解,就是被分對的樣本數除以所有的樣本數笛钝,通常來說质况,正確率越高,分類器越好玻靡;
2)錯誤率(error rate)
錯誤率則與正確率相反结榄,描述被分類器錯分的比例,error rate = (FP+FN)/(P+N)囤捻,對某一個實例來說臼朗,分對與分錯是互斥事件,所以accuracy =1 - error rate;
3)靈敏度(sensitive)
sensitive = TP/P依溯,表示的是所有正例中被分對的比例老厌,衡量了分類器對正例的識別能力;
4)特效度(specificity)
specificity = TN/N黎炉,表示的是所有負例中被分對的比例枝秤,衡量了分類器對負例的識別能力;
5)精度(precision)
精度是精確性的度量慷嗜,表示被分為正例的示例中實際為正例的比例淀弹,precision=TP/(TP+FP);
6)召回率(recall)
召回率是覆蓋面的度量庆械,度量有多個正例被分為正例薇溃,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率與靈敏度是一樣的缭乘。