機(jī)器學(xué)習(xí)中的評價指標(biāo)
簡要介紹精度、精確率钩述、召回率寨躁、P-R曲線、F1 值牙勘、TPR职恳、FPR、ROC方面、AUC等指標(biāo)放钦,還有在生物領(lǐng)域常用的敏感性、特異性指標(biāo)恭金。
基礎(chǔ)
在分類任務(wù)中操禀,各指標(biāo)的計算基礎(chǔ)都來自于對正負(fù)樣本的分類結(jié)果,用混淆矩陣表示為:
精度
- Accuracy
定義:(TP+TN)/(TP+FN+FP+TN)
即所有分類正確的樣本占全部樣本的比例
精確率
- Precision横腿、查準(zhǔn)率
定義:(TP)/(TP+FP)
即預(yù)測是正例的結(jié)果中颓屑,確實是正例的比例
召回率
- Recall斤寂、查全率
定義:(TP)/(TP+FN)
即所有正例的樣本中,被找出的比例
P-R曲線
- PRC
定義:根據(jù)預(yù)測結(jié)果將預(yù)測樣本排序揪惦,最有可能為正樣本的在前遍搞,最不可能的在后,依次將樣本預(yù)測為正樣本器腋,分別計算當(dāng)前的精確率和召回率溪猿,繪制P-R曲線。
F1 值
定義:(2 * P * R)/(P + R)
TPR
- 真正例率纫塌,與召回率相同
定義:(TP)/(TP+FN)
FPR
- 假正例率
定義:(FP)/(TN+FP)
ROC
- 受試者工作特征
定義:根據(jù)預(yù)測結(jié)果將預(yù)測樣本排序诊县,最有可能為正樣本的在前,最不可能的在后措左,依次將樣本預(yù)測為正樣本依痊,分別計算當(dāng)前的TPR和FPR,繪制ROC曲線媳荒。
AUC
- Area Under ROC Curve
定義:ROC曲線下的面積
敏感性
- sensitivity
定義:TP / (TP + FN)
即有部购贰(陽性)人群中,檢測出陽性的幾率钳枕。(檢測出確實有病的能力)
特異性
- specificity
定義:TN / (TN + FP)
即無病(陰性)人群中赏壹,檢測出陰性的幾率鱼炒。(檢測出確實沒病的能力)
參考資料
https://blog.csdn.net/b876144622/article/details/80009867
https://www.cnblogs.com/leezx/p/6105212.html