## 機器學習評估系統(tǒng)
機器學習(ML),自然語言處理(NLP),信息檢索(IR)等領(lǐng)域,評估(Evaluation)是一個必要的工作,而其評價指標往往有如下幾點:準確率(Accuracy),精確率(Precision),召回率(Recall)和F1-Measure。
|? ? ? | 正類(positive)? ? | 負類(negative)? ? |
| :---- | ------------------ | ----------------- |
| True? | TP? ? ? ? ? ? ? ? | TN? ? ? ? ? ? ? ? |
| False | FP(Type I Error) | FN(Type II Error) |
精確率(Precision):Precision is the number of document retrieved that are relevant
$$
P=\frac{TP}{TP+FP}
$$
所有被劃分為正樣本中正確的比例翻诉。高精確率意味著分類中垃圾很少。
召回率(recall):Recall is the number of relevant document that are retrieved.
$$
R=\frac{TP}{TP+FN}
$$
所有的正樣本中被正確分類所占的比例舒岸,高召回率意味著很少有相關(guān)的數(shù)據(jù)被遺漏芦圾。
F1-measure :F1值就是精確值和召回率的調(diào)和均值
$$
\frac{1}{F1}=\frac{1}{P}+\frac{1}{R}
$$
data:image/s3,"s3://crabby-images/1fa75/1fa758a82cf738b84fb5fc10a628df45ecbcd534" alt=""
[1]https://towardsdatascience.com/model-evaluation-i-precision-and-recall-166ddb257c7b
[2]https://blog.argcv.com/articles/1036.c