書接上文:
之前為什么說自己浮躁峰伙?因為連最基本的機器學習模型性能評估最基本的的查全率和查準率都搞不清楚浸卦,還妄想搞機器學習缓醋。
今天如失,就來解決這個基礎問題。
通俗的理解
在二分問題的情況下(非對即錯送粱,非0即1):
查準率(Precision)就是你認為是對的樣例中褪贵,到底有多少真是對的。
查全率(Recall)就是所有對的樣例,你找出了多少脆丁,或者說你判斷對了多少世舰。
公式
總之,下面這個矩陣:
真實情況↓模型預測→ | True | False |
---|---|---|
True | TP | FN |
False | FP | TN |
囊括了所有樣例
其中槽卫,查準率Precision:
查全率:
簡單總結
一般來說跟压,查全查準不可兼得,除非在一些簡單任務中歼培。
很好理解震蒋,做出正預測多,查全率必然上升躲庄,但查準率就要下降查剖。
反之,盡量少預測噪窘,查準率必然高笋庄,但是查全率要低很多。
F1度量
F1度量是基于查準率和查全率的調(diào)和平均(harmonic mean)定義的:
相比于算術平均和幾何平均效览,調(diào)和平均更注重較小值无切。
度量
是加權調(diào)和平均,是F1度量的一般形式:
這個等有空再更新解釋丐枉。