評(píng)估方法:
西瓜書里面的幾種方法:
1.留出法宗挥。
隨機(jī)劃分乌庶,拿大部分去訓(xùn)練,小部分去測試契耿。
存在的問題是劃分會(huì)導(dǎo)致訓(xùn)練和測試的分布與真實(shí)分布產(chǎn)生偏差瞒大,不同劃分可能對(duì)結(jié)果產(chǎn)生影響。
2.交叉驗(yàn)證法
多次劃分取評(píng)估的平均值搪桂。
特例:留1法透敌,k=m盯滚。當(dāng)m比較大時(shí),成本太高酗电。
3.自助法
在原樣本 ?D中有放回的采樣m次魄藕, 得到D',m為樣本的數(shù)目。采集到的樣本有些是重復(fù)的撵术,而有些采樣不到背率。約36.8%采不到。
性能度量
分類問題:錯(cuò)誤率嫩与、精度
查準(zhǔn)率(precision)和查全率(recall):
P-R 曲線
EPB(break-even point):查準(zhǔn)率=查全率
F1:2*P*R(P+R)=2*TP(ALL+TP-TN)寝姿。調(diào)和平均
Fbeta:加權(quán)調(diào)和平均
:
ROC. AUC
ROC: ? ?橫坐標(biāo): false postive rate』蹋縱坐標(biāo):true positive rate