在保留交叉驗(yàn)證(hand-out cross validation)中振坚,隨機(jī)將訓(xùn)練樣本集分成訓(xùn)練集(training set)和交叉驗(yàn)證集(cross validation set),比如分別占70%粥谬,30%不同。然后使用模型在訓(xùn)練集上學(xué)習(xí)得到假設(shè)荠列。最后使用交叉驗(yàn)證集對(duì)假設(shè)進(jìn)行驗(yàn)證,看預(yù)測(cè)的是否準(zhǔn)確,選擇具有誤差小的模型湿颅。
k折交叉驗(yàn)證(K-fold cross validation),就是把樣本集S分成k份唉侄,分別使用其中的(k-1)份作為訓(xùn)練集悠垛,剩下的1份作為交叉驗(yàn)證集线定,最后取最后的平均誤差,來評(píng)估這個(gè)模型确买。
留一法(leave one out斤讥, LOO)就是m-fold cross validation,m是樣本集的大小湾趾,就是只留下一個(gè)樣本來驗(yàn)證模型的準(zhǔn)確性芭商。
作者:Chown
鏈接:https://www.zhihu.com/question/39259296/answer/91866308
來源:知乎
交叉驗(yàn)證只能說用在模型的檢測(cè)上,但是不能用在產(chǎn)品測(cè)試(比如face++ sdk)搀缠,不能再折回訓(xùn)練模型铛楣。下圖是用seetaface 在lfw測(cè)試集上一次性測(cè)得的結(jié)果。這里包括了1037個(gè)域值艺普,其中第一個(gè)域值0.9簸州,第二個(gè)域值為0.6,可以說在域值大于0.5的條件下歧譬,正真率在假真率處于低位的情況下在0.6位置徘徊岸浑。