想必都清楚為什么存在訓(xùn)練集和測(cè)試集.所以下面就是關(guān)于驗(yàn)證集存在的理由.
以線性回歸為例(關(guān)于theta,lambda這些參數(shù)的含義參照Ng的視頻):
通過訓(xùn)練集得到的theta值符合代價(jià)函數(shù)的最小值,但是這很可能存在過擬合的情況,所以這個(gè)時(shí)候就需要類似于lambda參數(shù)進(jìn)行正則化,那么lambda參數(shù)就需要一個(gè)一個(gè)去試,比如說1,2,4,8,16...試了之后呢,怎么評(píng)判哪個(gè)lambda好,哪個(gè)不好呢,這個(gè)時(shí)候就需要驗(yàn)證集了.
總而言之,就是將theta和lambda等參數(shù)一組一組帶入訓(xùn)練集中訓(xùn)練,得到結(jié)果交給驗(yàn)證集,由驗(yàn)證集得到最好的參數(shù)是哪一組,最后再交給測(cè)試集測(cè)試.