三者的區(qū)別
訓(xùn)練集(train set) —— 用于模型擬合的數(shù)據(jù)樣本。
驗(yàn)證集(development set)—— 是模型訓(xùn)練過(guò)程中單獨(dú)留出的樣本集稻励,它可以用于調(diào)整模型的超參數(shù)和用于對(duì)模型的能力進(jìn)行初步評(píng)估父阻。
在神經(jīng)網(wǎng)絡(luò)中, 我們用驗(yàn)證數(shù)據(jù)集去尋找最優(yōu)的網(wǎng)絡(luò)深度(number of hidden layers)望抽,或者決定反向傳播算法的停止點(diǎn)或者在神經(jīng)網(wǎng)絡(luò)中選擇隱藏層神經(jīng)元的數(shù)量加矛;
在普通的機(jī)器學(xué)習(xí)中常用的交叉驗(yàn)證(Cross Validation) 就是把訓(xùn)練數(shù)據(jù)集本身再細(xì)分成不同的驗(yàn)證數(shù)據(jù)集去訓(xùn)練模型。
測(cè)試集 —— 用來(lái)評(píng)估模最終模型的泛化能力煤篙。但不能作為調(diào)參斟览、選擇特征等算法相關(guān)的選擇的依據(jù)。
一個(gè)形象的比喻:
訓(xùn)練集-----------學(xué)生的課本辑奈;學(xué)生 根據(jù)課本里的內(nèi)容來(lái)掌握知識(shí)苛茂。
驗(yàn)證集------------作業(yè),通過(guò)作業(yè)可以知道 不同學(xué)生學(xué)習(xí)情況鸠窗、進(jìn)步的速度快慢妓羊。
測(cè)試集-----------考試,考的題是平常都沒(méi)有見(jiàn)過(guò)稍计,考察學(xué)生舉一反三的能力躁绸。
傳統(tǒng)上,一般三者切分的比例是:6:2:2臣嚣,驗(yàn)證集并不是必須的涨颜。