機(jī)器學(xué)習(xí)中的訓(xùn)練集 驗(yàn)證集 測(cè)試集的關(guān)系

技術(shù)交流QQ群:1027579432丈攒,歡迎你的加入已旧!

1.劃分測(cè)試集目的

  • 為了了解一個(gè)模型對(duì)新樣本的泛化能力嫂便,唯一的辦法是:讓已經(jīng)訓(xùn)練好的模型真正的處理新的樣本念赶。
  • 解決方法: 將原始數(shù)據(jù)劃分成兩個(gè)部分:訓(xùn)練集 測(cè)試集拗盒〔澜撸可以使用訓(xùn)練集來(lái)訓(xùn)練模型,然后用測(cè)試集來(lái)測(cè)試模型陡蝇。通過(guò)測(cè)試集來(lái)評(píng)估模型痊臭,可以了解模型的泛化誤差。
  • 如果訓(xùn)練誤差很低登夫,但是泛化誤差很高广匙,說(shuō)明模型對(duì)于訓(xùn)練數(shù)據(jù)已經(jīng)過(guò)擬合了。
  • 一般將原始數(shù)據(jù)集劃分為70%的訓(xùn)練集恼策,30%的測(cè)試集合鸦致。

2.劃分驗(yàn)證集目的

  • 現(xiàn)在有兩個(gè)模型(例如:線性模型和多項(xiàng)式模型)都可以解決同一個(gè)實(shí)際問(wèn)題,你正在由于猶豫不決。如何作出判斷:訓(xùn)練出兩個(gè)模型蹋凝,然后對(duì)比它們對(duì)測(cè)試數(shù)據(jù)的泛化能力鲁纠。假設(shè)線性模型的泛化能力更強(qiáng),但為了避免模型過(guò)擬合鳍寂,有必須設(shè)置正則化超參數(shù)改含。如何選擇出最佳的正則化超參數(shù)的值呢?做法之一是使用100個(gè)不同的超參數(shù)值來(lái)訓(xùn)練100個(gè)不同的模型迄汛,假設(shè)已經(jīng)找出最佳的超參數(shù)值捍壤,它生成的模型的泛化誤差最小。使用此模型運(yùn)行在實(shí)際生產(chǎn)環(huán)境中鞍爱,并沒(méi)有達(dá)到預(yù)期的精度鹃觉。這是由于在你對(duì)測(cè)試集的泛化誤差進(jìn)行了多次測(cè)量來(lái)調(diào)整模型和超參數(shù)時(shí),擬合出的模型只對(duì)測(cè)試集是最佳參數(shù)睹逃,對(duì)新的數(shù)據(jù)不太有可能有好的表現(xiàn)盗扇。
  • 解決方法:單獨(dú)從原始數(shù)據(jù)中劃分出一個(gè)保留的集合即驗(yàn)證集。在訓(xùn)練集上沉填,使用不同的超參數(shù)訓(xùn)練多個(gè)模型疗隶,然后通過(guò)驗(yàn)證集,選擇出最好的那個(gè)模型和對(duì)應(yīng)的超參數(shù)翼闹。最后再運(yùn)行一遍測(cè)試集斑鼻,得到泛化誤差的估計(jì)值。
  • 實(shí)際中猎荠,為了避免浪費(fèi)太多的訓(xùn)練數(shù)據(jù)坚弱,采用交叉驗(yàn)證。將訓(xùn)練集劃分為若干個(gè)互補(bǔ)的子集关摇,然后每個(gè)模型都通過(guò)這些子集的不同組合來(lái)進(jìn)行訓(xùn)練荒叶,之后用剩余的子集來(lái)進(jìn)行驗(yàn)證。一旦模型和超參數(shù)都確定输虱,最終的模型會(huì)帶著這些超參數(shù)對(duì)整個(gè)訓(xùn)練集進(jìn)行一次訓(xùn)練停撞,最后用測(cè)試集來(lái)測(cè)量泛化誤差。
  • 一般劃分規(guī)則: 60%訓(xùn)練集數(shù)據(jù)悼瓮,20%驗(yàn)證集數(shù)據(jù), 20%測(cè)試集數(shù)據(jù)

3.K折交叉驗(yàn)證

  • 將可用數(shù)據(jù)劃分為K個(gè)分區(qū)(K通常為4或5),實(shí)例化K個(gè)相同的模型戈毒,將每個(gè)模型在K-1個(gè)分區(qū)上訓(xùn)練,并在剩下的一個(gè)分區(qū)上進(jìn)行評(píng)估横堡,模型的驗(yàn)證分?jǐn)?shù)等于K個(gè)驗(yàn)證分?jǐn)?shù)的平均值埋市。

4.訓(xùn)練集 驗(yàn)證集 測(cè)試集使用

  • 在訓(xùn)練集上訓(xùn)練模型,在驗(yàn)證集上評(píng)估模型命贴,一旦找到最佳參數(shù)道宅,就在測(cè)試集上最后測(cè)試一次食听。

5.多分類(lèi)與多標(biāo)簽分類(lèi)區(qū)別

  • 多分類(lèi):每個(gè)樣本都應(yīng)被劃分到兩個(gè)以上的類(lèi)別上,例如MNIST手寫(xiě)數(shù)字體分類(lèi)
  • 多標(biāo)簽分類(lèi):每個(gè)輸入樣本可以被分配到多個(gè)標(biāo)簽污茵。例如一幅圖像中既有貓又有狗樱报,那么應(yīng)該同時(shí)標(biāo)注“貓”和“狗”的標(biāo)簽,每幅圖片的標(biāo)簽的個(gè)數(shù)通常是可變的泞当。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末迹蛤,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子襟士,更是在濱河造成了極大的恐慌盗飒,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,252評(píng)論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件陋桂,死亡現(xiàn)場(chǎng)離奇詭異逆趣,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)嗜历,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)宣渗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人梨州,你說(shuō)我怎么就攤上這事痕囱。” “怎么了摊唇?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,814評(píng)論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)涯鲁。 經(jīng)常有香客問(wèn)我巷查,道長(zhǎng),這世上最難降的妖魔是什么抹腿? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,869評(píng)論 1 299
  • 正文 為了忘掉前任岛请,我火速辦了婚禮,結(jié)果婚禮上警绩,老公的妹妹穿的比我還像新娘崇败。我一直安慰自己,他們只是感情好肩祥,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布后室。 她就那樣靜靜地躺著,像睡著了一般混狠。 火紅的嫁衣襯著肌膚如雪岸霹。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,475評(píng)論 1 312
  • 那天将饺,我揣著相機(jī)與錄音贡避,去河邊找鬼痛黎。 笑死,一個(gè)胖子當(dāng)著我的面吹牛刮吧,可吹牛的內(nèi)容都是我干的湖饱。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼杀捻,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼井厌!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起水醋,我...
    開(kāi)封第一講書(shū)人閱讀 39,924評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤旗笔,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后拄踪,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蝇恶,經(jīng)...
    沈念sama閱讀 46,469評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評(píng)論 3 342
  • 正文 我和宋清朗相戀三年惶桐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了撮弧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,680評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡姚糊,死狀恐怖贿衍,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情救恨,我是刑警寧澤贸辈,帶...
    沈念sama閱讀 36,362評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站肠槽,受9級(jí)特大地震影響擎淤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜秸仙,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評(píng)論 3 335
  • 文/蒙蒙 一嘴拢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧寂纪,春花似錦、人聲如沸捞蛋。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,519評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)拟杉。三九已至迈倍,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間捣域,已是汗流浹背啼染。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,621評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工宴合, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人迹鹅。 一個(gè)月前我還...
    沈念sama閱讀 49,099評(píng)論 3 378
  • 正文 我出身青樓卦洽,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親斜棚。 傳聞我的和親對(duì)象是個(gè)殘疾皇子阀蒂,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容