模型評估與選擇

一、經(jīng)驗誤差與過擬合

  1. 誤差率
    分類錯誤的樣本數(shù)占樣本總數(shù)的比率寄摆。

  2. 精度
    分類正確的樣本數(shù)占總數(shù)的比率鸿竖。

  3. 誤差
    學習器的實際預測輸出與樣本的真實輸出之間的差異凄吏。

  4. 訓練誤差(經(jīng)驗誤差)
    學習器在訓練集上的誤差。

  5. 現(xiàn)狀
    很多情況下带污,可以學的一個經(jīng)驗誤差很小僵控、在訓練集上表現(xiàn)很好的學習器;甚至對訓練樣本的分類可以達到100%的準確鱼冀。

  6. 挑戰(zhàn)
    這樣的學習器在多數(shù)情況下并不好报破。

  7. 實際期望

  • 目標:讓學習器在新樣本上表現(xiàn)很好;
  • 方法:從訓練樣本中盡可能學出適用于所有潛在樣本的 “普遍規(guī)律” 千绪;
  1. 挑戰(zhàn):
  • 過擬合:把訓練樣本學得 “太好”充易,可能把訓練樣本本身的特性,當做所有潛在樣本都會具有的一般性質(zhì)荸型;導致性能下降盹靴;
  • 欠擬合:對訓練樣本的一般性質(zhì)尚未學好。
  1. 原因分析
  • 過擬合:學習能力過于強大瑞妇,把訓練樣本所包含的特性都學到了稿静;
  • 欠擬合:學習能力低下;
  1. 解決辦法:
  • 欠擬合(簡單):在決策樹學習中踪宠,擴展分支自赔;在神經(jīng)網(wǎng)絡(luò)學習中,增加訓練輪數(shù)柳琢;
  • 過擬合(復雜):是機器學習面臨的關(guān)鍵障礙绍妨,各類學校西算法都有針對過擬合的措施润脸,只能緩解,無法徹底避免他去;
    理解:機器學習面臨的問題毙驯,通常是NP難的,甚至更難灾测;而有效的學習算法必然是在多項式時間內(nèi)運行完成爆价,若可徹底避免過擬合,則通過經(jīng)驗誤差最小化就能獲得最優(yōu)解媳搪。這與 “P=NP” 矛盾铭段;只要相信 “P != NP”,那么過擬合不可避免秦爆;
  1. 挑戰(zhàn)
  • 挑戰(zhàn):對于同一個任務(wù)序愚,有多種學習算法可供選擇,同一個學習算法設(shè)置不同參數(shù)等限,也會得到不同的模型爸吮;
  • 存在的問題:選擇哪一個學習算法?選擇哪一種參數(shù)配置望门?
  1. 理想解決辦法
  • 對候選模型的泛化誤差進行評估形娇;
  • 選擇繁華誤差最小的那個模型。
  1. 現(xiàn)實挑戰(zhàn):
  • 無法直接獲得泛化誤差筹误;(潛在樣本未知)
  • 訓練誤差不適合作為標準桐早;(過擬合并不好)

二、評估方法

1. 現(xiàn)實中如何選擇學習算法和參數(shù)配置纫事?

可通過實驗測試來對學習器的泛化誤差進行評估勘畔,進而做出選擇。

2. 測試集
  • 作用:測試學習器對新樣本的判別能力丽惶,然后炫七,以測試集上的 “測試誤差” 作為泛化誤差的近似;
  • 獲得:通常假設(shè)測試樣本是從樣本真實分布中獨立同分布采樣獲得钾唬。
  • 注意:測試集應(yīng)該盡量與樣本集互斥万哪,也就是,樣本盡量不在訓練集中出現(xiàn)抡秆,未在訓練過程中使用過奕巍。
3. 原因

學校的學習鍛煉的是學生 “舉一反三” 的能力,不應(yīng)該出之前學過的題目儒士。

4. 獲得測試集和訓練集
  • 方法:對數(shù)據(jù)集進行適當?shù)奶幚淼闹梗瑥闹挟a(chǎn)生訓練集測試集
5. 獲取方法1:留出法

1)留出法
直接將數(shù)據(jù)劃分為兩個互斥的集合着撩,其中一個作為訓練集诅福,另一個作為測試集匾委。

用訓練集訓練出模型后,用測試集評估誤差氓润。

2)需要的性質(zhì)

  • 訓練集和測試集的劃分盡可能保持數(shù)據(jù)分布的一致性赂乐;
  • 避免因數(shù)據(jù)劃分過程引入額外的偏差,而對最終結(jié)果產(chǎn)生影響咖气;

3)使用方法
采用隨機劃分的方法挨措,重復進行實驗評估后,取平均值作為留出法的訓練結(jié)果崩溪。

4)比例問題
若訓練集太大浅役,則訓練處的模型接近了數(shù)據(jù)集的模型;若訓練集太小伶唯,那么担租,評估結(jié)果可能不夠精確。需要在二者之間做一個均衡抵怎;

  • 均衡:一般訓練集和測試集的比例:(2/3 - 4/5);
6. 交叉驗證法

1)原理

  • 將數(shù)據(jù)集 D 劃分為k個大小相似的互斥子集岭参,每個子集盡量保持數(shù)據(jù)分布的一致性反惕;
  • 從中選取 k-1 個子集作為訓練集,剩下一個子集作為測試集演侯;
  • 從而可以獲得 k 個訓練集/測試集的組合姿染;
  • 最終獲得k個測試結(jié)果的均值。

2)子集的劃分

  • 挑戰(zhàn):數(shù)據(jù)集 D 劃分為k個子集秒际,存在多種劃分方式悬赏;需要減少因樣本劃分不同而引入的差異。
  • 解決:隨機使用不同的劃分重復 p 次娄徊,最終獲得的結(jié)果是 p 次k折交叉驗證結(jié)果的均值闽颇。

3)特殊案例:留一法
樣本有m個,劃分子集數(shù) k=m寄锐,也就是說兵多,只保留一個樣本不訓練。

  • 優(yōu)勢:一般認為它評估的結(jié)果比較準確
  • 缺陷:樣本大時橄仆,需要訓練的模型太多剩膘。
7. 分析
  • 留出法:實際評估的模型使用的訓練集比數(shù)據(jù)集小,引入了因樣本規(guī)模不同而導致的偏差盆顾;
  • 留一法:計算復雜度高怠褐;
    動機:需要 ① 減少訓練樣本規(guī)模不同的影響;② 高效的進行實驗估計您宪;
8. 自助法

1)步驟

  • 首先奈懒,從初始數(shù)據(jù)集 D 中隨機挑選一個樣本拷貝放入D'奠涌。
  • 重復上述過程,m次筐赔,D' 中也包含 m 個元素铣猩;
  • D' 作為訓練數(shù)據(jù),D\D' 作為測試數(shù)據(jù)茴丰。

2)性能

  • D' 包含不重復的元素大約占 2/3达皿,D\D' 大約占1/3;
  • 別稱:包外估計贿肩;

3)特點

  • 長處:在數(shù)據(jù)集較小峦椰,難以有效劃分訓練集/測試集的情況下很有用;
    -分析:自助法產(chǎn)生的數(shù)據(jù)集改變了初始數(shù)據(jù)及的分布汰规,引入了額外的估計偏差汤功;
  • 短處:在數(shù)據(jù)量充足的情況下,留出法和交叉驗證法更加常用溜哮;
8. 調(diào)參與最終模型
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末滔金,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子茂嗓,更是在濱河造成了極大的恐慌餐茵,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件述吸,死亡現(xiàn)場離奇詭異忿族,居然都是意外死亡,警方通過查閱死者的電腦和手機蝌矛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進店門道批,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人入撒,你說我怎么就攤上這事隆豹。” “怎么了衅金?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵噪伊,是天一觀的道長。 經(jīng)常有香客問我氮唯,道長鉴吹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任惩琉,我火速辦了婚禮豆励,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己良蒸,他們只是感情好技扼,可當我...
    茶點故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著嫩痰,像睡著了一般剿吻。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上串纺,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天丽旅,我揣著相機與錄音,去河邊找鬼纺棺。 笑死榄笙,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的祷蝌。 我是一名探鬼主播茅撞,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼巨朦!你這毒婦竟也來了米丘?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤糊啡,失蹤者是張志新(化名)和其女友劉穎蠕蚜,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悔橄,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年腺毫,在試婚紗的時候發(fā)現(xiàn)自己被綠了癣疟。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,488評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡潮酒,死狀恐怖睛挚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情急黎,我是刑警寧澤扎狱,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站勃教,受9級特大地震影響淤击,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜故源,卻給世界環(huán)境...
    茶點故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一污抬、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦印机、人聲如沸矢腻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽多柑。三九已至,卻和暖如春楣责,著一層夾襖步出監(jiān)牢的瞬間竣灌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工腐魂, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留帐偎,地道東北人。 一個月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓蛔屹,卻偏偏與公主長得像削樊,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子兔毒,可洞房花燭夜當晚...
    茶點故事閱讀 45,500評論 2 359